Karpathy 分享了他如何構建本地的 AI 知識庫,跟我用的方法也很相似。
都是用的 Obsidian,純本地 MD,然后用一些反向鏈接、索引的方式把它們連起來。
他構建了一個用大語言模型驅動的個人 Wiki 知識庫,然后把原始資料都丟進一個叫 RAW 的目錄。
然后讓大語言模型把這些原始資料編譯成一個 Markdown Wiki,實現以下功能:自動創建摘要、創建索引、創建概念條目、添加相互鏈接、生成可視化等等。
我是在內容收集的時候就已經做好了,用的是 Obsidian 的那個剪藏插件。
在收集內容的時候,AI 就會自動進行以下處理:打標簽、自動總結、翻譯、創建摘要,目前就是還沒有反向鏈接。
然后它的 Wiki 構建好以后,就可以在這個 Wiki 上提問,確保數據來源的可置信度。
比如說大語言模型會自己查索引、讀相關的文檔,寫出回答或者報告,不只是在網頁上搜。這樣的話,它獲取的信息基本上都是跟你相關的。
然后它的輸出也盡量不是一句話,而是新的文件、新的可視化網頁或者是 PPT,然后再回歸到知識庫里,讓知識庫越用越厚。
但這個會造成一個問題,就是 Obsidian 的作者也說了,這會污染知識庫。所以最好把可靠性來源和 AI 生成的東西分開放。
還有一個比較好的點是,它會讓大模型對 Wiki 做健康度檢查。比如:找一些自相矛盾的地方、補發一些缺失的信息、發現一些新的關聯、提高一致性。
其實現在很多人都是這樣做的,我也把這套理念放到了 CodePilot 里。
關于助理文件夾的選擇,我一般建議使用 Obsidian 文件夾。
如果你有自己的 Obsidian 文件夾,進去以后 AI 就會直接獲取你所有的上下文和知識。
這樣一來,你直接就能獲得一個擁有完整記憶的 AI 助理。
如果你不知道怎么實踐的話,推薦用 Codepilot 的助理試試。
把你的 Obsidian 文件夾放進去,讓它幫你整理,同時讓它把這些原則寫到 Claude.md 里面。
詳情:x.com/op7418/status/2039898050697839041
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.