有個開發者干了件挺有意思的事。他從小喜歡《鋼鐵俠》里的賈維斯,但過去覺得那只是個幻想。現在不同了——Hermes模型成了他項目的大腦,Kokoro模型負責發聲,他把這個私人AI助手叫做Cipher。
最讓他震撼的不是代碼跑通的那一刻。而是第一次聽到Cipher真正開口說話。“我從來沒聽到過我的AI代理正式跟我對話”,他說這是整個項目最大的收獲——學會了怎么把Whisper語音識別和Kokoro語音服務器配進Hermes。
![]()
Cipher已經融入他的日常生活。他可以在本地電腦上啟動它,也能通過加密隧道遠程連接。工作鏈路很清晰:Whisper處理語音輸入,Hermes作為核心大腦理解并響應,Kokoro負責把回復轉成聲音。不過他還得耐心一點,因為這個小語言模型生成語音需要幾秒鐘反應時間。
讓他覺得最妙的地方是什么?Hermes能幫你把整套環境搭起來。只要給對提示詞和倉庫地址,這個模型自己就能走通安裝流程。他找到Jarvis項目的開源倉庫,讓Hermes把代碼整合進一個基于React Vite的前端界面,系統里已經內置了語音服務器的接口,接入Kokoro并不復雜。
但他也踩過坑。調試過程中他提醒大家:“別啟動一堆空進程,不然你會掉進僵尸進程的墓地。”他發了個截圖展示當時進程管理出問題的場景,用了個笑哭的表情。
為了證明這東西真能跑,他錄了一段視頻演示。視頻里Cipher在開發社區正式亮相,跟所有人打了招呼。
他給Cipher規劃了一個會持續進化的未來。Hermes的記憶能力是整個項目的根基,接下來要加一個“心跳”機制——Cipher會主動確認他是不是在線,每天匯報更新內容,還會告訴他AI找到了哪些自我優化的新方法。最終形態是把Cipher變成一個本地桌面AI,原生運行在他自己的電腦上,像真正的賈維斯一樣隨時待命。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.