管理層每月最頭疼的事是什么?不是定KPI,是讀完幾十份開發(fā)月報后,手工挑出"修復了登錄bug""發(fā)布v1.2版本"這些有效信息。我們團隊就這么干了兩年,直到發(fā)現(xiàn)三個致命問題。
第一,格式混亂。有人寫"JIRA-2047:修復支付超時",有人就寫"調(diào)了下"。三個月后連本人都忘了"調(diào)了下"是什么。第二,重復勞動。跨月的任務(wù)被反復登記,同一段重構(gòu)代碼能在三個月報里出現(xiàn)三次。第三,也是最要命的——我們試過把整月報告丟給ChatGPT整理,效果還行,但等于把全部項目動態(tài)交給了外部服務(wù)器。
![]()
對金融、醫(yī)療這類企業(yè),這是紅線。于是我們造了個完全本地運行的AI代理,只用CPU就能搞定。
架構(gòu)很簡單:Ollama跑Gemma 4 E2B模型負責理解文本,nomic-embed-text生成向量做去重,Jira API補全任務(wù)描述。定時任務(wù)觸發(fā)后,原始報告進去,結(jié)構(gòu)化工作清單出來。沒有GPU,沒有云調(diào)用,數(shù)據(jù)不出內(nèi)網(wǎng)。
關(guān)鍵設(shè)計在"降噪"。開發(fā)報告里大量內(nèi)容不是有效工作:會議記錄、學習筆記、待辦事項。我們用多輪提示詞讓模型先識別、再過濾、最后合并同類項。嵌入模型則把歷史任務(wù)向量化,新報告進來先算相似度,重復內(nèi)容自動合并。
效果?原本需要數(shù)小時的手工整理,現(xiàn)在幾分鐘跑完。更重要的是,敏感項目信息始終留在自有服務(wù)器。對于想用上AI又不敢碰云服務(wù)的團隊,這套CPU-only方案證明了一件事:隱私和效率可以兼得,只要你愿意把模型縮到合適的大小。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.