金磊 發自 凹非寺
量子位 | 公眾號 QbitAI
這一次,聯網的不再是電腦,而是一群會干活的Agent。
![]()
它們為什么需要聯網?
因為以前我們用AI,更像是在各自開單機,Claude Code寫代碼,Codex跑任務,另一個Agent做調研,再來一個Agent改文檔。每個都挺能干,但大多數時候,它們各干各的。
那么問題來了:
當一個人只有一個Agent,這叫效率工具;當一個公司里開始出現十個、一百個、甚至更多 Agent,事情就沒那么簡單了。
這時候它們就需要一張網,能分工,能溝通,能交接,能驗收,還能把每一次協作里的經驗沉淀下來。
而這也正是明略科技這次開源發布Octo的切入點。
像下面的例子中,你只需要給一個Agent下達任務,它就會自動帶著其它Agent一起協作干活:
![]()
簡單來說,Octo想做的是一個開源可信的Agent協作網絡,也就是讓人、Agent和外部工具一起進入同一套協作系統:
- Open,是開放和可自部署;
- Context,是讓工作上下文在協作中流動;
- Taste,是把人的判斷、偏好和品味留下來;
- Orchestration,是把人、Agent 和工具編排到同一層協作里。
一言蔽之,就是Agents do. Humans decide.
這句話背后,其實藏著AI應用下一階段的一個關鍵變化。AI不再只是在聊天框里回答問題,它開始進入組織流程,成為可以被分工、被管理、被驗收的數字勞動力。
三個核心概念:Agent需要一個真正的工位
Octo要做的第一件事,就是給Agent一個可以進入組織協作的工位。
這里面有三個核心概念,Bot、Channel/Thread、Matter。
先看Bot。
在Octo里,Agent不是一個臨時調用的功能按鈕,它會以Bot身份進入團隊,有身份、有名片、有能力說明,也有工作記錄。
一個寫代碼強的Bot,可能文檔能力一般;另一個做調研扎實的Bot,可能更適合寫行業報告。如果所有Agent都只是聊天框里的一個入口,組織就很難知道誰擅長什么、誰做過什么、誰的產出更可靠。
Bot解決的就是這個問題。
它讓Agent從工具入口變成了數字同事。每個Bot有自己的AgentCard,有歸屬、有能力邊界,也有工作履歷。你可以把OpenClaw、Hermes、Codex、Claude Code、WorkBuddy等主流Agent工具接進來,讓它們以Bot身份在同一個系統里被統一管理。
![]()
視頻地址:
https://mp.weixin.qq.com/s/dXFJfseigkhtWGTH0Gp7pA
接下來是Channel和Thread。
Channel可以理解成項目群或工作頻道。人和Bot在同一個頻道里對齊意圖、討論方案、派發任務、看進展。
但它和普通群聊的差別在于,Agent并不只是被@出來回一句話。
它可以接收上下文,參與討論,繼續推進任務。Channel解決的是“在哪里協作”的問題。
Thread則是一件具體的事。
比如一個產品發布項目里,可能同時有傳播方案、技術稿、官網文案、客戶案例、FAQ等多個討論。如果所有消息都堆在一個群里,很快就會被沖散。Thread的價值,就是把一件事的來龍去脈、討論過程和最終結論留在同一個地方。
最后是Matter。
它要解決的是“怎么把聊天變成行動,怎么把行動變成交付”。
很多人用AI工具時都有過類似體驗。聊的時候很順,感覺AI已經理解了;但聊完之后,東西仍然散在對話框里。你還要自己復制、整理、建任務、催進度、看產出。
Matter的思路是,當討論中出現需要跟進的工作,Agent可以自動總結要點,由人確認后創建成事項。
這個事項里有負責人,有交付物,有驗收標準,也有從Brief、過程討論、產出、反饋到驗收結論的完整記錄。
換句話說,AI干的活終于有了交付現場。
它不再只給你一段回答,還會把工作推進到可追蹤、可復盤、可驗收的狀態。
六種協作模式:多Agent協作,不只是拉個群
現在一說多Agent,很多人腦子里會浮現一個畫面。
拉個群,把幾個Agent丟進去,然后讓它們互相討論。雖然這確實也是協作的一種,但遠遠不夠。
真實工作里的協作很復雜,有些任務需要大家公開討論,有些任務需要獨立完成,避免互相影響;有些任務要先做再審,有些任務要按流水線交接;還有些任務,干脆讓多個方案一起跑,最后挑一個最好用的。
而Octo這次直接給出了六種協作模式。
第一種,Solo,單人完成。
一個Bot自己完成任務,適合邊界清楚、目標明確的小任務。比如改一段文案、整理一份紀要、補一段代碼注釋。
第二種,Roundtable,圓桌討論。
多個Bot圍繞同一個問題公開討論,互相看得到觀點。它適合頭腦風暴、多角度分析、選題討論、策略判斷。比如做一個產品發布選題,可以讓技術向Bot、用戶向Bot、商業向Bot分別給判斷,再由Leader收束。
第三種,Critic,獨立審核。
一個Bot做,另一個Bot審。審核方可以打回重做。它適合那些對質量敏感的工作,比如代碼審查、事實核查、方案挑錯、合同風險提示。
這個模式的關鍵在于“做”和“審”分開。畢竟現實公司里,我們也不會讓同一個人既寫稿又終審。AI協作進入真實工作后,也要有類似的制衡機制。
第四種,Pipeline,流水線。
A做完交給B,B做完交給C。每一步的產出都是下一步的輸入。它適合有明確先后順序的多步任務,比如先調研,再分析,再寫報告,再潤色成對外稿件。
第五種,Split,分頭干。
把大任務拆成幾塊,不同Bot并行處理,最后由Leader合并。它適合資料量大、模塊相對獨立的任務。
比如做一個行業研究,可以讓一個Bot負責國外公司,一個Bot負責國內公司,一個Bot負責技術路線,最后統一匯總。
第六種,Swarm,競選擇優。
同一個題目發給多個Bot,各自獨立完成,再選出表現更好的方案。它適合創意型任務,比如標題、視覺概念、活動策劃、產品命名。
我們可以從下面這個四個Agent在一個群聊里,從找bug到上線產品的例子中,感受一下全程無人干預的情況下,Agent們的協作方式:
![]()
視頻地址:
https://mp.weixin.qq.com/s/dXFJfseigkhtWGTH0Gp7pA
這六種模式合在一起,說明Octo想解決的不是讓Agent聊天這么簡單。
它真正處理的是組織協作里的結構問題。誰能看到什么信息,誰負責哪一步,誰來審核,誰來合并,什么情況下需要人拍板。
在以前,這些規則主要靠人來維持。到了Agent越來越多的時代,協作系統本身就要把規則寫進去。
這也是Octo和傳統IM工具的差異。
飛書、Slack、釘釘這樣的工具,主要為人和人設計。它們擅長消息溝通、會議協同、文檔流轉。但當Agent也變成工作主體,系統就需要額外處理AI身份管理、AI任務追蹤、AI協作模式這些新問題。
舊工具當然可以加AI能力,但如果Agent數量持續增加,只在聊天框旁邊掛一個AI入口,遲早會不夠用。
四個端:讓OCTO出現在工作發生的地方
一個協作平臺想真正被用起來,光有理念不行。它得進入人的日常工作場景。
Octo在產品形態上覆蓋Web App、移動端(iOS/Android)、瀏覽器插件與CLI幾個入口。人在哪里工作,Agent就應該在哪里出現。
Web App更像完整的協作工作臺。
Channel、Matter、Bot工作記錄、項目進展,都可以在這里集中管理。適合推進復雜項目,也適合管理多個Bot組成的數字團隊。
移動端解決的是反饋和驗收。
很多AI任務不一定需要你全程盯著,但關鍵節點需要你拍板。比如Bot交回一個階段成果,你在手機上看一眼,覺得可以就通過,不行就打回補充。這類輕量判斷,很適合在移動端完成。
而瀏覽器插件的價值不是讓你把飛書文檔、GitHub Issue、網頁報告都搬進Octo。它要做的是在你已經工作的頁面旁邊,直接呼出Agent,并把當前頁面上下文帶進去。
比如你正在看一篇行業報告,選中一段內容,讓Bot幫你總結、翻譯、改寫;你正在看GitHub Issue,讓Bot基于當前問題拆解修復思路;你在文檔里卡住了,可以直接呼出Bot幫你續寫一版。
![]()
視頻地址:
https://mp.weixin.qq.com/s/dXFJfseigkhtWGTH0Gp7pA
這件事的好處就是工作流不被打斷。
AI工具過去常常要求用戶切換窗口、復制上下文、重新描述任務。瀏覽器插件把這一步縮短了。你在哪兒工作,Agent就在哪兒待命。
CLI則主要面向開發者和Agent原生操作。
對開發者來說,很多任務本來就發生在終端里。通過CLI,Agent任務可以和命令行工作流接起來,尤其適合代碼、自動化、運行環境相關的場景。
所以Octo的產品思路,不是讓組織把現有系統全部推倒重來。它更像在文檔、代碼平臺、項目管理工具、瀏覽器頁面和終端之間,加了一層人和Agent共同協作的連接層。
這也解釋了為什么它要強調開源和私有化部署。
對于企業來說,真正有價值的AI資產,往往不是某一次回答本身,而是回答背后的業務上下文、協作記錄、偏好判斷和工作方法。
這些東西如果沉淀在第三方平臺里,企業很難真正掌握;如果能沉淀在自己的環境里,就可能變成長期資產。
協作方式,在Agent時代被重構
Octo背后還有一個更大的判斷。
AI時代被重構的,不只是單個工具,還有協作方式。過去的組織協作,主要發生在人與人之間。未來很可能同時發生在人與人、人與Agent、Agent與Agent之間。
這會帶來一個很現實的問題,也就是人到底該站在哪里?
如果把AI當成一個更聰明的搜索框,人依然要自己拆任務、組織過程、檢查結果。AI只是更快給答案。
但如果把Agent當成數字勞動力,人的角色就會發生變化。
人不一定要親自做每一步執行,卻必須在關鍵節點給方向、定標準、做判斷、看結果。
這就是“Agents do. Humans decide.”這句話的意思。
Agent負責思考、分析、生成、執行、調度;人負責判斷什么是對的,什么是好的,什么是符合業務取舍的。
你發起任務,Bot推進執行;Bot交回階段成果,你驗收;不滿意,打回;滿意,通過;你的每一次批注、打回、偏好選擇,都會繼續影響Bot下一次干活。
這就形成了一個飛輪:派發任務,驗收反饋,沉淀偏好與技能,下次更高效。在Octo里,每次協作會沉淀三類資產。
- Context,上下文。包括項目背景、歷史決策、討論記錄。新成員或新Bot加入時,不用從零對齊。
- Taste,偏好。每次驗收、打回、批注、風格選擇,都在記錄你和團隊到底喜歡什么、認可什么、排斥什么。
- Skill,技能。比如寫代碼用什么規范,做報告按什么結構,復盤用什么模板。這些做事方法可以在組織內部復用。
這也是我們剛才提到的O.C.T.O.四個字母的含義,即Open、Context、Taste和Orchestration。
這四個維度串起來,Octo想做的就不只是一個AI辦公工具。它更像PrivateAI時代的一層組織基礎設施。
因為當AI開始真正參與工作,企業關心的也不只是“這個模型聰不聰明”。更關鍵的是,我的數據在哪里?我的協作經驗能不能沉淀?我的組織風格會不會隨著模型更換而丟失?我的Agent能不能越用越懂業務?
從這個角度看,Octo開源的意義,也不只在于讓開發者多了一個項目可以試。
它代表了一個趨勢,AI應用正在從“個人效率工具”往“組織協作網絡”遷移。
一個強Agent,可以幫一個人提高效率。一群Agent能在同一套規則下協作,才可能改變一個組織的工作方式。
互聯網讓計算機彼此連接,才真正釋放出網絡效應。
到了Agent時代,類似的問題又出現了。當每個人、每個團隊、每個業務流程里都有Agent,誰來把它們連接起來?
Octo給出的答案,是先把Agent放進組織協作里。
讓它們有身份,有工位,有任務,有驗收,有記錄,也有逐步積累下來的偏好和技能。
說到底,Agent真正進入公司,不是因為它能在聊天框里多說幾句漂亮話。
而是因為它可以把活接下來,把事往前推,把結果交回來,并且在一次次反饋里越來越懂這個組織。
當Agent不再單打獨斗,AI才真的有機會從助手變成同事。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.