網易首頁 > 網易號 > 正文申請入駐

一個開源平臺，編織起了Agent「互聯網」

2026-07-02 12:02:36　來源: 機器之心Pro

河北舉報

分享至

編輯｜杜偉

在歷史長河中，技術的發展很少是一路線性往前走的，很多關鍵變化發生在「連接」被打通的那一刻。

拿計算機來說，到了 20 世紀 60 年代，它們已經具備強大的計算能力，但大多還是各自封閉運行的系統。架構不同、接口不通，彼此之間很難真正連在一起。

直到 ARPANET（阿帕網）的出現，這種孤島的狀態才被打破。計算機第一次在真正意義上連在一起，開始共享信息、建立聯系。

如今，以龍蝦為代表的 Agent，正面臨半個多世紀前 IBM System/360 等大型機所遭遇的困境：單體能力已經足夠強，但系統仍是分散的。

從「單一 Agent」到「一張組織網絡」

過去很長時間，AI 行業把大部分精力都放在了相同的事上：把單個模型做得更強，把單個 Agent 打磨得更能干。這條路走到今天，其實已經接近一個階段性的拐點：在大多數實際工作場景里，Bot 助手的能力不再是主要問題。

作為單體 AI，它們足夠強大：IM（即時通信）交互、寫代碼、做調研、推進任務，都不在話下。真正卡住效率的，是彼此之間「接不上」。

Agent 被困在了各自的工作流中，由于運行在不同工具、上下文和權限體系里，各干各的，彼此看不見、調不動，也無法形成連續任務鏈條。它們可以各自完成一段工作，卻很難共同完成一件事情。

一個人 + 一個 AI 助手本質上仍然只是效率工具；只有當一群人和一群 AI 助手能夠在同一個體系中協同工作，才開始接近一種新的組織形態。

對于 Agent 來說，下一步除了變得更加聰明，還要找到屬于自己的「互聯網」，就像當年的計算機一樣。

在這樣的背景下，一個以人與 AI Agent 協作為基礎、面向企業組織場景的開源平臺 Octo 應運而生。該平臺由全球 Agentic AI 第一股明略科技打造，核心做一件事：將分散在各個工作流里的 Bot 聚合到同一協作空間。更重要的是，這種連接不只是個人維度的。

在 Octo 中，Bot 既是個人助手，在經過授權之后也能在組織成員之間共享和調用。Bot 大軍的自由流動，讓 Agent 的身份開始發生轉變：從個人工具蛻變為企業級資產和數字員工。

隨著 Bot 以組織形式部署、使用并沉淀，它們不再各自為戰，通過分工協作在任務之間流轉，在過程中收到持續的反饋與評價，并進行修正。

項目地址：https://github.com/Mininglamp-OSS

更進一步，在 Agent 等數字勞動力爆發的當下，明略科技想要將 Octo 平臺打造成為 Private AI 時代的組織基礎設施，構建人和 AI 協作的新范式。當企業開始擁有成百上千 Agent 時，Octo 可以像管理互聯網節點一樣實現它們之間、它們與創建者之間以及創建者與創建者之間的高效連接、通信與協作。每個 Agent 既各司其職，又相互協作，這種工作模式在大多數場景中優于單一巨型模型。

并且對普通用戶尤其友好的一點是，在 Octo 中，常見的工作場景被打包成現成的 Bot 模板，不用自己從頭配，「領養」就能直接拉進群里干活。在這里不用考慮繁瑣的裝蝦流程，易用性拉滿。

Agent，不應只「活」在對話框里

現在，大多數 Bot 助手都是掛在 Discord、Telegram、飛書、釘釘這些 IM 里，通過消息接收指令、執行任務。Octo 同樣是從 IM 形態切入，但它并不只是做一個更聰明的聊天工具，更在于重寫協作本身。在這里，IM 更像是入口，而不是核心。

Octo 的 IM 界面

人和 Agent 雖然在同一個 IM 界面溝通、下任務、接收結果。但真正發生變化的，是背后的連接結構。

在傳統工具里，人和 AI 往往是一對一的關系：你下指令，它完成任務，整個過程封閉在各自的工作流里。現在，Octo 把這層關系打破了，它想連接的是人、Bot、Runtime Agent 和工具這些原本分散的節點。

這也讓它看起來不只是多了一個聊天窗口。更關鍵的是，它在搭一套新的協作方式：任務由人發起，由 Bot 調用 Runtime Agent 完成執行。執行過程不斷被反饋，其他 Bot 接力，人在關鍵節點做判斷和取舍

更有意思的地方在于，在 Octo 的底層通信協議里，人和 Agent 從一開始就被設計為同等身份的消息主體。Bot 之間可以直接對話，互相補充：一只負責搜集信息，一只負責分析，一只負責糾錯，最后交給人來品鑒。這就是 A2A 協作真正發生的地方：不是人指揮 AI、AI 反饋人的單向循環，而是多個 Agent 之間形成了真實的任務接力。

人在這個過程里的角色也跟著變了。復雜任務可以整包交出去，Bot 負責拆解、調度、推進，并可以實時反饋進度，判斷是否需要人類或其他 Bot 介入、從哪里接手。人退到關鍵節點，做判斷和取舍，而不是盯著每一步。

當 Agent 從各自孤立的工作流里走出來，效率提升只是表層變化。更深的影響是，組織處理復雜任務的方式本身，開始被重新組織。

但連接只是第一步。把 Agent 拉到同一個空間里，只解決了「能不能看見彼此」的問題。真正進入企業場景后，更難的是另一件事：復雜任務往往不會在一次對話里結束。它會經歷需求澄清、資料補充、方案生成、多人反饋、反復修改和最終驗收。在這個過程中，信息、判斷都在變化。

因此，在 IM 之外，Octo 需要再往下沉一層：為每一件復雜任務建立穩定的承載單元，也就是接下來要講的 Matter（事項）

從「連接」到「干活」：將復雜任務拉進事項里

復雜、長程任務需要繼續回答一個問題：事情怎么干成、怎么干對、怎么留得下？這正是 Matter 要解決的。

在普通 IM 里，信息天然會被滾動消息淹沒。今天討論一個方案，明天又有新的消息刷屏。一周后想追溯當時為什么選 A、放棄 B，只能在聊天記錄里大海撈針。對復雜任務來說，這種信息形態遠遠不夠。

針對這種局限，Matter 把每個任務沉淀成一張可追溯的「決策卡」，不只記錄最終結果，還包括任務緣起（Brief）、過程時間線（Timeline）、關鍵產出、人的反饋和驗收結論。

一個事項從 Brief 開始，沿著 Timeline 展開，中間有產出、有打回、有補充、有確認，最后形成可以回看的組織記憶。

這對企業來說非常關鍵。在真實工作中，很多價值并不單單存在于最終文檔里。為什么選擇一個方案，哪些判斷來自業務負責人，哪些修改來自法務、銷售或技術同學，這些信息共同構成了組織的決策資產。以保存消息為主要目標的普通 IM 工具，難以承載這些資產，而Matter 要保存的是一件事如何被推進、修正和完成

除了可以把過程保存下來，Matter 更重要的價值在于，復雜任務里的每一次修改、打回和驗收，本身都帶著人的判斷。

一旦這類反饋進入到 Matter，它們便從一次性的溝通記錄轉變成了 Agent 學習組織偏好的原材料。Octo 所追求的 Taste，也正是在這個位置生長出來。

越用越懂你：在實戰中沉淀 Taste

Matter 解決了「事情如何留下來」，而 Taste 讓「Agent 越用越懂你」。

今天的很多 Agent 都有自己的配置文件、工具說明和角色設定，但它們的自我成長仍然有限。一個團隊喜歡什么樣的風格，什么樣的結論才算有洞察，這些偏好很難靠一次系統提示寫清楚。

很多時候，人類的判斷本來就是隱性的。舉一些例子，負責人說「這個感覺不對」，客戶說「這個角度不準」，這些反饋背后的經驗、品味和行業語境不一定馬上就能寫成一套規則。

因此，「偏好對齊必須在實戰中完成」，成為 Octo 塑造 Taste 所采取的思路

人的每一次打回、圈一筆、修改、確認，都可以成為 Bot 學習組織品味的素材。一次方案退回，可能是邏輯不夠收束；一次報告重寫，可能是結論缺少業務視角。這些信號在沉淀到 Matter 之后，它們就有機會被提煉成下一次可復用的偏好。

這個過程可以理解為：人把說不清的「我就要這個」逐漸沉淀為 Agent 可以理解、調用與繼承的偏好。下次遇到類似任務，相關偏好會自動進入上下文。這樣一來，Bot 會在一次次實戰中更接近團隊的做事方式，并理解公司的決策、交付模式。

當 Bot 擁有了差異化的偏好，多 Agent 協作的關鍵就變成了「如何讓它們在同一任務中合理分工」，避免被簡單地拉進同一個群聊里一起發言。

Octo 的六種協作模式，解決的正是這個問題。

六種協作模式，本質是六種信息拓撲

多個 Agent 一起協作，并不等于「多叫幾個 Bot 進群」。

更細化的問題決定了執行效果，比如信息怎么傳？誰負責生成，誰負責驗證？哪些任務需要獨立視角，哪些任務需要公開討論？哪些步驟必須按順序進行，哪些任務可以分頭推進？

面對不同層次的需求，Octo 將復雜協作拆成了六種模式：

Solo 是單干模式，適合簡單明確的任務，由領隊獨自完成。

Roundtable 是圓桌討論，在領隊主持下，多個 Agent 圍繞同一議題展開公開討論，參與者互相可見，適合需要形成共識、碰撞觀點、收束結論的任務。

Critic 是生成 — 驗證模式，其中一個 Agent 負責生成，另一個 Agent 負責審核，生成方和驗證方必須不同。驗證方有否決權，發現問題可以打回重做。該模式適合需要獨立審查的場景，比如代碼檢查、事實核查、方案質檢。

Pipeline 是流水線模式，從 A 到 B 到 C 嚴格串行，每一步的產出作為下一步的輸入。它適合存在明確順序依賴的任務，比如先調研，再分析，再寫作，再校對。

Split 是分頭干模式，領隊把任務拆成互不可見的子塊，由多個 Agent 各自處理，最后再由領隊合并。它適合大任務分治，比如一個行業報告拆成政策、市場、技術、案例幾個部分。

Swarm 是撒網競選模式，同一個任務交給多個 Agent 獨立完成，參與者彼此互盲，最后由領隊擇優。它適合需要多解并行、避免從眾的場景，比如標題、方案創意、產品命名、不同分析路徑。

整體看下來，Octo 多協作模型不僅是把 Bot 拉到同一個地方，還規定了信息流轉的方式：不同任務匹配不同拓撲，系統保證信息沿正確路徑流動

相較之下，飛書或 Slack 群聊里的 AI 可以讓所有人看到所有消息，但復雜任務經常需要更細的隔離。群聊擅長「都看見」，卻很難做到「該互見時互見，該互盲時互盲」。

換句話說，Octo 對協作的理解已經超出了「多人聊天」這一層。在真實組織里，協作包括了空間劃分、權限邊界、上下文繼承、過程追蹤、任務拆解、反饋沉淀和最終驗收。人類過去依賴項目管理系統、知識庫、IM、文檔和會議來完成這些工作，Agent 加入之后，這套協作骨架也隨之改變。

拆開來看，Octo 在做四件事

從產品形態看，Octo 正讓 Agent 像組織成員一樣進入工作流：用 IM 承載交互，用空間、分組、頻道、子區搭建協作結構，用語音提升輸入效率，用瀏覽器插件接入外部工具，再用 group.md 約束協作方式

先看結構層，空間（Space）、分類（Category）、頻道（Channel）和話題（Thread）將協作關系組織得很清楚。

在 Octo 里，一項任務通常是在某個空間里被提出，可能是一個簡單的問題，也可能是一段更完整的描述。無論形式如何，這條信息一出現，就帶著明確的上下文：屬于哪個空間（面向目標的工作區），在哪個頻道（可以理解為群聊），話題是什么（可以理解為群聊子區）。

和普通聊天不一樣，新消息不會很快被沖掉，自然地落在某個頻道或話題里，變成一件可以一直跟進、隨時回溯的事情。

Octo 協作關系展示

接下來是入口層。在 IM 界面，私聊和語音讓我們進入這套系統的方式變得更簡單。

通過人與人、人與分身的一對一對話通道，私聊可以讓人與 Agent 在同一個上下文中溝通、分工、反饋，不需要額外學習新的交互方式，就能把任務放進去、再把結果拿出來。

但當協作變復雜，問題可能會出現在輸入這一端。很多時候不是 Agent 做不出來，反而是人來不及把需求講清楚。輸入慢，導致整個流程就跟著慢下來。引入語音之后，信息可以更快進入系統，任務描述、上下文補充和決策反饋都更順手。

然而Octo 內置的語音輸入不只是將聲音轉成文字，它同樣也是一個持續進化和學習的系統。它會結合當前對話的上下文，對轉寫的內容進行修正和梳理，一方面提高準確率，另一方面讓表達更清晰、更有邏輯。同時，對于團隊中的人名、公司名或者行業專有名詞，出現頻率越高它認得越準。

另外，你還可以語音 @他人、修改已有內容甚至刪掉前面的輸入。在這里語音接近一種可以參與操作的交互方式。從能力上來看，這套機制與市面上一些語音驅動操作的產品相似，但它是直接嵌在整個協作流程里，隨著任務一起向前推進。

語音輸入

環境接入層則更像是一個「上下文橋接器」。這一層并不是用來取代工具的，把已有工具接進來是它的主要任務。

通過內置的瀏覽器插件，用戶可以通過「Cmd + K」把外部工具無縫接入進來。無論是在網頁、文檔還是代碼平臺上，只要選中一段內容，當前頁面的鏈接、標題和選中文本就會自動被帶入上下文。

在將這些信息一鍵發送給 Bot 或者在當前對話引用后，它們立即接手并知道你在處理什么問題、處在什么環境。它不需要把你從現有工具流中「拉走」，在旁參與協作即可。

瀏覽器插件

真正的分水嶺出現在后面這一步。在大多數團隊里，難的不只是把事情做完，讓 AI「行為可控」同樣至關重要。

GROUP.md 的作用正體現在這里。它相當于一份專門設給 Bot 看的「行為準則」，明確了一個群聊的定位、協作模式和行為邊界。每一次對話、每一條任務指令，所有參與進來的 Bot 都會在遵守 GROUP.md 規則的前提下執行，確保討論高效且有序。并且當切換到另一套 GROUP.md 時，同一只 Bot 馬上調整工作模式，「進什么廟，念什么經」，絕不逾矩。

此外，Octo 還強調多端補全：Web、移動端、瀏覽器插件、CLI 共同構成入口。尤其是 CLI，它連接端側環境和私有化部署敘事，讓本地模型、本地文件、本地運行環境進入協作體系。

O.C.T.O.：四個維度，缺一不可

至此，Octo 的產品能力就比較清晰了，它們分別對應名字背后的四個維度：Open、Context、Taste 與 Orchestration。

O 是「Open」，代表開放生態。不同 Runtime 的 Agent，包括 OpenClaw、Codex、Claude Code、Cursor 等，都能夠以 Bot 身份接入，獲得統一身份。

C 是「Context」，代表共享上下文。IM 中的討論收斂為結構化知識，項目上下文在不同 Agent 之間共享，任務過程也可以被持續追溯。

T 是「Taste」，代表偏好進化。實戰反饋沉淀為偏好，每個 Agent 背后主人的品味和判斷方式被結構化留存與調用。

O 是「Orchestration」，代表多 Agent 編排。六種協作模式對應六種信息拓撲，不同 Bot 帶著不同偏好參與同一任務，合力完成復雜工作。

這四個維度連在一起，構成了 Octo 所提供的完整能力。承載起 Context、Taste、Orchestration 的共同基座正是 Matter，它成為復雜任務得以被理解、反饋、校準和編排的核心容器。

沒有 Matter，Context 會散落在聊天記錄里，Taste 會缺少來自真實任務的反饋來源，多 Agent 編排也很難留下可追溯的過程和結果。

Octo 想要把一次次協作轉化為組織資產，就必須先讓每一件事有穩定的結構、完整的過程以及可以沉淀的判斷。從這個視角來看，Octo 想爭奪的是企業在 Agent 時代最關鍵的一類資產：自己的上下文、判斷標準以及做事方法。

像 Octo 這樣的嘗試，補上的不只是把 Agent 連在一起的能力，也在悄悄改變組織內部知識流動和協作的方式。

但這并沒有走向另一種極端。人不可替代的部分，包括 Taste、暗默知識、判斷力依然留在個體身上，只是通過協作過程得到進一步彰顯和傳遞，也就是說「能力可以共享，但判斷不會被抹平。」

這也帶出了一個更根本的問題：在 AI 時代，企業真正的長期競爭力究竟來自哪里？

當模型能力快速趨同，長期競爭力更多來自企業自己的 Context、Taste 和 Skill。這些東西無法被復制，也不應該流失，它們才是組織在 AI 協作中真正的「護城河」。

正因如此，當 Agent 真正進入組織運轉，數據主權問題變得無法回避：這些上下文、判斷信號與執行記錄，究竟歸誰所有、留在哪里、由誰控制？Octo 給出的答案很直接，走私有化路徑，通過開源開放支持本地部署

在實現上，Octo 以 CLI 接入的方式將端側模型與本地環境接入進來；工作流中產生的上下文、決策過程與執行結果同樣留在端側，沉淀為組織可以掌控的資產。這意味著，包括聊天數據、協作產出、Bot 記憶在內，每條對話、每行代碼都保留在你的環境中，完全跑在自己的服務器上。所有這些都將成為企業獨享的 AI 資產。

在 Octo 的產品哲學中，「Context」與「Taste」是兩大核心：前者是 AI 理解任務的土壤，后者是持續校準方向的羅盤。Octo 并非將人的隱性能力蒸餾為平臺資產，它是在尊重數據邊界的前提下，讓這些能力得到放大、記錄與傳承。

這與明略科技長期堅持的可信 AI 方向高度一致。明略科技持續構建面向端側智能、私有化部署與人機協作的新一代 AI 基礎設施：能力可以流動，但數據不外流；協作可以展開，但控制權留在組織內部。

對企業，Private AI 不只是本地化部署，更是數據主權、知識主權與協作主權的真正回歸。對個人，真正被放大的價值是 Taste—— 我品故我在：當 AI 逐步接管了思考，人的判斷力、鑒賞力與創造力不會被取代，反而成為存在的意義本身。

支撐這一切的底座是 Trustworthy AI：開源、白盒、可審計。只有當 AI 的能力來源、運行過程和協作邊界足夠透明，人才放心將「思」交給它們，把「品」留在自己手里。

Octo 的探索還在早期，但輪廓已經清晰：當 Agent 更深入地嵌入分工體系，真正決定效率的是那些無法被標準化、也不應該被外流的東西 —— 組織自己的上下文和人自己的判斷。

文中視頻鏈接：https://mp.weixin.qq.com/s/rB51LZBmrUNTPDAjw017qA

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.