无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

超越單體智能|多智能體系統(tǒng)的協(xié)作、歸因與自我演化綜述機器之心2026年5月30日 12:06 四川 9人

0
分享至


來源:機器之心

本文由西安交通大學(xué) MOE KLINNS Lab 聯(lián)合華中師范大學(xué)、聯(lián)想人工智能技術(shù)中心、悉尼大學(xué)等機構(gòu)的研究者共同完成。共同第一作者為齊世豪、馬杰、邢瑞、郭威、黃瀟,通訊作者為來自西安交通大學(xué)網(wǎng)絡(luò)空間安全學(xué)院的馬杰特聘研究員(副教授)。

過去兩年,AI 智能體正在從「會對話的模型」變成能夠理解任務(wù)、拆解步驟、調(diào)用工具、維護記憶并根據(jù)反饋調(diào)整行為的系統(tǒng)。當(dāng)任務(wù)復(fù)雜到單個智能體難以完成時,研究者開始把多個智能體組織起來,讓它們分工協(xié)作。 但系統(tǒng)規(guī)模擴大后,問題也隨之復(fù)雜。

任務(wù)失敗時,錯誤可能來自智能體能力、角色分配、通信過程、工具調(diào)用,也可能在多輪交互中被逐步放大。更進一步,系統(tǒng)能否根據(jù)失敗經(jīng)驗調(diào)整角色、通信結(jié)構(gòu)或協(xié)作流程,仍是當(dāng)前研究面臨的重要問題。

圍繞這些問題,研究團隊撰寫了一篇系統(tǒng)綜述,面向 LLM 多智能體系統(tǒng)提供了一個完整的觀察框架:從單個智能體的能力基礎(chǔ),到多智能體協(xié)作,再到系統(tǒng)失敗后的歸因,以及基于失敗經(jīng)驗的自我演化。


  • 論文標(biāo)題:Beyond Individual Intelligence: Surveying Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems

  • 論文鏈接: https://arxiv.org/abs/2605.14892

  • 項目倉庫: https://github.com/mira-ai-lab/awesome-mas-life


圖 1:LIFE 框架總覽圖

一、多智能體系統(tǒng),不只是「多幾個 Agent」

今天的 LLM 智能體,已經(jīng)不再是簡單的輸入輸出模塊。圍繞大語言模型,研究者加入了推理、記憶、規(guī)劃、工具使用等機制,使其能夠理解任務(wù)、制定計劃、調(diào)用外部工具,并根據(jù)執(zhí)行結(jié)果調(diào)整后續(xù)動作。這些能力構(gòu)成了多智能體系統(tǒng)的基礎(chǔ)。推理能力決定智能體能否處理復(fù)雜指令,記憶能力決定它能否利用歷史信息,規(guī)劃能力決定它能否拆解長程任務(wù),工具使用能力則決定它能否突破模型自身的知識和執(zhí)行邊界。

如果缺少穩(wěn)定的單體能力,多智能體協(xié)作很容易變成多個不穩(wěn)定模塊的疊加。協(xié)作并不會自動帶來更強的智能,反而可能放大錯誤、增加溝通成本,并讓系統(tǒng)表現(xiàn)更難預(yù)測。


圖 2:LLM-based Agent 的能力模塊示意圖

二、協(xié)作:讓智能體從個體走向組織

多智能體系統(tǒng)的核心首先是協(xié)作

在現(xiàn)有研究中,協(xié)作機制通常圍繞角色、通信、調(diào)度和交互模式展開。角色決定不同智能體的職責(zé),通信決定信息如何在智能體之間流動,調(diào)度決定任務(wù)如何推進,交互模式則與具體任務(wù)密切相關(guān)。代碼生成、科學(xué)發(fā)現(xiàn)、網(wǎng)頁操作、復(fù)雜問答、游戲環(huán)境,對協(xié)作方式的要求并不相同,很難依靠一種固定流程覆蓋所有場景。

這些設(shè)計讓智能體從「單點能力」進入「組織能力」。它們不再只是各自輸出答案,而是通過分工、溝通和調(diào)度共同完成更復(fù)雜的目標(biāo)。與此同時,協(xié)作也會放大系統(tǒng)的不確定性。一個早期判斷可能影響后續(xù)分工,一次不完整的信息傳遞可能改變整個任務(wù)路徑,一個工具調(diào)用錯誤也可能被后續(xù)智能體繼續(xù)引用。多智能體系統(tǒng)越像一個組織,就越需要理解組織內(nèi)部的問題從何而來。


圖 3:多智能體協(xié)作中的角色、通信與調(diào)度結(jié)構(gòu)

三、歸因:理解失敗,而不只是記錄失敗

在單智能體系統(tǒng)中,失敗往往可以回到一個相對清晰的輸入輸出過程里分析。但在多智能體系統(tǒng)中,失敗很少只來自一個孤立步驟。一個早期錯誤判斷可能影響后續(xù)任務(wù)分解,一次不準(zhǔn)確的工具調(diào)用也可能被后續(xù)智能體當(dāng)成可靠證據(jù)繼續(xù)使用。

因此,多智能體系統(tǒng)需要的不只是最終評測分?jǐn)?shù),還需要對失敗過程的分析。故障歸因要追問的是:失敗發(fā)生在哪個階段?涉及哪些智能體?錯誤來自能力不足、角色設(shè)計、通信機制、調(diào)度策略,還是環(huán)境交互?錯誤又是如何在系統(tǒng)內(nèi)部傳播的?

現(xiàn)有很多研究更關(guān)注如何構(gòu)造協(xié)作流程、如何提高最終性能,卻較少討論系統(tǒng)失敗之后如何診斷。但如果沒有歸因,多智能體系統(tǒng)的改進就很容易變成盲目試錯。系統(tǒng)表現(xiàn)不好,并不直接說明應(yīng)該改模型、改提示詞、改角色分工、改通信協(xié)議,還是改整個組織結(jié)構(gòu)。在這篇綜述中,歸因被放在協(xié)作與演化之間,作用是把系統(tǒng)失敗轉(zhuǎn)化為可診斷、可修復(fù)的問題。


圖 4:多智能體系統(tǒng)中的錯誤傳播與故障歸因示意圖

四、自我演化:從修正輸出,到改進系統(tǒng)

如果歸因關(guān)注「哪里出了問題」,自我演化關(guān)注的則是「系統(tǒng)如何因此變得更好」。很多智能體系統(tǒng)已經(jīng)引入了反思機制:模型總結(jié)失敗原因,修改下一輪回答,或者調(diào)整提示詞。這類方法有價值,但對于多智能體系統(tǒng)來說還不夠。

因為多智能體系統(tǒng)的改進對象不只是某個智能體的輸出,也可能是整個系統(tǒng)結(jié)構(gòu)。

  • Agentic Self-Evolution:面向單個智能體自身的演化,主要更新提示詞、記憶或參數(shù)等內(nèi)部組件,讓智能體在后續(xù)任務(wù)中表現(xiàn)得更穩(wěn)定。

  • Systemic Self-Evolution:面向多智能體系統(tǒng)內(nèi)部結(jié)構(gòu)的演化,關(guān)注通信拓撲、智能體組合、共享記憶等系統(tǒng)級組件,讓多個智能體之間的協(xié)作方式能夠隨任務(wù)和反饋調(diào)整。

  • Meta Self-Evolution:面向系統(tǒng)設(shè)計空間的演化,通過積累歷史設(shè)計經(jīng)驗或訓(xùn)練生成器,自動產(chǎn)生更適合不同任務(wù)的多智能體架構(gòu)。

這意味著,多智能體系統(tǒng)的自我演化并不只是「讓模型反思」一下。它更接近一種系統(tǒng)級調(diào)整:根據(jù)任務(wù)表現(xiàn)和失敗反饋,持續(xù)修改自身的行為、結(jié)構(gòu)和協(xié)作方式。


圖 5:從失敗歸因到系統(tǒng)自我演化的閉環(huán)

五、LIFE 框架:理解多智能體系統(tǒng)的完整生命周期

這篇綜述提出的 LIFE progression,可以理解為對 LLM 多智能體系統(tǒng)運行過程的一種梳理。它包含四個連續(xù)階段:

  • Individual Intelligence:個體智能,關(guān)注單個智能體的推理、記憶、規(guī)劃和工具使用能力;

  • Multi-Agent Collaboration:多智能體協(xié)作,關(guān)注角色、通信、調(diào)度和交互機制;

  • Failure Attribution:故障歸因,關(guān)注系統(tǒng)失敗后的定位、解釋和診斷;

  • Self-Evolution:自我演化,關(guān)注系統(tǒng)如何根據(jù)反饋持續(xù)調(diào)整自身。

以往綜述往往分別討論個體能力、多智能體協(xié)作或自我改進。LIFE 框架則把這些方向放到同一個生命周期中觀察:個體能力提供協(xié)作基礎(chǔ),協(xié)作機制帶來系統(tǒng)級復(fù)雜性,故障歸因讓失敗過程變得可分析,自我演化則把診斷結(jié)果轉(zhuǎn)化為后續(xù)改進。

因此,LIFE 關(guān)注的不只是「有哪些方法」,而是一個多智能體系統(tǒng)如何運行、如何失敗,以及如何在失敗之后調(diào)整。

六、未來展望

LLM 多智能體系統(tǒng)已經(jīng)展示出處理復(fù)雜任務(wù)的潛力,但要走向長期可靠的應(yīng)用,仍需要在幾個關(guān)鍵方向上繼續(xù)推進。

  • 更全面的評測體系:現(xiàn)有評測仍然偏重任務(wù)成功率,而多智能體系統(tǒng)還需要考察通信效率、角色貢獻、錯誤傳播、環(huán)境適應(yīng)性和長期穩(wěn)定性。

  • 更靈活的協(xié)作結(jié)構(gòu):當(dāng)前很多系統(tǒng)仍依賴人工設(shè)定角色、流程和通信方式。未來的系統(tǒng)需要根據(jù)任務(wù)需求動態(tài)調(diào)整組織方式,包括角色分配、通信路徑、調(diào)度策略和協(xié)作結(jié)構(gòu)。

  • 更有效的歸因與修復(fù)閉環(huán):多智能體系統(tǒng)的失敗往往跨越多個角色和多輪交互。歸因的價值不應(yīng)停留在解釋錯誤,而應(yīng)進一步指導(dǎo)系統(tǒng)修復(fù),例如調(diào)整提示詞、重新分配角色、修改工具調(diào)用方式或優(yōu)化整體流程。

  • 更可控的自我演化機制:當(dāng)系統(tǒng)開始調(diào)整自身結(jié)構(gòu)時,效率、安全和對齊問題會變得更加重要。未來的自我演化不能只是搜索更高性能的結(jié)構(gòu),還需要在成本、穩(wěn)定性和可控性之間取得平衡。

閱讀最新前沿科技趨勢報告,請訪問21世紀(jì)關(guān)鍵技術(shù)研究院的“未來知識庫”


未來知識庫是 “21世紀(jì)關(guān)鍵技術(shù)研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級智能,數(shù)智大腦、能源、軍事、經(jīng)濟、人類風(fēng)險等等領(lǐng)域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

(加入未來知識庫,全部資料免費閱讀和下載)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中足聯(lián)官宣重磅罰單!52歲于根偉禁賽5場罰5萬 辱罵+率隊圍堵裁判

中足聯(lián)官宣重磅罰單!52歲于根偉禁賽5場罰5萬 辱罵+率隊圍堵裁判

我愛英超
2026-07-02 22:05:30
早上7點 世界杯14億大戰(zhàn)!C羅深陷20年魔咒 必有1巨星出局

早上7點 世界杯14億大戰(zhàn)!C羅深陷20年魔咒 必有1巨星出局

葉青足球世界
2026-07-02 17:12:02
一路走好!1天時間4位名人被曝去世,最大78歲,最小才30歲

一路走好!1天時間4位名人被曝去世,最大78歲,最小才30歲

借你一生
2026-07-02 10:26:03
成田機場的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國”

成田機場的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國”

東京在線
2026-07-02 16:57:07
里子面子都丟了!管不住下半身的任素汐,一場演唱會撕下她的體面

里子面子都丟了!管不住下半身的任素汐,一場演唱會撕下她的體面

往史過眼云煙
2026-07-02 09:55:26
首都保衛(wèi)戰(zhàn)打響后,普京發(fā)表全國講話,俄羅斯對美西方發(fā)出通牒

首都保衛(wèi)戰(zhàn)打響后,普京發(fā)表全國講話,俄羅斯對美西方發(fā)出通牒

策前論
2026-07-02 17:21:49
“一個月600塊你要餓死他?”大學(xué)男生吃飯被偷拍,看的人心疼!

“一個月600塊你要餓死他?”大學(xué)男生吃飯被偷拍,看的人心疼!

林林先生
2026-07-01 12:30:03
從699分到愛心接力:少年向上 社會向善丨中聽

從699分到愛心接力:少年向上 社會向善丨中聽

大象新聞
2026-07-01 16:30:12
六代機,就這么明晃晃的官宣了!

六代機,就這么明晃晃的官宣了!

新動察
2026-07-02 08:25:58
韓紅一句“走個面兒”引全網(wǎng)聲討,這屆觀眾不伺候了

韓紅一句“走個面兒”引全網(wǎng)聲討,這屆觀眾不伺候了

可達鴨面面觀
2026-07-02 19:44:03
曝38歲德國主帥下課 足協(xié)開會3小時要求他辭職 愿付700萬歐補償金

曝38歲德國主帥下課 足協(xié)開會3小時要求他辭職 愿付700萬歐補償金

我愛英超
2026-07-02 21:40:07
80%變0!里奇·保羅曝光詹姆斯離湖心路

80%變0!里奇·保羅曝光詹姆斯離湖心路

籃壇第一線
2026-07-02 00:47:17
地鐵吐血女孩半月內(nèi)多次收到病危通知單,當(dāng)事人:自己的生命已經(jīng)進入倒計時,但還是希望能夠有人關(guān)注到自己手里仍在運行的公益項目

地鐵吐血女孩半月內(nèi)多次收到病危通知單,當(dāng)事人:自己的生命已經(jīng)進入倒計時,但還是希望能夠有人關(guān)注到自己手里仍在運行的公益項目

瀟湘晨報
2026-07-02 16:32:20
賈玲直言自己又活過來了,大方承認體重反彈了,坦言不再逼自己極端自律,活得太通透了

賈玲直言自己又活過來了,大方承認體重反彈了,坦言不再逼自己極端自律,活得太通透了

背包旅行
2026-07-02 11:45:23
西安賽格墜樓熱搜刷屏:我看到謀生的嚴(yán)總,走上絕路時的無助

西安賽格墜樓熱搜刷屏:我看到謀生的嚴(yán)總,走上絕路時的無助

李晚書
2026-07-02 18:44:26
故意剝奪伊朗隊勝利!伊朗裔美國專家起訴國際足聯(lián),索賠10億美元

故意剝奪伊朗隊勝利!伊朗裔美國專家起訴國際足聯(lián),索賠10億美元

全景體育V
2026-07-02 21:38:20
成都一女子不洗手抱孫子,兒媳怒斥不衛(wèi)生,兒子一拳打面中,母親揚言要兒子坐牢,兒子卻說:她活該!6年后現(xiàn)狀曝光...

成都一女子不洗手抱孫子,兒媳怒斥不衛(wèi)生,兒子一拳打面中,母親揚言要兒子坐牢,兒子卻說:她活該!6年后現(xiàn)狀曝光...

背包旅行
2026-07-02 14:33:11
中國臺灣演員陳昊森承認與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

中國臺灣演員陳昊森承認與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

極目新聞
2026-07-02 22:47:55
加息,突變!美國重磅數(shù)據(jù)出爐!美股、黃金、比特幣全線拉升

加息,突變!美國重磅數(shù)據(jù)出爐!美股、黃金、比特幣全線拉升

證券時報
2026-07-02 21:53:03
扎哈羅娃:馮德萊恩是個“出色的騙子”

扎哈羅娃:馮德萊恩是個“出色的騙子”

參考消息
2026-07-02 14:14:08
2026-07-03 02:28:49
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4864文章數(shù) 37483關(guān)注度
往期回顧 全部

科技要聞

馬斯克不承認,但SpaceX就該造AI手機

頭條要聞

商戶在西安賽格商場墜亡 好友:他曾變賣門店發(fā)工資

頭條要聞

商戶在西安賽格商場墜亡 好友:他曾變賣門店發(fā)工資

體育要聞

韓國人,為什么恨透了洪明甫?

娛樂要聞

眾星祝福祖國,曾沛慈原形畢露?

財經(jīng)要聞

千億茶市場無贏家:瀾滄巨虧 八馬停"蹄"

汽車要聞

有純電有增程 還有二代VLA支持 小鵬MONA L03預(yù)售價14.38萬起

態(tài)度原創(chuàng)

手機
時尚
藝術(shù)
公開課
軍事航空

手機要聞

Android 17缺的原生應(yīng)用鎖功能,谷歌仍在持續(xù)打磨

這個夏天,你一定吃過她們的瓜

藝術(shù)要聞

一念天堂,一念地獄:你的心是什么樣,世界就什么樣

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍“航母殺手”首次公開 此前從未展示

無障礙瀏覽 進入關(guān)懷版