亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

高效智能體幕后推手是誰?一篇綜述帶你從記憶×工具學(xué)習(xí)×規(guī)劃看透

0
分享至



隨著大模型能力的躍遷,業(yè)界關(guān)注點(diǎn)正在從 “模型能不能做” 快速轉(zhuǎn)向 “智能體能不能落地”。過去一年可以看到大量工作在提升智能體的有效性(effectiveness):如何讓它更聰明、更穩(wěn)、更會(huì)用工具、更能完成復(fù)雜任務(wù)。

但在真實(shí)應(yīng)用里,另一個(gè)更 “硬” 的問題常常決定能否上線:高效性(efficiency)。智能體即便表現(xiàn)很好,如果每次都要消耗大量算力、時(shí)間與調(diào)用成本,也很難在生產(chǎn)環(huán)境大規(guī)模部署。

基于這一視角,論文整理并撰寫了一篇面向 “高效智能體” 的綜述,系統(tǒng)梳理當(dāng)前主要方法,并從三個(gè)最關(guān)鍵的機(jī)制出發(fā)組織全文框架:記憶 — 工具學(xué)習(xí) — 規(guī)劃。論文從設(shè)計(jì)范式出發(fā)對(duì)代表性方法進(jìn)行歸納總結(jié),聚焦那些以效率為目標(biāo)或能夠提升效率的核心設(shè)計(jì)與實(shí)現(xiàn)路徑,從而更清晰地呈現(xiàn)智能體在真實(shí)落地場(chǎng)景中的成本 — 性能權(quán)衡。



  • 論文地址:https://arxiv.org/abs/2601.14192
  • GitHub 地址:https://github.com/yxf203/Awesome-Efficient-Agents



一、智能體記憶:

讓 “會(huì)記” 更省、更準(zhǔn)、更可擴(kuò)展



智能體要做長(zhǎng)任務(wù),離不開記憶。但把歷史一股腦塞進(jìn)提示詞,會(huì)帶來 token 暴漲和智能體處理長(zhǎng)上下文能力下降。因此,高效記憶系統(tǒng)的關(guān)鍵在于把 “長(zhǎng)歷史” 加工成 “可用、可檢索、可復(fù)用” 的信息資產(chǎn)。

論文按記憶生命周期梳理三步:構(gòu)建 — 管理 — 訪問。

  • 記憶構(gòu)建:通過概括、壓縮與結(jié)構(gòu)化把 “長(zhǎng)對(duì)話” 轉(zhuǎn)成 “可用記憶”。一類是留在推理鏈路的工作記憶,文本式直觀但吃上下文,隱式式更像緩存,可減少重復(fù)編碼;另一類是外置為可檢索系統(tǒng)的外部記憶,先將信息壓成小單元再按需召回,包括條目式、圖式與分層式。此外論文也提到要警惕過度壓縮帶來的信息損失,即需要考慮如何在降成本與保真之間取得平衡。
  • 記憶管理:防止 “存爆炸”,也避免 “取太慢”。規(guī)則式快但可能誤刪重要內(nèi)容,大模型式更聰明但更貴,混合式則按層級(jí)或場(chǎng)景組合兩者策略,在效果與成本之間取得折中。
  • 記憶訪問:選什么 + 怎么用。訪問分記憶選擇與記憶整合,通過檢索或訓(xùn)練等方式挑選記憶,再用壓縮過濾或隱式注入減少 token 與重復(fù)編碼。

另外,多智能體記憶也成為新趨勢(shì)。相較于只靠通信,近年更多工作開始引入 “記憶” 這一概念來支撐規(guī)模化協(xié)作,論文將其概括為:共享記憶 / 本地記憶 / 混合記憶三類。

二、工具學(xué)習(xí):

讓 “會(huì)用工具” 更少調(diào)用、更少等待、更少走彎路



工具讓智能體從 “會(huì)說” 變成 “能做”,但成本也最容易在工具鏈路里失控。論文按三條主線梳理提效思路:工具選擇 — 工具調(diào)用 — 工具融合推理。

  • 工具選擇:目標(biāo)是 “更快選對(duì)、少塞進(jìn) prompt”。相關(guān)方法包括外部檢索器、多標(biāo)簽分類,以及將工具映射為特殊 token 等思路,核心都是在大量工具中更快、更準(zhǔn)地選出最需要的那幾個(gè)。
  • 工具調(diào)用:核心是 “少等、少調(diào)、少走彎路”。典型路線包括邊生成邊調(diào)用、并行化調(diào)用,以及利用成本感知調(diào)用與測(cè)試時(shí)高效擴(kuò)展來削減冗余調(diào)用;進(jìn)一步還可通過面向效率的后訓(xùn)練把 “短軌跡、少調(diào)用” 寫進(jìn)策略本身。
  • 工具融合推理:讓模型學(xué)會(huì) “該不該用、何時(shí)用、用幾次”。代表性方向包括選擇性調(diào)用,引導(dǎo)智能體只在必要時(shí)才發(fā)起工具調(diào)用;以及成本約束策略優(yōu)化,在保證效果的同時(shí)對(duì)冗余交互與過長(zhǎng)軌跡施加懲罰,從而學(xué)到更短、更省的工具使用策略。

三、智能體規(guī)劃:

在 “深度” 與 “寬度” 上同時(shí)省下來



規(guī)劃決定智能體如何在多步?jīng)Q策空間里行動(dòng)。效率問題要么來自單體推理 “想太深、搜太貴”,要么來自多體協(xié)作 “聊太多、通信太重”。因此論文從兩條線展開:?jiǎn)沃悄荏w規(guī)劃與多智能體協(xié)作規(guī)劃。



四、基準(zhǔn)與評(píng)測(cè)(Benchmark):

沒有 “可比的尺”,就談不上 “可落地的效率”

在談?dòng)洃?、工具學(xué)習(xí)與規(guī)劃的提效方案之前,先要把 “尺子” 定清楚:高效到底怎么量?

論文強(qiáng)調(diào),效率必須建立在有效性之上。省了資源卻顯著掉性能,不算高效。因此論文采用的定義是:在給定預(yù)算下取得更好的效果,或在相近效果下消耗更少資源。

基于這一視角,論文先梳理了以有效性為主的 benchmark,并進(jìn)一步匯總了與效率相關(guān)的評(píng)測(cè)內(nèi)容:一方面,整理了在 benchmark 中顯式納入效率信號(hào)(成本、延遲、調(diào)用次數(shù)等)的評(píng)測(cè)設(shè)置;另一方面,總結(jié)了智能體方法中常用的效率指標(biāo),用于刻畫 “省在哪兒、省多少”。

五、挑戰(zhàn)與展望

論文同時(shí)也提出了目前的一些挑戰(zhàn)與展望:

1)統(tǒng)一評(píng)測(cè)框架:指標(biāo)口徑統(tǒng)一,模塊開銷邊界清楚,才能真正讓各個(gè)智能體方法可比可復(fù)現(xiàn)。

2)智能體的隱式推理(Latent Reasoning):大模型側(cè)的隱式推理正在升溫,但面向智能體的研究仍相對(duì)稀缺。由于智能體鏈路更長(zhǎng)、更復(fù)雜,還要處理工具調(diào)用、規(guī)劃與記憶等環(huán)節(jié),如何把中間推理 “做在隱式空間里”、在不掉效果的前提下降低成本,既是挑戰(zhàn),也是機(jī)會(huì)。

3)面向部署設(shè)計(jì):在多智能體場(chǎng)景下,需要把部署成本納入考量,核心問題是投入產(chǎn)出比。也就是說,增加智能體帶來的收益,是否足以覆蓋新增的開銷。

4)多模態(tài)效率:多模態(tài)智能體發(fā)展很快,但效率研究仍相對(duì)欠缺。文本智能體的一些提效思路可以借鑒,但是直接遷移卻并不容易,因?yàn)槎嗄B(tài)智能體的感知輸入、行為空間與任務(wù)結(jié)構(gòu)更復(fù)雜、交互成本更高。因此,如何在多模態(tài)場(chǎng)景下系統(tǒng)地兼顧效果與成本,仍是亟待解決的關(guān)鍵問題。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
記者:卡里克如今轉(zhuǎn)正嚴(yán)重存疑,高層對(duì)球隊(duì)缺乏強(qiáng)度感到擔(dān)憂

記者:卡里克如今轉(zhuǎn)正嚴(yán)重存疑,高層對(duì)球隊(duì)缺乏強(qiáng)度感到擔(dān)憂

懂球帝
2026-04-15 22:20:10
蘇東:與高敏離婚30年,兒子在加拿大長(zhǎng)大,他仍每年飛去看孩子

蘇東:與高敏離婚30年,兒子在加拿大長(zhǎng)大,他仍每年飛去看孩子

悅君兮君不知
2026-04-14 23:04:49
網(wǎng)友:恒大欠兩萬億我忍了,但許家印的審美真忍不了!

網(wǎng)友:恒大欠兩萬億我忍了,但許家印的審美真忍不了!

GA環(huán)球建筑
2026-04-15 16:40:01
理想的至暗時(shí)刻

理想的至暗時(shí)刻

新浪財(cái)經(jīng)
2026-04-15 03:08:52
難以置信!居然建議峰學(xué)蔚來終止經(jīng)營(yíng),一安徽網(wǎng)友發(fā)帖被“炮轟”

難以置信!居然建議峰學(xué)蔚來終止經(jīng)營(yíng),一安徽網(wǎng)友發(fā)帖被“炮轟”

火山詩(shī)話
2026-04-15 15:57:16
蘋果的半成品方案,居然成了版本答案?

蘋果的半成品方案,居然成了版本答案?

差評(píng)XPIN
2026-04-15 00:13:50
小到中雨!局部雷電、大風(fēng)、冰雹!遼寧人明早上班注意!

小到中雨!局部雷電、大風(fēng)、冰雹!遼寧人明早上班注意!

魯中晨報(bào)
2026-04-15 18:12:41
賴清德還沒到,斯威士蘭收噩耗,中國(guó)的70周年大禮,只有他拿不到

賴清德還沒到,斯威士蘭收噩耗,中國(guó)的70周年大禮,只有他拿不到

忠于法紀(jì)
2026-04-15 17:56:30
5月1日起,醫(yī)院要變天了?以后看病不再擠破頭!

5月1日起,醫(yī)院要變天了?以后看病不再擠破頭!

小談食刻美食
2026-04-15 08:30:07
接下來的廣州,地鐵、燃?xì)狻⑺M(fèi)都要漲價(jià)?

接下來的廣州,地鐵、燃?xì)?、水費(fèi)都要漲價(jià)?

南沙部落
2026-04-15 09:53:21
徐杰的2+1判罰正確嗎?裁判專家給出答案,球迷:不是2+1也屬違體

徐杰的2+1判罰正確嗎?裁判專家給出答案,球迷:不是2+1也屬違體

南海浪花
2026-04-15 06:41:10
黑長(zhǎng)直老公濫交得病了

黑長(zhǎng)直老公濫交得病了

毒舌扒姨太
2026-04-11 22:42:59
米粉的天都塌了!一季度數(shù)據(jù)出爐,小米暴跌35%

米粉的天都塌了!一季度數(shù)據(jù)出爐,小米暴跌35%

輝哥說動(dòng)漫
2026-04-14 14:29:30
陳麗華告別儀式結(jié)束1天,令人擔(dān)憂的事發(fā)生,遲重瑞被公然挑毛病

陳麗華告別儀式結(jié)束1天,令人擔(dān)憂的事發(fā)生,遲重瑞被公然挑毛病

叮當(dāng)當(dāng)科技
2026-04-16 00:33:06
iPhone18 Pro被曝不會(huì)漲價(jià),準(zhǔn)入門檻將依然為8999元,星宇橙配色將被全新的深紅色取代

iPhone18 Pro被曝不會(huì)漲價(jià),準(zhǔn)入門檻將依然為8999元,星宇橙配色將被全新的深紅色取代

魯中晨報(bào)
2026-04-15 09:24:20
震驚!一女孩求職不順焦慮,父親轉(zhuǎn)來4.8萬,按月4000元當(dāng)作工資

震驚!一女孩求職不順焦慮,父親轉(zhuǎn)來4.8萬,按月4000元當(dāng)作工資

火山詩(shī)話
2026-04-14 07:33:54
中年夫妻太辛酸!向華強(qiáng)坦白,早已和向太分房睡,但感情依舊甜蜜

中年夫妻太辛酸!向華強(qiáng)坦白,早已和向太分房睡,但感情依舊甜蜜

阿紿聊社會(huì)
2026-04-14 22:20:01
4.16日開始能夠悶聲發(fā)大財(cái),說發(fā)達(dá)就發(fā)達(dá),千萬橫財(cái)擋不住的生肖

4.16日開始能夠悶聲發(fā)大財(cái),說發(fā)達(dá)就發(fā)達(dá),千萬橫財(cái)擋不住的生肖

小智223
2026-04-14 22:16:37
河北一具女尸被打撈上岸,警方發(fā)布認(rèn)尸啟事

河北一具女尸被打撈上岸,警方發(fā)布認(rèn)尸啟事

現(xiàn)代快報(bào)
2026-04-15 19:19:12
巴基斯坦也沒有想到,跟著中國(guó)混來混去,結(jié)果自己也混了一個(gè)霸主

巴基斯坦也沒有想到,跟著中國(guó)混來混去,結(jié)果自己也混了一個(gè)霸主

豬小艷吖
2026-04-13 22:30:24
2026-04-16 01:47:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12772文章數(shù) 142629關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

法國(guó)全票通過 “將不義之財(cái)歸還中國(guó)”

頭條要聞

法國(guó)全票通過 “將不義之財(cái)歸還中國(guó)”

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財(cái)經(jīng)要聞

業(yè)績(jī)失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

健康
房產(chǎn)
數(shù)碼
教育
手機(jī)

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

房產(chǎn)要聞

重磅調(diào)規(guī)!341畝商改住+中小學(xué)用地!寶龍城這把穩(wěn)了?

數(shù)碼要聞

明基新款顯示器首發(fā)12499元:4K專業(yè)級(jí)色彩校準(zhǔn) 根據(jù)環(huán)境光自動(dòng)調(diào)整

教育要聞

黃岡小升初招生題,求面積,方法思路太絕了

手機(jī)要聞

一加Ace6至尊版再次被確認(rèn):魔改天璣9500+165Hz屏,本月發(fā)布!

無障礙瀏覽 進(jìn)入關(guān)懷版