網易首頁 > 網易號 > 正文 申請入駐

斯坦福最新研究:AI 的上下文比參數重要,無需重訓、不再微調

0
分享至


大數據文摘出品

近日,斯坦福大學與 SambaNova Systems 合作發表了論文《Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models》。

該論文提出了一個名為ACE(Agentic Context Engineering)的框架,可以讓AI在不重新訓練權重的前提下,實現自我改進。


論文鏈接: http://arxiv.org/abs/2510.04618v1

論文的核心思想是,大模型的能力,并非僅由參數決定,更取決于“上下文的質量”。換句話說,誰能構建出最優的上下文,誰就能讓模型更聰明。

ACE的核心思想,是讓模型不再依賴“靜態提示(prompt)”,而轉向一種動態、結構化、可進化的“知識劇本”(playbook)

這些劇本記錄了模型在任務執行中積累的策略、規則、模板和修正規則。每一次失敗或成功,都會被轉化為一條“增量更新”(delta)。

與傳統的“重寫提示”不同,ACE通過小步安全更新不斷改進劇本,而不是一次性推倒重來。

這種機制意味著,AI可以在運行中學習、記憶、改進,而不需任何參數微調。


ACE框架

研究者指出,這一機制能避免兩種致命問題:一是簡化偏差(brevity bias),即在追求簡潔的優化中丟失關鍵細節;二是上下文崩塌(context collapse),即重寫導致的知識損毀。


論文舉例稱,在實驗中,一個AI代理積累了1.8萬token的上下文,表現良好。但當模型試圖“總結壓縮”它時,劇本被削減至僅122個token,性能瞬間跌至57.1%

研究者直言:“模型擅長使用知識,但不擅長整理知識。一次錯誤的重寫,就可能摧毀全部積累。”

論文稱ACE解決了這種“自毀式學習”的結構性風險。


圖注:ACE 框架在三類任務(智能體操作、領域知識、數值推理)上都顯著優于其他方法,準確率提升最明顯。

三角色協作:生成、反思、策展

ACE體系建立在一個極簡哲學上:不要重寫知識,要管理知識。

整個系統被拆解為三個互補的角色。

第一個是生成器(Generator)。它負責執行任務,與環境交互,生成推理過程、代碼或操作序列。

第二個是反思器(Reflector)。它分析生成器的行動軌跡,識別成功與失敗的原因,提取“可操作的教訓”。這些反饋信號可能來自代碼錯誤、執行結果或外部標簽。

第三個是策展器(Curator)。它將這些經驗提煉為結構化條目(delta context),并通過確定性規則(非語言模型決策)整合進主劇本。

這樣的三層循環——行動、反思、整合構成了ACE的學習閉環。

每次更新都只影響局部條目,不觸碰整體文本。這種局部增量機制,讓知識庫既能不斷擴展,又不會坍塌。

劇本本身被設計為項目化結構:包含策略規則、API調用模板、調試經驗、常見錯誤解決方案等。每條條目附帶使用計數與正負反饋元數據

反思器會根據這些記錄判斷哪些規則有效、哪些無用。策展器再據此修改或刪除。

論文稱,這種方式讓AI的知識“像Git倉庫一樣演化”,能安全地生長、細致地修剪、透明地追溯

研究者強調,ACE的復雜度并非負擔,而是一種結構化的安全機制,以微小的系統開銷換取知識的穩定積累。

小模型“越級打怪”:DeepSeek擊敗GPT-4.1

在復雜的AppWorld代理任務中,ACE框架帶來了+10.6%的平均性能提升,并將適應延遲降低86.9%

研究團隊特別提到,這一提升并非依賴更大的模型,而是源于更好的上下文管理。

一個典型例子是:DeepSeek V3.1,參數量低于GPT-4.1。但在ACE框架下,它在AppWorld基準測試中,竟能與GPT-4.1代理(IBM CUGA)持平,甚至在更復雜的測試集上反超

研究者指出,這一結果說明,“上下文工程”已成為新的算力平權器

更重要的是,ACE的效率優勢驚人。在多輪任務學習中,它的更新延遲減少82%~91%token成本下降83.6%


圖注:在金融分析任務中,ACE 框架顯著提升模型表現(平均提升約 8.6%),即使沒有真實標簽也能保持穩定表現。

論文認為,這讓“在線持續學習”從概念變為現實。AI不再需要頻繁微調,而可以在運行中自我優化。

同時,ACE的結構化劇本讓學習過程可解釋、可審計、可撤回

如果某條規則被發現過時、偏頗或違規,系統可以精準刪除對應條目,實現“選擇性遺忘”。

注:頭圖AI生成

作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

GPU 訓練特惠!

H100/H200 GPU算力按秒計費,平均節省開支30%以上!

掃碼了解詳情?

點「贊」的人都變好看了哦!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
成都一小區一把菜刀從天而降,墜落兒童游樂區!有監控拍到來自8樓以上,犯罪嫌疑人已被抓獲并被刑事拘留

成都一小區一把菜刀從天而降,墜落兒童游樂區!有監控拍到來自8樓以上,犯罪嫌疑人已被抓獲并被刑事拘留

都市快報橙柿互動
2026-04-23 15:52:49
碘伏再次成為關注對象!醫生發現:使用碘伏,千萬多留意這幾點

碘伏再次成為關注對象!醫生發現:使用碘伏,千萬多留意這幾點

39健康網
2026-03-25 16:00:38
醫生調查發現:餓著睡覺的人,會比吃宵夜的人更容易患腦梗?

醫生調查發現:餓著睡覺的人,會比吃宵夜的人更容易患腦梗?

芹姐說生活
2026-04-21 18:59:09
日本專家:特朗普延長停戰“等同于承認錯誤”

日本專家:特朗普延長停戰“等同于承認錯誤”

參考消息
2026-04-23 13:52:15
布馮20年不提齊達內頭槌:沉默是最高級的尊重

布馮20年不提齊達內頭槌:沉默是最高級的尊重

體壇觀察猿
2026-04-22 22:30:40
面相變了!55歲離2次婚的"紙片人"魯豫 與小19歲男友同居后大變樣

面相變了!55歲離2次婚的"紙片人"魯豫 與小19歲男友同居后大變樣

林雁飛
2026-04-20 19:14:55
局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

人間無味啊
2026-04-23 17:30:01
著名書法家、北京市文史館資深館員愛新覺羅·啟驤逝世

著名書法家、北京市文史館資深館員愛新覺羅·啟驤逝世

澎湃新聞
2026-04-23 14:06:27
中方禁令為何等100天才爆發?日本媒體瞞不住了,真相太現實

中方禁令為何等100天才爆發?日本媒體瞞不住了,真相太現實

諦聽骨語本尊
2026-04-22 14:38:02
5-1,41歲C羅多次失良機+科曼戴帽,利雅得勝利強勢進亞冠決賽

5-1,41歲C羅多次失良機+科曼戴帽,利雅得勝利強勢進亞冠決賽

側身凌空斬
2026-04-23 02:33:16
天生領袖!東契奇受傷后,詹姆斯在隊內說:跟著我,我們能贏球!

天生領袖!東契奇受傷后,詹姆斯在隊內說:跟著我,我們能贏球!

愛體育
2026-04-23 22:37:50
39歲前國腳現狀:定居美國踢野球,早已財富自由,有2個可愛女兒

39歲前國腳現狀:定居美國踢野球,早已財富自由,有2個可愛女兒

攬星河的筆記
2026-04-14 15:18:30
保利集團嚴正聲明

保利集團嚴正聲明

深圳晚報
2026-04-23 23:08:59
2:0后暴雷!兩大主將帶傷!贏球夜,衛冕危機來了?

2:0后暴雷!兩大主將帶傷!贏球夜,衛冕危機來了?

籃球盛世
2026-04-23 17:17:15
經過伊朗這一戰,中美之間可能至少50年內不會爆發戰爭

經過伊朗這一戰,中美之間可能至少50年內不會爆發戰爭

流史歲月
2026-04-17 23:20:03
7國南海搞軍演,轉頭求中國救急?中方一句話:不會拉你一把

7國南海搞軍演,轉頭求中國救急?中方一句話:不會拉你一把

墨印齋
2026-04-23 12:35:16
吃相越來越難看,終于引起公憤了!

吃相越來越難看,終于引起公憤了!

胖胖說他不胖
2026-04-23 09:00:33
突發!印度“發動襲擊”!

突發!印度“發動襲擊”!

財經要參
2026-04-23 09:00:12
原來我們錯怪高市早苗了

原來我們錯怪高市早苗了

深度報
2026-04-22 22:24:39
別再尬演“萬人迷”!滿臉褶子疙瘩、鼻孔朝天,這皮囊能迷倒誰?

別再尬演“萬人迷”!滿臉褶子疙瘩、鼻孔朝天,這皮囊能迷倒誰?

雨月海星
2026-04-18 05:25:40
2026-04-24 01:16:49
大數據文摘 incentive-icons
大數據文摘
專注大數據,每日有分享!
6852文章數 94541關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

媒體:海軍宣傳片出現的"新兵何劍" 傳遞了巨大信息量

頭條要聞

媒體:海軍宣傳片出現的"新兵何劍" 傳遞了巨大信息量

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

普華永道賠償10億 恒大股東見到"回頭錢"

汽車要聞

令人驚艷的奇瑞車 風云A9可不只是樣子貨

態度原創

手機
藝術
房產
家居
教育

手機要聞

vivo X500 Pro Max被曝光:2nm工藝+5GHz,2K直屏九月發!

藝術要聞

吉達塔蓋到第100層,“它是沙特唯一能按期完成的大項目”

房產要聞

三亞安居房,突然官宣!

家居要聞

浪漫協奏 法式風格

教育要聞

家長讓老師給發電子版試卷,卻被老師指責派頭大,到底誰的問題?

無障礙瀏覽 進入關懷版