无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

你的 AI 助理一閉嘴就在「發呆」?上交大 ProAct:把 Agent 的空閑時間變成生產力

0
分享至


ProAct,一種將對話間的空閑時間轉化為主動準備機會的新架構。

"幫我把明天上午10點的項目評審會安排一下。" 你剛對 AI 助理下達了指令。

"會議已安排。" 然后呢?然后它就原地“下班”了。

直到半小時后,你突然想起來:"對了,還得準備10頁的項目進展匯報 PPT,要有風險評估、下一步計劃和演講備注。"

這時,傳統 Agent 才如夢初醒,開始翻閱歷史記錄、梳理項目進展、組織材料結構。但一個真正靠譜的人類助理,在你提了一嘴“明天開評審會”的時候,早就在腦海里過了一遍——你肯定需要進度摘要,大概率還要看風險點,甚至連 PPT 大綱都已經在后臺默默幫你搭好了。

上海交通大學 APEX 實驗室提出了ProAct,一種將對話間的空閑時間轉化為主動準備機會的新架構。它不再等你把每一個需求都像擠牙膏一樣說出口,而是在你沉默的時間里,默默為你“偷偷備課”。


圖 1:傳統 Reactive Agent(上)vs ProAct(下)的交互時間線對比。傳統 Agent 在完成任務后進入休眠,用戶提出新需求時才從零開始準備;ProAct 則利用空閑窗口預判可能的后續需求(如評審材料),提前檢索證據并組織內容,在用戶開口前就已準備就緒。

論文標題:Anticipate and Learn: Unleashing Idle-Time Compute in Proactive Agents

作者:Haoyi Hu, Qirong Lyu, Xianghan Kong, Weiwen Liu, Jianghao Lin, Zixuan Guo, Yan Xu, Yasheng Wang, Weinan Zhang, Yong Yu

單位:上海交通大學、騰訊

論文鏈接:https://arxiv.org/abs/2605.25971

項目地址:https://github.com/AgentACE-AI/ProAct

Demo 頁面:https://agentace-ai.github.io/proact-showcase/

01


Agent 為什么總像“客服”?

心理學中有一個概念叫前攝應對(Proactive Coping):人在預判到未來需求時,會提前積攢資源、預做準備,而非等到火燒眉毛才行動。

然而今天絕大多數大模型 Agent,本質上依然是 Reactive Agent:你撥一下,它轉一下;你不問,它就休眠。它們把用戶兩次交互之間的空閑時間當成純粹的空白。

ProAct 的核心主張:空閑時間不是空白,而是被浪費的算力窗口。把一部分工作提前搬到空閑窗口,讓 Agent 在你沉默的時間里主動學習和準備。

02


ProAct 架構:

從“瞎忙”到“神預判”的三級流水線

如果隨便給 Agent 塞一個后臺搜索的權限,它大概率會變成“智能騷擾”——一有空就瘋狂彈窗,推一堆沒用的信息。ProAct 不是在后臺盲目亂搜,而是設計了一條嚴謹的主動計算流水線:預測 → 篩選 → 交付。


圖 2:ProAct 系統總覽。前臺交互完成后,系統更新持久記憶(用戶畫像、知識庫、對話軌跡),隨即進入空閑期主動計算:Future-State Prediction 預測未來需求,Idle-Time Acquisition 對高價值候選執行定向證據檢索與知識合成,最終由 Utility-Aware Delivery Policy 決定推送、排隊還是靜默存儲。

Future-State Prediction:精準錨定未來需求

預測模塊從兩個源頭生成候選需求:

  • 本地場景推斷:從最近幾輪對話中直接推斷可能的后續需求(如安排評審會 → 大概率需要評審材料)

  • 關聯擴展:從持久記憶中的用戶畫像、歷史摘要、未完成目標中擴展相關方向

此外,當記憶層檢測到過時、不完整或證據薄弱的知識條目時,這些記憶缺口也會被轉化為候選需求——讓記憶維護直接驅動信息獲取,而非被動等待查詢。候選經過置信度過濾和去重后,輸出一組緊湊的預測集合。

回到開頭的例子:你剛說完“安排明天的評審會”,預測模塊已經推斷出“需要項目進展材料”和“可能要看風險點”兩個高置信候選。

Idle-Time Acquisition:算力花在刀刃上

每一個候選需求,都要經過四維價值打分:

1.用戶相關性(Relevance):和當前目標關聯多大?

2.知識缺口(Gap):記憶里是不是已經有答案了?

3.增量價值(Value):現在準備能省去用戶多少未來的麻煩?

4.時效性(Timeliness):現在準備時機對嗎?

只有總分超過閾值 θ_val 的候選才真正獲得算力執行。而執行時,系統還做了增量搜索優化:已有的證據直接復用,部分覆蓋的只補缺口,完全沒有的才啟動迭代搜索。這使得空閑計算不是從零開始的全量搜索,而是增量拼圖。

回到評審會的例子:你的項目進展數據上周剛更新過,直接復用;風險評估是空白,系統才啟動定向搜索補上這塊缺口。

Utility-Aware Delivery:推還是不推,這是個問題

準備好材料后,ProAct 絕不會無腦彈窗。交付策略基于一個效用公式做決策:

U(x) = E[V(x)] ? C(t)

V 是預期信息價值,C 是打斷用戶的成本。只有當 U 超過自適應閾值 τ 時,系統才決定交付。交付方式分三檔:

  • Push(主動推送):價值極高、時機剛好,直接通知(如:"我已經把評審材料大綱整理好了,需要展開嗎?")

  • Queue(排隊等待):有用但不緊急,等用戶下次提問時自然融入回復

  • Store(靜默存儲):大概率有用但現在不宜打擾,存入長期記憶,等用戶需要時瞬間調出

03


ProActEval:200 個場景的硬核評測

評估一個主動式 Agent,不能只考“記憶力”,還要考它能不能在你開口前就把活兒干了。為此,論文構建了全新評測基準ProActEval

  • 200 個場景,覆蓋 40 個領域(金融規劃、軟件發布、網絡安全、搬家、稅務申報……)

  • 每個場景自帶Fact Sheet(12-37 條原子化可驗證事實,全部虛構實體)

  • 每個場景包含5-15 條用戶需求,標注了重要性等級、依賴鏈和可預測性關系

  • Agent運行時看不到gold label——不能偷看未來需求,只能走一步看一步

實驗設置了三個對比條件:


主實驗結果


關鍵觀察:原本需要來回拉扯 8 輪才能完成的任務,現在不到 7 輪搞定;幻覺率暴降近三成——因為有充足的后臺時間做事實檢索,Agent 回答得更準了。

對比 ProactiveAgent 基線

論文還將 ProAct 與公開的 ProactiveAgent (Lu et al., 2024) 決策協議做了對比。ProactiveAgent 雖然在 69.6% 的 turn 上都嘗試了主動任務,但方向不對:


這說明:光有主動嘗試的意愿遠遠不夠——方向對了才有價值。ProactiveAgent 做了大量主動嘗試但幾乎全部打偏,ProAct 的預測精度使得每一次主動準備都落在用戶真正會問的方向上。

04


關鍵發現:

算力花在哪,比花多少更重要

論文中設置了一個非常有意思的對照組——Undirected Idle。這個條件同樣在后臺消耗算力(平均每個場景 69.8k active tokens),但因為沒有 Future-State Prediction 的引導,像個無頭蒼蠅一樣亂搜。

結果:它的 T100 僅比純 Reactive 下降 0.07 turns,幾乎沒有改善。而 ProAct 雖然多花了 60% 的 token(111.8k),但換來了 T100 下降 1.2 turns、覆蓋率提升 7.2%、幻覺率下降 28.1% 的全面收益。

空閑時間計算的價值不在于多算,而在于算對地方

進一步的搜索預算掃描(k = 4, 8, 12, 16)驗證了這一點。隨著 k 增加,Anticipation Recall 從 0.253 單調上升至 0.432;但 User Effort 并不單調下降——一旦主要的可預測需求被覆蓋,追加搜索追的是邊際越來越低的長尾需求,active-token 成本卻持續攀升。


圖3:搜索預算分析(50 場景子集)。橫軸為搜索預算 k,四個面板分別展示 T100、User Effort、Anticipation Recall 和 Active Token 成本。灰色區段標注了相同預算下 Directed Idle 與 Undirected Idle 的差距——在每一個預算點上,有預測引導的定向搜索都優于無方向的盲目搜索。但隨著預算增加,效率收益趨于平緩而成本持續攀升。

主動計算是一個需要精心設計的操作點權衡(operating-point trade-off),而非越多越好的暴力堆算力。

05


MemBench:

預測建立在堅實的記憶底座上

在 MemBench 記憶基準測試的反思參與設定中,ProAct 展現了穩健的記憶能力:


這證明 ProAct 的未來預測絕不是憑空猜測,而是建立在對長期用戶偏好和情感狀態的準確推斷之上的。

06


結論

ProAct 之所以能做到主動預判,不是靠猜,它通過持久記憶持續積累用戶畫像、歷史偏好、實體事實和情感狀態。當這些信息被系統性地組織和推理之后,Agent 在某些維度上甚至比用戶自己更清楚“你下一步會問什么”。

從 ChatGPT 到目前市面上的各類 Agent,交互范式基本停留在“你問我答”。但人類真實的協作從來不是回合制答題。如果說 RAG 讓 Agent 學會了“現查現答”,長期記憶讓 Agent 學會了“銘記過去”,那么 ProAct 試圖補全最后一塊拼圖——面向未來做準備。

回到開頭的場景:當你說完“安排明天的評審會”,一個真正主動的 Agent 就已經在為你準備 PPT 了——不是因為你吩咐了,而是因為它知道你一定會需要。

更好的 Agent 不只是回答得更快,而是在你開口之前就已經在正確的方向上做好了準備。

想親眼看看主動式 Agent 的效果?

訪問 ProAct Demo 頁面:

https://agentace-ai.github.io/proact-showcase/

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
這次,孫丞瀟被扒了個底朝天,吳鎮宇的話,終于有人信了

這次,孫丞瀟被扒了個底朝天,吳鎮宇的話,終于有人信了

草莓解說體育
2026-06-13 14:45:45
馬斯克的“造人計劃”:14個孩子和一個讓他心碎的“嫡長子”

馬斯克的“造人計劃”:14個孩子和一個讓他心碎的“嫡長子”

民間胡扯老哥
2026-06-14 07:08:34
一油傳三代,人走油還在,日本一炸雞店一鍋油用了66年拿全國金獎

一油傳三代,人走油還在,日本一炸雞店一鍋油用了66年拿全國金獎

大廠編外實習生
2026-06-12 13:36:01
一輪牛市,科技見頂就是牛市結束,大家被“洗腦”了!

一輪牛市,科技見頂就是牛市結束,大家被“洗腦”了!

郭小凡財經
2026-06-14 09:13:07
15個副省級市已明確,浙江2個,江蘇僅有1個,湖南、河北1個都無

15個副省級市已明確,浙江2個,江蘇僅有1個,湖南、河北1個都無

混沌錄
2026-06-01 21:47:13
村里請我回去投資,剛上桌就被二叔扇臉:你也配上桌,我火速撤資

村里請我回去投資,剛上桌就被二叔扇臉:你也配上桌,我火速撤資

千秋文化
2026-06-10 20:45:49
后防巨大失誤!巴西隊3人看戲:摩洛哥新星精彩破門 安帥一臉愁容

后防巨大失誤!巴西隊3人看戲:摩洛哥新星精彩破門 安帥一臉愁容

風過鄉
2026-06-14 06:36:51
特朗普出手!Claude Fable 5與Mythos 5全停了,AI專家:中國才是全人類希望

特朗普出手!Claude Fable 5與Mythos 5全停了,AI專家:中國才是全人類希望

智東西
2026-06-13 12:29:15
白酒再次成為關注對象!多名院士發現:常喝白酒的人,有4個變化

白酒再次成為關注對象!多名院士發現:常喝白酒的人,有4個變化

垚垚分享健康
2026-06-13 19:20:07
比恒大還慘!中國第二大民企倒了,負債7500億,創始人被帶走

比恒大還慘!中國第二大民企倒了,負債7500億,創始人被帶走

芳芳歷史燴
2025-12-25 20:32:52
破繭成蝶未來可期!U23國足4-0大勝展現青春風暴

破繭成蝶未來可期!U23國足4-0大勝展現青春風暴

環球體壇啄木鳥
2026-06-13 18:47:30
這組全是許晴年輕舊照!

這組全是許晴年輕舊照!

草莓解說體育
2026-06-05 14:04:24
全線轉跌,超12萬人爆倉

全線轉跌,超12萬人爆倉

每日經濟新聞
2026-06-12 00:18:19
世界杯熱度不如從前,別看國足缺席,中國反而卻成了最大贏家

世界杯熱度不如從前,別看國足缺席,中國反而卻成了最大贏家

小許論事
2026-06-13 10:42:43
洛佩特吉迎來世界杯首秀:2018年的事,我已放下

洛佩特吉迎來世界杯首秀:2018年的事,我已放下

體壇周報
2026-06-13 17:57:21
震驚!武漢某大學食堂貼出提示稱“燒鵝飯為廣東俗稱,實為烤鴨”

震驚!武漢某大學食堂貼出提示稱“燒鵝飯為廣東俗稱,實為烤鴨”

火山詩話
2026-06-13 08:00:03
守不住!臺灣管控的太平島允許美軍進領海,被越南菲律賓多次欺負

守不住!臺灣管控的太平島允許美軍進領海,被越南菲律賓多次欺負

阿龍聊軍事
2026-06-13 15:19:24
痛快!女子買房被姑姑指“嫁出的女不該分家產”,回懟堪稱教科書

痛快!女子買房被姑姑指“嫁出的女不該分家產”,回懟堪稱教科書

火山詩話
2026-06-13 06:40:12
四人幫被密捕的消息是如何泄露的?北京傳來暗語:老娘心肌梗死

四人幫被密捕的消息是如何泄露的?北京傳來暗語:老娘心肌梗死

談古論今歷史有道
2026-06-03 16:30:03
為什么說閑魚是中國最大的黑市?網友:我直接給跪了!

為什么說閑魚是中國最大的黑市?網友:我直接給跪了!

另子維愛讀史
2026-06-02 10:51:07
2026-06-14 10:43:00
AI科技評論 incentive-icons
AI科技評論
點評學術,服務AI
7372文章數 20758關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

陜西橋梁垮塌致25輛車墜河62人死亡失蹤 官方公布細節

頭條要聞

陜西橋梁垮塌致25輛車墜河62人死亡失蹤 官方公布細節

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

具俊曄曝大S離世前虛弱照,難怪小s退讓

財經要聞

金價跌至900元關口,大媽又來抄底了!

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

藝術
手機
本地
時尚
公開課

藝術要聞

廣州再建一座“小蠻腰”?190米,頂著個球,2027年見!

手機要聞

告別4499元!小米18起售價將突破5000元大關 首發高通驍龍8E6

本地新聞

AK劉彰邂逅河北南大港濕地

伊姐周六熱推:電視劇《南部檔案》;電視劇《意外調查組》......

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版