網易首頁 > 網易號 > 正文申請入駐

你的 AI 助理一閉嘴就在「發呆」？上交大 ProAct：把 Agent 的空閑時間變成生產力

2026-05-27 19:45:41　來源: AI科技評論

廣東舉報

分享至

ProAct，一種將對話間的空閑時間轉化為主動準備機會的新架構。

"幫我把明天上午10點的項目評審會安排一下。" 你剛對 AI 助理下達了指令。

"會議已安排。" 然后呢？然后它就原地“下班”了。

直到半小時后，你突然想起來："對了，還得準備10頁的項目進展匯報 PPT，要有風險評估、下一步計劃和演講備注。"

這時，傳統 Agent 才如夢初醒，開始翻閱歷史記錄、梳理項目進展、組織材料結構。但一個真正靠譜的人類助理，在你提了一嘴“明天開評審會”的時候，早就在腦海里過了一遍——你肯定需要進度摘要，大概率還要看風險點，甚至連 PPT 大綱都已經在后臺默默幫你搭好了。

上海交通大學 APEX 實驗室提出了ProAct，一種將對話間的空閑時間轉化為主動準備機會的新架構。它不再等你把每一個需求都像擠牙膏一樣說出口，而是在你沉默的時間里，默默為你“偷偷備課”。

圖 1：傳統 Reactive Agent（上）vs ProAct（下）的交互時間線對比。傳統 Agent 在完成任務后進入休眠，用戶提出新需求時才從零開始準備；ProAct 則利用空閑窗口預判可能的后續需求（如評審材料），提前檢索證據并組織內容，在用戶開口前就已準備就緒。

論文標題：Anticipate and Learn: Unleashing Idle-Time Compute in Proactive Agents

作者：Haoyi Hu, Qirong Lyu, Xianghan Kong, Weiwen Liu, Jianghao Lin, Zixuan Guo, Yan Xu, Yasheng Wang, Weinan Zhang, Yong Yu

單位：上海交通大學、騰訊

論文鏈接：https://arxiv.org/abs/2605.25971

項目地址：https://github.com/AgentACE-AI/ProAct

Demo 頁面：https://agentace-ai.github.io/proact-showcase/

Agent 為什么總像“客服”？

心理學中有一個概念叫前攝應對（Proactive Coping）：人在預判到未來需求時，會提前積攢資源、預做準備，而非等到火燒眉毛才行動。

然而今天絕大多數大模型 Agent，本質上依然是 Reactive Agent：你撥一下，它轉一下；你不問，它就休眠。它們把用戶兩次交互之間的空閑時間當成純粹的空白。

ProAct 的核心主張：空閑時間不是空白，而是被浪費的算力窗口。把一部分工作提前搬到空閑窗口，讓 Agent 在你沉默的時間里主動學習和準備。

ProAct 架構：

從“瞎忙”到“神預判”的三級流水線

如果隨便給 Agent 塞一個后臺搜索的權限，它大概率會變成“智能騷擾”——一有空就瘋狂彈窗，推一堆沒用的信息。ProAct 不是在后臺盲目亂搜，而是設計了一條嚴謹的主動計算流水線：預測 → 篩選 → 交付。

圖 2：ProAct 系統總覽。前臺交互完成后，系統更新持久記憶（用戶畫像、知識庫、對話軌跡），隨即進入空閑期主動計算：Future-State Prediction 預測未來需求，Idle-Time Acquisition 對高價值候選執行定向證據檢索與知識合成，最終由 Utility-Aware Delivery Policy 決定推送、排隊還是靜默存儲。

▎Future-State Prediction：精準錨定未來需求

預測模塊從兩個源頭生成候選需求：

本地場景推斷：從最近幾輪對話中直接推斷可能的后續需求（如安排評審會 → 大概率需要評審材料）

關聯擴展：從持久記憶中的用戶畫像、歷史摘要、未完成目標中擴展相關方向

此外，當記憶層檢測到過時、不完整或證據薄弱的知識條目時，這些記憶缺口也會被轉化為候選需求——讓記憶維護直接驅動信息獲取，而非被動等待查詢。候選經過置信度過濾和去重后，輸出一組緊湊的預測集合。

回到開頭的例子：你剛說完“安排明天的評審會”，預測模塊已經推斷出“需要項目進展材料”和“可能要看風險點”兩個高置信候選。

▎Idle-Time Acquisition：算力花在刀刃上

每一個候選需求，都要經過四維價值打分：

1.用戶相關性（Relevance）：和當前目標關聯多大？

2.知識缺口（Gap）：記憶里是不是已經有答案了？

3.增量價值（Value）：現在準備能省去用戶多少未來的麻煩？

4.時效性（Timeliness）：現在準備時機對嗎？

只有總分超過閾值 θ_val 的候選才真正獲得算力執行。而執行時，系統還做了增量搜索優化：已有的證據直接復用，部分覆蓋的只補缺口，完全沒有的才啟動迭代搜索。這使得空閑計算不是從零開始的全量搜索，而是增量拼圖。

回到評審會的例子：你的項目進展數據上周剛更新過，直接復用；風險評估是空白，系統才啟動定向搜索補上這塊缺口。

▎Utility-Aware Delivery：推還是不推，這是個問題

準備好材料后，ProAct 絕不會無腦彈窗。交付策略基于一個效用公式做決策：

U(x) = E[V(x)] ? C(t)

V 是預期信息價值，C 是打斷用戶的成本。只有當 U 超過自適應閾值 τ 時，系統才決定交付。交付方式分三檔：

Push（主動推送）：價值極高、時機剛好，直接通知（如："我已經把評審材料大綱整理好了，需要展開嗎？"）

Queue（排隊等待）：有用但不緊急，等用戶下次提問時自然融入回復

Store（靜默存儲）：大概率有用但現在不宜打擾，存入長期記憶，等用戶需要時瞬間調出

ProActEval：200 個場景的硬核評測

評估一個主動式 Agent，不能只考“記憶力”，還要考它能不能在你開口前就把活兒干了。為此，論文構建了全新評測基準ProActEval：

200 個場景，覆蓋 40 個領域（金融規劃、軟件發布、網絡安全、搬家、稅務申報……）

每個場景自帶Fact Sheet（12-37 條原子化可驗證事實，全部虛構實體）

每個場景包含5-15 條用戶需求，標注了重要性等級、依賴鏈和可預測性關系

Agent運行時看不到gold label——不能偷看未來需求，只能走一步看一步

實驗設置了三個對比條件：

▎主實驗結果

關鍵觀察：原本需要來回拉扯 8 輪才能完成的任務，現在不到 7 輪搞定；幻覺率暴降近三成——因為有充足的后臺時間做事實檢索，Agent 回答得更準了。

▎對比 ProactiveAgent 基線

論文還將 ProAct 與公開的 ProactiveAgent (Lu et al., 2024) 決策協議做了對比。ProactiveAgent 雖然在 69.6% 的 turn 上都嘗試了主動任務，但方向不對：

這說明：光有“主動嘗試”的意愿遠遠不夠——方向對了才有價值。ProactiveAgent 做了大量主動嘗試但幾乎全部打偏，ProAct 的預測精度使得每一次主動準備都落在用戶真正會問的方向上。

關鍵發現：

算力花在哪，比花多少更重要

論文中設置了一個非常有意思的對照組——Undirected Idle。這個條件同樣在后臺消耗算力（平均每個場景 69.8k active tokens），但因為沒有 Future-State Prediction 的引導，像個無頭蒼蠅一樣亂搜。

結果：它的 T100 僅比純 Reactive 下降 0.07 turns，幾乎沒有改善。而 ProAct 雖然多花了 60% 的 token（111.8k），但換來了 T100 下降 1.2 turns、覆蓋率提升 7.2%、幻覺率下降 28.1% 的全面收益。

空閑時間計算的價值不在于“多算”，而在于“算對地方”。

進一步的搜索預算掃描（k = 4, 8, 12, 16）驗證了這一點。隨著 k 增加，Anticipation Recall 從 0.253 單調上升至 0.432；但 User Effort 并不單調下降——一旦主要的可預測需求被覆蓋，追加搜索追的是邊際越來越低的長尾需求，active-token 成本卻持續攀升。

圖3：搜索預算分析（50 場景子集）。橫軸為搜索預算 k，四個面板分別展示 T100、User Effort、Anticipation Recall 和 Active Token 成本。灰色區段標注了相同預算下 Directed Idle 與 Undirected Idle 的差距——在每一個預算點上，有預測引導的定向搜索都優于無方向的盲目搜索。但隨著預算增加，效率收益趨于平緩而成本持續攀升。

主動計算是一個需要精心設計的操作點權衡（operating-point trade-off），而非越多越好的暴力堆算力。

MemBench：

預測建立在堅實的記憶底座上

在 MemBench 記憶基準測試的反思參與設定中，ProAct 展現了穩健的記憶能力：

這證明 ProAct 的未來預測絕不是憑空猜測，而是建立在對長期用戶偏好和情感狀態的準確推斷之上的。

結論

ProAct 之所以能做到主動預判，不是靠猜，它通過持久記憶持續積累用戶畫像、歷史偏好、實體事實和情感狀態。當這些信息被系統性地組織和推理之后，Agent 在某些維度上甚至比用戶自己更清楚“你下一步會問什么”。

從 ChatGPT 到目前市面上的各類 Agent，交互范式基本停留在“你問我答”。但人類真實的協作從來不是回合制答題。如果說 RAG 讓 Agent 學會了“現查現答”，長期記憶讓 Agent 學會了“銘記過去”，那么 ProAct 試圖補全最后一塊拼圖——面向未來做準備。

回到開頭的場景：當你說完“安排明天的評審會”，一個真正主動的 Agent 就已經在為你準備 PPT 了——不是因為你吩咐了，而是因為它知道你一定會需要。

更好的 Agent 不只是回答得更快，而是在你開口之前就已經在正確的方向上做好了準備。

想親眼看看主動式 Agent 的效果？

訪問 ProAct Demo 頁面：

https://agentace-ai.github.io/proact-showcase/

未經「AI科技評論」授權，嚴禁以任何方式在網頁、論壇、社區進行轉載！

公眾號轉載請先在「AI科技評論」后臺留言取得授權，轉載時需標注來源并插入本公眾號名片。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.