亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Hermes 憑什么兩個(gè)月接棒 OpenClaw?

0
分享至

4月,Hermes Agent憑借“自進(jìn)化”挑戰(zhàn)了OpenClaw的霸主地位。盡管兩者基礎(chǔ)功能高度重合,但Hermes通過(guò)“技能自動(dòng)進(jìn)化”與“主動(dòng)記憶管理”,實(shí)現(xiàn)了從“手動(dòng)配置”到“自主成長(zhǎng)”的跨越。

這種將復(fù)雜度隱藏在底層規(guī)則中的設(shè)計(jì),雖在處理復(fù)雜任務(wù)時(shí)仍有隱患,卻精準(zhǔn)踩中了“干預(yù)遞減”的自動(dòng)化趨勢(shì),為Agent向“伙伴”進(jìn)化搶占了關(guān)鍵生態(tài)位。

———— / BEGIN / ————

進(jìn)入 2026 年 4 月,才火了兩個(gè)月的 OpenClaw (俗稱(chēng)“龍蝦”)就迎來(lái)了它的挑戰(zhàn)者。Hermes Agent 連續(xù)數(shù)周占據(jù) GitHub Trending 榜首,狂攬 22,000 顆星。

它火到什么程度呢?

連 Anthropic 都要抄它的。

4 月 10 日,Nous Research 的創(chuàng)始人 Teknium 跳出來(lái)吐槽,說(shuō) Anthropic 正在「復(fù)制」Hermes 自動(dòng)判斷任務(wù)完成、主動(dòng)提醒用戶(hù)的功能。

社區(qū)敘事也因此非常統(tǒng)一,認(rèn)為 Hermes 憑借自進(jìn)化 Agent、自動(dòng)記憶管理和用戶(hù)建模系統(tǒng),在技術(shù)上全面超越了前任王者 OpenClaw,重新定義了開(kāi)源 Agent 的方向。

不過(guò),如果拋開(kāi)這些宏大敘事,真正把兩邊拆開(kāi)對(duì)比,你會(huì)發(fā)現(xiàn)它們?cè)诠δ苌弦荒R粯拥牡胤剑h(yuǎn)比差異多得多。

比如定時(shí)調(diào)度,兩邊都有。

Hermes 支持人類(lèi)可讀的格式和標(biāo)準(zhǔn)的 cron 表達(dá)式,每個(gè)任務(wù)都跑在隔離的會(huì)話(huà)(session)里。

OpenClaw 也同樣支持 at、every、cron 三種調(diào)度類(lèi)型,任務(wù)直接持久化寫(xiě)進(jìn)本地的 JSON 文件,重啟也不會(huì)丟。

再比如子 Agent 委派,兩邊都有。

Hermes 的 delegate_task 支持單任務(wù)和最多 3 個(gè)并行子任務(wù),子 Agent 環(huán)境完全隔離,干完活只返回一個(gè)摘要。

OpenClaw 的 sub-agent 機(jī)制也支持這種后臺(tái)隔離執(zhí)行和結(jié)果回傳,甚至還能配置嵌套深度。

瀏覽器自動(dòng)化、TTS(語(yǔ)音合成)、Vision 視覺(jué)能力、圖像生成、語(yǔ)音交互,兩邊也全都有。

Gateway 方面,Telegram、Discord、Slack、WhatsApp、Signal 等 20 多個(gè)平臺(tái)的消息集成,兩邊也毫無(wú)懸念地全都有。


對(duì)著清單一項(xiàng)項(xiàng)打勾就會(huì)發(fā)現(xiàn),兩者的功能幾乎完全重合。

所謂功能表上的「絕對(duì)碾壓」根本不存在。

那么問(wèn)題來(lái)了,既然功能都一樣,Hermes 憑什么火成這樣?社區(qū)里被吹上天的「自進(jìn)化」「自動(dòng)記憶」「用戶(hù)建模」,到底有多少是真正的底層結(jié)構(gòu)差異?

會(huì)自己長(zhǎng)大的 Skill

翻遍兩邊的默認(rèn)配置,你能找到的唯一硬核差異就一個(gè),即,Hermes 在 Skill(技能)上實(shí)現(xiàn)了自動(dòng)進(jìn)化的閉環(huán)。

Skill 算是 Agent 的工作流知識(shí)單元,說(shuō)白了就是一個(gè) Markdown 文件,專(zhuān)門(mén)告訴 Agent 遇到某類(lèi)任務(wù)該按什么步驟干、中間調(diào)什么工具、搞砸了怎么救場(chǎng)。

Hermes 把技能的生命周期硬生生劈成了兩截。一截是運(yùn)行時(shí)的靜默生成,另一截是離線(xiàn)的硬核進(jìn)化。

先說(shuō)生成。平時(shí)讓 Agent 干活,只要它在中間調(diào)用了 5 次以上工具,或者出了錯(cuò)又自己把流程救回來(lái)了,再或者你作為用戶(hù)直接糾正了它的輸出,主倉(cāng)庫(kù)里一套寫(xiě)死的硬規(guī)則就會(huì)被觸發(fā)。Agent 會(huì)默默把剛才那套跑通的工作流打個(gè)包,存成本地的 SKILL 文件。這一步完全靜默,很多時(shí)候你根本不知道它又給自己寫(xiě)了個(gè)新技能。


等下次再遇到類(lèi)似任務(wù),它會(huì)自動(dòng)去掃索引。這個(gè)加載過(guò)程分四層漸進(jìn),就像去圖書(shū)館找資料。它先看目錄卡片(Tier 0),只把名稱(chēng)和描述塞進(jìn)系統(tǒng)提示詞里,大概占 3,000 個(gè) token。方向?qū)α耍僦饘尤?shū)架拿書(shū),把完整內(nèi)容展開(kāi)。

但真正讓 Hermes 拉開(kāi)身位的,是第二步的進(jìn)化。

Hermes 內(nèi)置了一套離線(xiàn)批量進(jìn)化算法,還專(zhuān)門(mén)拉了一個(gè)獨(dú)立倉(cāng)庫(kù)(hermes-agent-self-evolution)。引擎用的是 DSPy 框架,加上一套叫 GEPA 的核心算法。

GEPA 的全稱(chēng)是 Genetic-Pareto Prompt Evolution。這套體系并非 Hermes 自創(chuàng),出自 Lakshya Agrawal 等人的一篇 ICLR 2026 Oral 論文,標(biāo)題就叫《反思性提示詞進(jìn)化可以跑贏強(qiáng)化學(xué)習(xí)》。

現(xiàn)在的學(xué)術(shù)圈搞技能進(jìn)化,大部分都在走 RL(強(qiáng)化學(xué)習(xí))的路線(xiàn)。像 SkillRL 或者 SAGE 這些框架,連名字都帶著 RL,指望用梯度更新來(lái)強(qiáng)化技能庫(kù)。但 GEPA 走了一條完全對(duì)立的路,刻意拋棄了強(qiáng)化學(xué)習(xí)。GEPA 論文本身就是在證明一件事,哪怕沒(méi)有梯度更新,靠大模型的反思能力加上進(jìn)化算法,不僅能跑贏 RL,樣本利用效率還更高。

它是怎么做的呢?

這套算法有三個(gè)硬核的底座。

首先是反思性變異(Reflective mutation)。它不是瞎猜式的隨機(jī)變異。大模型會(huì)去讀之前的執(zhí)行軌跡(trace),自己反思這次為什么做對(duì)了,為什么做錯(cuò)了,提示詞到底該改哪幾個(gè)字。

其次是帕累托前沿選擇(Pareto frontier selection)。生成了一批變異的候選技能后,它不是一刀切只留全局均分最高的。只要某個(gè)候選在哪怕一個(gè)評(píng)估樣本上表現(xiàn)最強(qiáng),它就會(huì)被保留下來(lái)。這么做是為了保證技能探索的多樣性和魯棒性。

最后是自然語(yǔ)言反饋?zhàn)鳛樽儺愋盘?hào)。傳統(tǒng) RL 靠數(shù)值 reward 引導(dǎo)參數(shù)更新,但數(shù)值信號(hào)顆粒度太粗,跑了一次得 0.6 分,你根本不知道是哪里對(duì)哪里錯(cuò)。

GEPA 的每次變異用的都是具體的自然語(yǔ)言反饋,比如「這一步?jīng)]檢查邊界條件」「應(yīng)該先讀配置再寫(xiě)緩存」。LLM 讀得懂這種反饋并據(jù)此產(chǎn)生下一輪變體,比解讀一個(gè)浮點(diǎn)數(shù)有效得多。

把它串成工作流就是這樣。系統(tǒng)定期去讀現(xiàn)有的 SKILL 文件,去歷史會(huì)話(huà)里抽樣(或者干脆自己合成)搞出一個(gè)評(píng)估集。然后 GEPA 介入,看執(zhí)行軌跡,反思提意見(jiàn),生成候選變體,跑一輪評(píng)估,最后用帕累托算法挑出贏家。


這套離線(xiàn)的進(jìn)化閉環(huán)跑完,得出優(yōu)化后的 Skill 后,它不會(huì)直接覆蓋原文件,而是老老實(shí)實(shí)生成一個(gè) PR(Pull Request),必須要等你作為人類(lèi)審核員點(diǎn)頭合并,這個(gè)進(jìn)化的技能才會(huì)真正生效。系統(tǒng)永遠(yuǎn)不會(huì)進(jìn)行直接提交。

這直接戳破了社區(qū)里那套「用戶(hù)完全無(wú)需介入」的爽文神話(huà)。Hermes 的態(tài)度其實(shí)很明確,技能生成可以全自動(dòng)且靜默,但技能進(jìn)化必須過(guò)人眼。

回過(guò)頭看看 OpenClaw。它也不是沒(méi)有 Skill 系統(tǒng),但要命的是每一步都得靠你主動(dòng)。你需要手動(dòng)建文件、手動(dòng)安裝、再手動(dòng)授權(quán),三個(gè)條件湊齊了技能才會(huì)生效。搞了個(gè)新 Skill 還得重啟它統(tǒng)一管理的 Gateway 網(wǎng)關(guān)進(jìn)程,系統(tǒng)才能認(rèn)得出。

而且它的加載極其簡(jiǎn)單粗暴,根本不做任務(wù)匹配,只要配了就全量塞進(jìn)上下文里,除非你手動(dòng)加個(gè)禁用標(biāo)簽把它踢出去。

兩邊都有 Skill。真正的區(qū)別就在于誰(shuí)來(lái)按下啟動(dòng)鍵。

Hermes 說(shuō)「放著我來(lái)」,OpenClaw 說(shuō)「你自己搞」。

誰(shuí)在替誰(shuí)記事

如果說(shuō) Skill 解釋了 Hermes 為什么「越用越快」,那社區(qū)里傳得神乎其神的另一半敘事「它懂我是誰(shuí)」,就得歸功于記憶系統(tǒng)了。

現(xiàn)在的三大主流 Agent(Claude Code、OpenClaw、Hermes)其實(shí)都有自動(dòng)記憶。但只要稍微深挖就會(huì)發(fā)現(xiàn),它們服務(wù)的對(duì)象、觸發(fā)機(jī)制和記憶保質(zhì)期完全是兩碼事。

先說(shuō) Claude Code。

它的自動(dòng)記憶(auto-memory)是默認(rèn)開(kāi)著的,平時(shí)干活時(shí)會(huì)自動(dòng)把構(gòu)建命令、調(diào)試經(jīng)驗(yàn)、架構(gòu)筆記甚至代碼風(fēng)格都記下來(lái),而且每 24 小時(shí)就跑一次 Auto Dream 來(lái)整理,把過(guò)期或者自相矛盾的東西清掉。

聽(tīng)起來(lái)很智能,但這套系統(tǒng)有著極其嚴(yán)格的項(xiàng)目隔離。

它的邊界卡死在 git root(項(xiàng)目根目錄)上,項(xiàng)目 A 里學(xué)到的血淚教訓(xùn),絕對(duì)帶不到項(xiàng)目 B 里。它不記你的個(gè)人偏好,不關(guān)心坐在屏幕對(duì)面的是誰(shuí),腦子里只有「這個(gè)項(xiàng)目該怎么跑」。

再說(shuō) OpenClaw,它的記憶系統(tǒng)就更偏長(zhǎng)程。每次啟動(dòng)對(duì)話(huà),它都會(huì)把包括 MEMORY.md 和 USER.md 在內(nèi)的 8 個(gè)底層文件強(qiáng)制灌進(jìn)自己的腦子里。這兩個(gè)文件不僅跨項(xiàng)目共享,而且會(huì)自動(dòng)寫(xiě)入。

那它是怎么寫(xiě)入的呢?

它的寫(xiě)入機(jī)制極其被動(dòng),更像兜底。

在每次對(duì)話(huà)的上下文(token)快要撐爆、系統(tǒng)準(zhǔn)備做大壓縮(compaction)之前,Agent 會(huì)悄悄跑一個(gè) silent turn(隱藏輪次)。它會(huì)在這個(gè)輪次里,把當(dāng)前聊過(guò)的重點(diǎn)隨手記到當(dāng)天的日記文件里,同時(shí)把關(guān)于你的偏好寫(xiě)進(jìn)長(zhǎng)期掛載的 MEMORY.md 或 USER.md。

所以你很久沒(méi)用 OpenClaw,隔幾天一打開(kāi)發(fā)現(xiàn)它「居然還記得你是誰(shuí)」,靠的就是這張被動(dòng)結(jié)成的長(zhǎng)期大網(wǎng),那些偏好早就被塞進(jìn)了幾個(gè)啟動(dòng)必讀的文件里。

這確實(shí)能讓人產(chǎn)生「這 AI 可以養(yǎng)」的實(shí)感。但本質(zhì)上更像是一種求生本能,眼看腦子裝不下了趕緊存一下檔。

至于那些老舊日記,如果不用外掛的語(yǔ)義向量數(shù)據(jù)庫(kù)支持,它只能靠關(guān)鍵詞生搜。

在這個(gè)維度上 Hermes 是另一套邏輯。

在 v0.7 版本之前,Honcho 是 Hermes 里唯一寫(xiě)死的長(zhǎng)期記憶后端,沒(méi)有別的選項(xiàng)。

這個(gè)之前是默認(rèn)選項(xiàng)的 Honcho 設(shè)計(jì)得很巧妙。絕大多數(shù) Agent 的記憶系統(tǒng)(包括 Hermes 的默認(rèn)內(nèi)置記憶)本質(zhì)上是一個(gè)被動(dòng)的記錄儀。你聊了什么,它切碎了轉(zhuǎn)成向量塞進(jìn)數(shù)據(jù)庫(kù),下次遇到相似的話(huà)題再通過(guò)計(jì)算距離(Embedding 余弦相似度)撈出來(lái)。

Honcho 不走這條路。它是一個(gè)「AI 原生」的記憶后端,主打的是異步的辯證推理(Dialectic reasoning)和深度實(shí)體建模。

你跟 Agent 聊完天,主會(huì)話(huà)結(jié)束了,但 Honcho 的活才剛開(kāi)始。它會(huì)在后臺(tái)拉起額外的模型調(diào)用,對(duì)剛聊完的歷史進(jìn)行分析,提煉出你話(huà)里的概念(Entity),提取底層偏好,甚至把你前后矛盾的話(huà)進(jìn)行辯證和對(duì)齊。它把你隨口說(shuō)出的碎碎念,計(jì)算成結(jié)構(gòu)化的「洞察(Insight)」。

聽(tīng)著非常先進(jìn),但它也非常費(fèi) token,容易把關(guān)鍵細(xì)節(jié)給洗掉。設(shè)成插件,更安全。

但就算沒(méi)有 Honcho,Hermes 的記憶寫(xiě)入都比 OpenClaw 主動(dòng)得多。

Hermes 搞了個(gè)微調(diào)(nudge)機(jī)制,根本不等腦子撐爆,大概每聊 15 輪對(duì)話(huà)就會(huì)被硬性觸發(fā)一次。這就是系統(tǒng)強(qiáng)制塞給 Agent 的一條反思指令,趕緊回顧一下剛才聊的,看看這人有什么習(xí)慣值得記一筆。

這種高頻的主動(dòng)反思,讓 Hermes 在同等時(shí)間里寫(xiě)進(jìn)持久文件的信息量大得驚人。

不僅寫(xiě)入更積極,Hermes 找回記憶的手法也更硬。它在默認(rèn)架構(gòu)里內(nèi)置了 SQLite FTS5 的全文檢索能力。不用再去費(fèi)勁配什么詞向量服務(wù),Agent 想翻舊賬,直接就能去龐大的過(guò)往聊天記錄里掃街。

把這三家擺在一起看,那條進(jìn)化線(xiàn)就清晰了。

OpenClaw 是一套被動(dòng)觸發(fā)的長(zhǎng)期記憶體系。Claude Code 做到了主動(dòng)記錄和整理但底線(xiàn)是對(duì)事不對(duì)人。而 Hermes 把觸發(fā)時(shí)機(jī)做得極其主動(dòng),記憶插件隨意切,全局共享,還默認(rèn)配齊了能翻遍所有歷史的檢索利器。


日常用起來(lái)的體感差異也就是這么拉開(kāi)的。OpenClaw 是在快崩潰前才想起來(lái)認(rèn)識(shí)你一下。Hermes 則是每隔一會(huì)兒就在暗中揣摩你的心思,并且能隨時(shí)翻出你們倆說(shuō)過(guò)的話(huà)。

把復(fù)雜度藏起來(lái)

無(wú)論是 Skill 的自生成,還是記憶的高頻主動(dòng)寫(xiě)入,背后指的其實(shí)都是同一件事,即,Hermes 只是替你把本該你做的決定都做了。

但是系統(tǒng)復(fù)雜度這種東西是守恒的。

你不用動(dòng)手,不代表決策憑空消失了,它只是從你的手動(dòng)操作轉(zhuǎn)移到了底層硬編碼的死規(guī)則里。


在搭這套 harness 的過(guò)程里,Hermes 的設(shè)計(jì)者領(lǐng)悟了一個(gè)道理,模型判斷不可信,那就做成死規(guī)則。

這套 harness 遠(yuǎn)比 Anthropic 之類(lèi)的要死。Agent 干活的時(shí)候并不是一個(gè)純粹的大模型在裸跑思考,大模型外面嚴(yán)嚴(yán)實(shí)實(shí)地包著一層代碼框架,這層框架里寫(xiě)滿(mǎn)了條件判斷。

工具調(diào)用滿(mǎn) 5 次了嗎?對(duì)話(huà)輪數(shù)湊夠 15 輪了嗎?剛才是不是剛死里逃生重試了一次?用戶(hù)有沒(méi)有明確開(kāi)口指出錯(cuò)誤?這些問(wèn)題系統(tǒng)根本不打算交給大模型去模糊判斷,而是用確定性的代碼一條條死盯。條件一滿(mǎn)足,立刻執(zhí)行寫(xiě)好的動(dòng)作,去生成初始技能,或者硬塞反思指令,再或者把某句話(huà)記進(jìn)長(zhǎng)期文件里。

這些遍布各處的防御網(wǎng),就是被轉(zhuǎn)移走的那部分復(fù)雜度。本來(lái)該由用戶(hù)在使用過(guò)程中自我規(guī)范,現(xiàn)在全寫(xiě)死在 Hermes 的代碼里。

而 Hermes 寫(xiě)這些規(guī)則依靠的就是設(shè)計(jì)判斷。調(diào)用 5 次工具觸發(fā)技能生成,設(shè)成 3 次太容易誤觸發(fā),設(shè)成 8 次又可能漏掉有價(jià)值的工作流。每 15 輪反思一次,而不是每輪都反思,因?yàn)槟菚?huì)產(chǎn)生海量垃圾記憶且燒錢(qián)。

你坐在屏幕前覺(jué)得什么都不用管真爽,背后是 Hermes 的開(kāi)發(fā)團(tuán)隊(duì)提前把所有判斷邏輯替你寫(xiě)死了。

自動(dòng)化并沒(méi)有消滅決策,它只是把決策藏到了看不見(jiàn)的地方。

為了保證這套硬規(guī)則在沒(méi)有人類(lèi)盯著的時(shí)候不翻車(chē),Hermes 在底層做了一系列防御性設(shè)計(jì)。

首先看上下文管理。

當(dāng)對(duì)話(huà)撐到 85% 閾值時(shí),Hermes 根本不叫大模型來(lái)做智能摘要,它的 ContextCompressor 就是一套純粹的字符串替換邏輯,把舊的工具輸出直接換成一個(gè)占位符,粗暴但絕對(duì)安全。

而記憶層面它用的是凍結(jié)快照,開(kāi)機(jī)時(shí)把記憶一次性倒進(jìn)系統(tǒng)提示詞里,中途不刷新,等下次重啟才生效。這犧牲了實(shí)時(shí)性,但換來(lái)了前綴緩存穩(wěn)定的命中率,直接砍掉了大概 75% 的 token 輸入成本。

兩個(gè)選擇的精神一致,session 內(nèi)部不讓 LLM 去做關(guān)于上下文和記憶的動(dòng)態(tài)判斷,用最笨的規(guī)則保住確定性。

再看它的安全審查。

內(nèi)置的 Smart 審批模式同樣不讓大模型當(dāng)裁判去判斷一條命令危不危險(xiǎn),而是直接拿一套硬編碼的黑名單去正則匹配終端操作。匹配中就必須人類(lèi)點(diǎn)頭確認(rèn)。

它甚至連搞生態(tài)擴(kuò)展的插件系統(tǒng),都把開(kāi)發(fā)者當(dāng)成了潛在敵人。Event Hooks 系統(tǒng)里有 6 種鉤子,其中 5 種全都是觸發(fā)即忘(fire-and-forget)的看客,系統(tǒng)根本不管它們的返回值。想修改 Agent 的運(yùn)行上下文只有一個(gè)唯一的注入點(diǎn)。官方死死卡住一條底線(xiàn),就算插件代碼跑崩了也絕不拖垮 Agent 的主循環(huán)。

這幾個(gè)看似保守的選擇,底層邏輯高度一致。

今年初 Chroma 團(tuán)隊(duì)做過(guò)多輪對(duì)話(huà)壓測(cè),單輪變多輪后,模型平均性能直接掉 39%,最慘能掉 85%。同一時(shí)期的記憶綜述論文也指出,在超長(zhǎng)上下文施壓下,死板的規(guī)則化跑分愣是碾壓了讓大模型全權(quán)統(tǒng)管的方案。

說(shuō)白了,當(dāng)大模型駕馭超長(zhǎng)上下文的底子還虛的時(shí)候,那些聽(tīng)起來(lái)越智能的統(tǒng)管方案越容易原地爆炸。反倒是越笨的死規(guī)則越靠得住。在平時(shí)跑任務(wù)的環(huán)境里,不翻車(chē)才是最高優(yōu)先級(jí)。這是一個(gè)誠(chéng)實(shí)的工程判斷。

一條「干預(yù)遞減」的光譜

把這幾家串起來(lái)看,不管是自動(dòng)寫(xiě)技能、主動(dòng)存記憶,還是故意退一步的技術(shù)棧選擇,最終落點(diǎn)都是同一個(gè)產(chǎn)品判斷,到底該讓用戶(hù)管多少事?

從 Claude Code 和 Codex,到 OpenClaw,再到 Hermes,市面上的開(kāi)源 Agent 其實(shí)鋪成了一段清晰的光譜。一端是「所有決定都由人來(lái)做」的生產(chǎn)工具,必須讓開(kāi)發(fā)者看 diff、批命令、盯每一步。

在真實(shí)業(yè)務(wù)里精確控制永遠(yuǎn)是第一順位,這不是技術(shù)不到位,是產(chǎn)品定位決定的。另一端是「全都交給 Agent 包辦」的自動(dòng)化工具。

Hermes 直接站在了最遠(yuǎn)那頭。


它押注的是大部分用戶(hù)既不想弄懂、也不屑于弄懂 Agent 怎么跑起來(lái)。你只管張嘴提需求,技能匹配、記憶分類(lèi)、上下文壓縮,全都在陰影里完成。它的野心不是讓你覺(jué)得它好用,而是讓它在不知不覺(jué)中自己越變?cè)胶谩?/p>

扛不住硬活,但方向?qū)α?/strong>

盡管 Hermes 已經(jīng)很克制,用各種技術(shù)保守的規(guī)則系統(tǒng)剝奪了模型的自由判定權(quán),以使這個(gè)更自動(dòng)化的系統(tǒng)能夠穩(wěn)定。就放了這么點(diǎn)非規(guī)則的權(quán)限,模型就開(kāi)始拉垮。

重災(zāi)區(qū)就是那套引以為傲的技能系統(tǒng)。不止一個(gè)高階玩家抱怨,自己花好幾個(gè)小時(shí)手動(dòng)精調(diào)出來(lái)的技能,被全自動(dòng)的進(jìn)化流程直接覆蓋掉,這完全是沒(méi)法接受的災(zāi)難。

自動(dòng)記憶微調(diào)的機(jī)制同樣經(jīng)不起細(xì)看。nudge 的本質(zhì)是讓 Agent 自己判斷這輪有沒(méi)有值得記的,但社區(qū)發(fā)現(xiàn) Hermes 判斷自己「是否完成了任務(wù)」時(shí)幾乎總覺(jué)得自己成功了。所以反思出來(lái)的記憶,非常薄弱。

如果是拿去擬一份核心合同、過(guò)一遍底層代碼、或者搭復(fù)雜的財(cái)務(wù)模型,全自動(dòng)模式本身就是一個(gè)巨大的隱患。這也是那些老牌專(zhuān)業(yè)工具不敢直接上全自動(dòng)的原因,專(zhuān)業(yè)人士是會(huì)為 Agent 的腦抽付出真金白銀代價(jià)的。

但在寫(xiě)寫(xiě)周報(bào)、翻翻天氣、或者理一理本地文件這種容錯(cuò)率極高的日常重復(fù)任務(wù)里,Hermes 現(xiàn)在確實(shí)能站得住。只要你給它二十幾次迭代的機(jī)會(huì),那些慢慢攢起來(lái)的技能和記憶,確實(shí)能讓它跑得又穩(wěn)又快。

這實(shí)打?qū)嵉捏w感,足夠它圈住第一波忠實(shí)用戶(hù)了。

更重要的是,它踩在了一個(gè)基本確定的方向上。

梳理這兩個(gè)月的發(fā)展,你會(huì)看到一條非常有意思的演進(jìn)弧線(xiàn)。


2026 年2月25日 Hermes 首發(fā),打出的旗號(hào)是「與你共同成長(zhǎng)的 Agent」。它靠著主動(dòng)記憶、自動(dòng)進(jìn)化和強(qiáng)行替用戶(hù)做決定的激進(jìn)路線(xiàn),一口氣沖到了 57,200 顆星。

但到了4月3日發(fā)布的 v0.7 韌性更新里,它其實(shí)悄悄往回撤了半步。Hermes 引入了抽象接口,把原本寫(xiě)死在系統(tǒng)里的唯一高級(jí)記憶后端 Honcho,降級(jí)成了和新接入的 MEM0、ByteRover 等 6 個(gè)第三方服務(wù)平起平坐。反而把最原始的純文件加全文檢索頂成了默認(rèn)兜底方案。

一個(gè)自稱(chēng)替你決定一切的系統(tǒng),主動(dòng)把復(fù)雜的方案剝離,把記憶的選擇權(quán)交還給了用戶(hù)。這是先行者在撞上社區(qū)真實(shí)投訴后的一種戰(zhàn)略讓步。

Hermes撤回一點(diǎn),覺(jué)得現(xiàn)在的規(guī)則系統(tǒng)還吃不透所有復(fù)雜場(chǎng)景,有些選擇不必強(qiáng)行替用戶(hù)做。

而另一邊的 OpenClaw,動(dòng)作卻是截然相反的補(bǔ)課式加強(qiáng)。過(guò)去短短幾天里它連跑兩步。

4月5日放出了類(lèi)似 Claude Auto Dream 一樣的 Dreaming 做離線(xiàn)記憶整理,把已有的短期流水文檔在離線(xiàn)時(shí)段提煉、評(píng)分、晉升為持久的 MEMORY.md 條目。

4月10日的更新里,它又砸出 Active Memory,直接在主回復(fù)前跑一個(gè)專(zhuān)門(mén)的記憶子 Agent。這套大模型做裁判的主動(dòng)派打法,粒度比 Hermes 固定 15 輪一次的微調(diào)還要細(xì)、還要聰明。

這說(shuō)明,不管是 Anthropic 還是 OpenClaw,大家全都在往「替你做決定」這條路上靠。

Hermes 只不過(guò)是下注下得最早,也最狠。

它用兩個(gè)月的時(shí)間死死卡住了全自動(dòng) Agent 的敘事高地和用戶(hù)心智。當(dāng) OpenClaw 在后面拼命追趕、用更高級(jí)的子 Agent 補(bǔ)齊主動(dòng)記憶機(jī)制的時(shí)候,心智已立的 Hermes 反而有了謹(jǐn)慎和退讓的余裕。

它賭的不是今天的系統(tǒng)能有多完美,而是在提前做一場(chǎng)局。

它算準(zhǔn)了只要底層模型的上下文能跨過(guò)那條及格線(xiàn),今天這些硬湊出來(lái)的規(guī)則安全線(xiàn)就能跟著往上漲,快照可以實(shí)時(shí)刷新,硬編碼條件也能放心交給大模型去判斷。那些看似保守的默認(rèn)層,遲早有一天會(huì)徹底吃掉今天顯得高大上的接口層。

先占生態(tài)位,再等技術(shù)升級(jí)。等到質(zhì)變那天,Hermes 早已經(jīng)攥著真實(shí)用戶(hù)、技能生態(tài)和記憶底座站在終點(diǎn)了。

Agent 這片修羅場(chǎng)里,誰(shuí)先在技術(shù)將將夠用的時(shí)候用兜底工程卡住位置、讓產(chǎn)品能用起來(lái),往往比單純的技術(shù)領(lǐng)先管用得多。

Manus 是這樣,OpenClaw 是這樣,如今的 Hermes 也是這樣。

本文來(lái)自公眾號(hào):騰訊科技 作者:博陽(yáng) 編輯:徐青陽(yáng)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美軍轟炸40天,不如美軍封鎖5天,伊朗主動(dòng)開(kāi)放霍爾木茲海峽

美軍轟炸40天,不如美軍封鎖5天,伊朗主動(dòng)開(kāi)放霍爾木茲海峽

民間胡扯老哥
2026-04-18 05:11:45
英海上貿(mào)易行動(dòng)辦公室:霍爾木茲海峽附近發(fā)生多起船只遇襲事件

英海上貿(mào)易行動(dòng)辦公室:霍爾木茲海峽附近發(fā)生多起船只遇襲事件

界面新聞
2026-04-18 22:59:17
5大超巨同登一陣!NBA最恐怖時(shí)代降臨,這支新王要統(tǒng)治未來(lái)10年!

5大超巨同登一陣!NBA最恐怖時(shí)代降臨,這支新王要統(tǒng)治未來(lái)10年!

茅塞盾開(kāi)本尊
2026-04-18 14:06:38
建國(guó)后第一個(gè)撤銷(xiāo)的省是?平原省

建國(guó)后第一個(gè)撤銷(xiāo)的省是?平原省

《中國(guó)國(guó)家歷史》
2026-04-17 19:49:05
它靠“能忍”成為最長(zhǎng)壽脊椎動(dòng)物:青春期心臟就嚴(yán)重病變,也不耽誤活到四百歲

它靠“能忍”成為最長(zhǎng)壽脊椎動(dòng)物:青春期心臟就嚴(yán)重病變,也不耽誤活到四百歲

尹燁
2026-04-16 07:33:44
0-1落后,杜蘭特如果率領(lǐng)火箭擊敗湖人晉級(jí),那么將成為NBA的GOAT

0-1落后,杜蘭特如果率領(lǐng)火箭擊敗湖人晉級(jí),那么將成為NBA的GOAT

鐵甲西奇
2026-04-19 14:51:51
許家印不是在宴請(qǐng)何小鵬,他是在演示什么叫權(quán)力

許家印不是在宴請(qǐng)何小鵬,他是在演示什么叫權(quán)力

超先聲
2026-04-18 09:48:51
四川省副省長(zhǎng)徐芝文,已任西藏自治區(qū)黨委常委、宣傳部部長(zhǎng)

四川省副省長(zhǎng)徐芝文,已任西藏自治區(qū)黨委常委、宣傳部部長(zhǎng)

新京報(bào)
2026-04-18 16:07:30
“魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

“魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

胖胖說(shuō)他不胖
2026-04-18 09:00:31
9歲小酒窩職業(yè)假笑濃妝營(yíng)業(yè),評(píng)論區(qū)差評(píng)一片,董璇后悔了嗎?

9歲小酒窩職業(yè)假笑濃妝營(yíng)業(yè),評(píng)論區(qū)差評(píng)一片,董璇后悔了嗎?

蒂蒂茱家
2026-04-17 15:28:38
定了!4月17日發(fā)改委官宣:工資假期收入全上調(diào)

定了!4月17日發(fā)改委官宣:工資假期收入全上調(diào)

夜深?lèi)?ài)雜談
2026-04-19 10:01:09
“不差錢(qián)”的DeepSeek要融資了?投資人:或?yàn)槠跈?quán)定價(jià)留人才

“不差錢(qián)”的DeepSeek要融資了?投資人:或?yàn)槠跈?quán)定價(jià)留人才

第一財(cái)經(jīng)資訊
2026-04-19 13:10:09
老同學(xué)聚會(huì)班花陰陽(yáng)我:同學(xué)中就屬你混得差,我:你爸都是我員工

老同學(xué)聚會(huì)班花陰陽(yáng)我:同學(xué)中就屬你混得差,我:你爸都是我員工

紅豆講堂
2025-04-23 11:05:46
歷經(jīng)27年艱難談判,中國(guó)最終做出讓步,中吉烏鐵路為何非修不可?

歷經(jīng)27年艱難談判,中國(guó)最終做出讓步,中吉烏鐵路為何非修不可?

霽寒飄雪
2026-04-18 09:35:22
梅德韋杰夫和紹伊古威脅打擊歐洲國(guó)家,這說(shuō)明什么?

梅德韋杰夫和紹伊古威脅打擊歐洲國(guó)家,這說(shuō)明什么?

山河路口
2026-04-17 16:38:44
八千里路云和月:黃長(zhǎng)官用孫懷義的死算計(jì)張?jiān)瓶胖∮駤扇朦h

八千里路云和月:黃長(zhǎng)官用孫懷義的死算計(jì)張?jiān)瓶胖∮駤扇朦h

慢半拍sir
2026-04-19 11:19:01
再扮霸王亮相“蘇超”,何潤(rùn)東回應(yīng)為何不騎馬

再扮霸王亮相“蘇超”,何潤(rùn)東回應(yīng)為何不騎馬

中國(guó)日?qǐng)?bào)
2026-04-19 15:09:22
她因長(zhǎng)得漂亮,被日本兵拖進(jìn)炮樓,一晚上遭受50多個(gè)鬼子的折磨

她因長(zhǎng)得漂亮,被日本兵拖進(jìn)炮樓,一晚上遭受50多個(gè)鬼子的折磨

凡人聊史
2026-04-11 03:06:57
一戰(zhàn)成名!阿森納棄將成曼聯(lián)鐵閘,200萬(wàn)歐身價(jià)平替6000萬(wàn)歐約羅

一戰(zhàn)成名!阿森納棄將成曼聯(lián)鐵閘,200萬(wàn)歐身價(jià)平替6000萬(wàn)歐約羅

體壇鑒春秋
2026-04-19 11:51:09
阿斯:皇馬去年12月就想換掉阿隆索,如今認(rèn)為白白浪費(fèi)一個(gè)月

阿斯:皇馬去年12月就想換掉阿隆索,如今認(rèn)為白白浪費(fèi)一個(gè)月

懂球帝
2026-04-19 04:48:55
2026-04-19 15:43:00
人人都是產(chǎn)品經(jīng)理社區(qū) incentive-icons
人人都是產(chǎn)品經(jīng)理社區(qū)
想要成為大牛先從學(xué)做產(chǎn)品開(kāi)始
64641文章數(shù) 311586關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類(lèi)紀(jì)錄!300臺(tái)機(jī)器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒(méi)法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂(lè)要聞

張?zhí)鞇?ài)評(píng)論區(qū)淪陷!被曝卷入小三風(fēng)波

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車(chē)要聞

29分鐘大定破萬(wàn) 極氪8X為什么這么多人買(mǎi)?

態(tài)度原創(chuàng)

藝術(shù)
本地
教育
健康
公開(kāi)課

藝術(shù)要聞

當(dāng)代著名畫(huà)家 | 全山石人物油畫(huà)23幅

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

教育要聞

陜西某中學(xué)家長(zhǎng)集體白嫖演出服,給孩子們上了最壞的一課

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版