无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Python逆天改命!開源Hermes首次擊敗OpenAI Codex

0
分享至


新智元報道


【新智元導(dǎo)讀】一個純Python寫的開源項目,竟把OpenAI用Rust寫的王牌給秒了!最終戰(zhàn)績6比5,Hermes直接上演工程暴力美學(xué),解釋型語言終于逆天改命。

一個純Python寫的開源項目,竟擊潰了OpenAI王牌!

今天,全網(wǎng)都被Hermes Agent的硬核實力狠狠刷屏了:

在針對真實世界CLI任務(wù)的11項基準(zhǔn)測試中,它以6:5的戰(zhàn)績,直接把Codex按在地上摩擦。


在這場備受矚目的對決中,Hermes Agent展現(xiàn)出了驚人的底層優(yōu)化能力。

通過一連串的硬核操作,成功把系統(tǒng)的啟動時間,從701ms縮短至258ms。


更讓人震撼的是,Hermes完全由Python編寫,而Codex是用Rust寫的。

這一仗,Python打贏了Rust!

這在編程界,屬是「逆天改命」了。



三大狠招,砍掉63%啟動時間

就在這次優(yōu)化之前,Hermes還是5-6落后的那個。

這次逆轉(zhuǎn)不是靠換模型、不是靠堆算力,而是靠三個純工程優(yōu)化,刀刀見血。


那么,它是具體如何做到的?

第一刀:Bitwarden磁盤緩存

原來Hermes每次啟動都會調(diào)用Bitwarden Secrets Manager的API去拉取憑據(jù),一次就是380毫秒。

問題在于,之前的緩存是「純進程內(nèi)」,連續(xù)執(zhí)行兩次hermes chat -q,第二次還是要重新拉。

解決方案是,加了一個L2磁盤緩存。

緩存文件權(quán)限鎖死0600,存放在 /cache/bws_cache.json ,默認TTL 300秒。

另外,訪問token本身絕不落盤,默認300秒TTL,過期才重新拉取。

一刀砍掉380ms。


第二刀:模型目錄延遲加載

hermes_cli.models._PROVIDER_MODELS,一個包含所有AI供應(yīng)商模型信息的巨型字典。

之前在模塊加載時就急切導(dǎo)入,吃掉約55ms。

實際上只有model_flow相關(guān)的處理函數(shù)才需要它。

團隊用PEP 562的模塊級getattr實現(xiàn)了懶加載,只在真正訪問模型目錄時才付出這筆開銷。。

這一步,又省了55毫秒。

第三刀:配置文件去重

main.py頂部原本讀了兩次config.yaml

一次yaml.safe_load用于密鑰脫敏橋接,一次完整的load_config()(含深度合并)只為檢查一個布爾值。

合并成一次原始加載,省下17ms。

這三刀加起來, 啟動時間從701ms暴降至258ms,降幅63%。

不得不說,這才是真正的工程暴力美學(xué),純靠profiling找到瓶頸,一刀一刀切掉冗余。


戰(zhàn)績6:5,Hermes翻盤時刻

最終結(jié)果,是不會說謊的。

在優(yōu)化前,Hermes對Codex的總戰(zhàn)績是5勝6負:單輪任務(wù)被Codex壓制,多輪任務(wù)略有優(yōu)勢但不夠明顯。

優(yōu)化后,局面徹底反轉(zhuǎn)。

單輪任務(wù)(8項):Hermes的中位框架開銷,降到了與Codex持平甚至略低的水平。

原本被Codex碾壓的啟動劣勢,被完全抹平。

多輪任務(wù)(3項):Hermes在5輪對話的總開銷上已經(jīng)領(lǐng)先,優(yōu)化后優(yōu)勢進一步拉大。


最后的總分,6:5,Hermes實現(xiàn)了反超。

這意味著,一個用Python寫的開源項目,在框架開銷——

一個最考驗底層功力的維度,擊敗了用Rust寫的、背后站著萬億市值公司的閉源產(chǎn)品。


Python,打贏了Rust

真正反直覺的部分在于,Python憑什么贏下Rust?

長期以來,Python在性能圈幾乎是「原罪」般的存在:解釋型語言、GIL鎖、動態(tài)類型開銷……

當(dāng)OpenAI選擇用Rust構(gòu)建Codex CLI時,所有人都覺得理所當(dāng)然——

Rust生來,就是為性能而生的。


但Hermes的這次逆襲說明了一個關(guān)鍵事實:

在Agent這個賽道上,框架層面的架構(gòu)決策,比語言層面的原始速度更重要。

開發(fā)者netrunner的評論一針見血,「Python在多輪任務(wù)上打贏Rust,本質(zhì)上是架構(gòu)決策的勝利,而不是語言速度的勝利」。

「Codex可能在上下文處理上,過度工程化了」。


還有人問道,「為何不把Hermes也遷移到Rust?那不是更快」?

Hermes聯(lián)創(chuàng)兼首席科學(xué)家Teknium直言,「那樣就無法編輯代碼,以及實時改進和迭代」

也就是說,Python的優(yōu)勢不在于快,而在于活。


對于一個需要持續(xù)進化、從每次交互中學(xué)習(xí)的Agent來說,開發(fā)者友好性和迭代速度,就是最大的性能優(yōu)勢。

GitHub沖爆16.7萬星

硬剛?cè)f億巨頭

Hermes Agent的爆發(fā)速度,本身就是一組讓人瞠目的數(shù)據(jù)。

從2026年2月25日上線至今,僅僅三個月,GitHub星標(biāo)已經(jīng)突破16萬。

日活Token消耗量達到353B,是同類項目OpenClaw的近兩倍。

可以說,它是2026年增長最快的開源Agent框架,沒有之一。


GitHub地址:https://github.com/nousresearch/hermes-agent

Hermes的核心殺手锏,是一套閉環(huán)學(xué)習(xí)架構(gòu):

每次完成復(fù)雜任務(wù)后,Agent會自動將解決方案提煉為可復(fù)用的Skill(技能)。

下次遇到類似任務(wù),直接調(diào)用已有技能,跳過從頭推理。

NousResearch內(nèi)部基準(zhǔn)測試顯示,積累20個以上自創(chuàng)技能的Hermes實例,完成同類任務(wù)的速度比全新實例快40%。


更狠的是,v0.12版本引入的自治Curator——

一個后臺自動運行的Agent,會定期評分、修剪、合并你的技能庫。

換句話說,Hermes不僅能學(xué),還能自己整理學(xué)到的東西。

語言不是天花板,架構(gòu)才是

Python打贏Rust這件事,看起來是一個編程語言之間的「逆襲爽劇」。

但它真正揭示的東西,要深刻得多。

在AI Agent的世界里,底層語言的性能差異正在變得越來越不重要。

Hermes這次優(yōu)化砍掉的443毫秒,已經(jīng)是框架層能擠出的極限了。而一次LLM調(diào)用的延遲,動輒幾百毫秒甚至數(shù)秒。

這意味著,在通往ASI的路上,真正的競爭從來不是「用什么語言寫」,而是「怎么讓Agent越用越聰明」。

而Hermes這次用Python干翻Rust,恰恰證明了——

在Agent進化的賽道上,開放、可編輯、可迭代的架構(gòu),比「跑得快」更接近ASI的本質(zhì)。

Rust是一把好刀,但ASI需要的不是一把更快的刀。

參考資料:

https://x.com/Teknium/status/2058885472513065471?s=20

https://github.com/NousResearch/hermes-agent/pull/31968

編輯:桃子 David

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
歐陽娜娜的小肚子太真實了

歐陽娜娜的小肚子太真實了

小椰的奶奶
2026-05-27 00:04:24
她是王大治媽媽,是秦腔演員名氣大,今客串《主角》再引關(guān)注

她是王大治媽媽,是秦腔演員名氣大,今客串《主角》再引關(guān)注

白面書誏
2026-05-25 15:22:01
中方對菲發(fā)布66號公告,馬科斯知中國已動真格

中方對菲發(fā)布66號公告,馬科斯知中國已動真格

新時代精神
2026-05-26 23:46:54
英超主帥年薪!瓜帥2000萬鎊第一,阿爾特塔第2,伊勞拉僅250萬鎊

英超主帥年薪!瓜帥2000萬鎊第一,阿爾特塔第2,伊勞拉僅250萬鎊

夏侯看英超
2026-05-27 00:03:37
阿斯:5月26日后穆里尼奧與本菲卡的解約金將升至1500萬歐

阿斯:5月26日后穆里尼奧與本菲卡的解約金將升至1500萬歐

懂球帝
2026-05-26 02:47:01
深夜,美股全線上漲,納指漲超1%;半導(dǎo)體板塊爆發(fā),美光大漲14%再創(chuàng)新高!中概股普漲,金銀下挫|美股開盤

深夜,美股全線上漲,納指漲超1%;半導(dǎo)體板塊爆發(fā),美光大漲14%再創(chuàng)新高!中概股普漲,金銀下挫|美股開盤

每日經(jīng)濟新聞
2026-05-26 22:31:16
博主曝四川稻城亞丁,劃省道為內(nèi)部路,硬剛后自駕進入,網(wǎng)友炸鍋

博主曝四川稻城亞丁,劃省道為內(nèi)部路,硬剛后自駕進入,網(wǎng)友炸鍋

另子維愛讀史
2026-05-25 19:19:03
“發(fā)給父母的相親照能逆天到啥程度??”哈哈哈哈哈好一個藝高人膽大!!

“發(fā)給父母的相親照能逆天到啥程度??”哈哈哈哈哈好一個藝高人膽大!!

脆皮先生
2026-05-26 20:22:19
開拓者老板回應(yīng)裁員與T恤爭議:只為贏球

開拓者老板回應(yīng)裁員與T恤爭議:只為贏球

溫柔且自由
2026-05-27 00:36:05
比雷霆還慘!一年選中2個分區(qū)決賽MVP,結(jié)果都送人了,史上最坑GM

比雷霆還慘!一年選中2個分區(qū)決賽MVP,結(jié)果都送人了,史上最坑GM

你的籃球頻道
2026-05-26 13:33:25
人民日報建議:人生下半場,比存錢更重要的,是存肌肉

人民日報建議:人生下半場,比存錢更重要的,是存肌肉

洞見
2026-05-25 09:25:00
上海101比90廣廈:讓了雙外援,照樣把你摁在地上

上海101比90廣廈:讓了雙外援,照樣把你摁在地上

劉寶杰聊球
2026-05-27 00:02:03
中國“撿錢”時代或?qū)砼R:如果手中只有10萬,試試死啃這兩條線

中國“撿錢”時代或?qū)砼R:如果手中只有10萬,試試死啃這兩條線

美食格物
2026-05-13 14:03:12
終于知道蘋果直營店的員工每天都很有活力的原因了,網(wǎng)友:門檻高

終于知道蘋果直營店的員工每天都很有活力的原因了,網(wǎng)友:門檻高

另子維愛讀史
2026-05-23 08:00:45
腰斬!小米一季度業(yè)績?yōu)楹瓮蝗弧白兡槨?>
    </a>
        <h3>
      <a href=杠桿游戲
2026-05-26 21:05:39
養(yǎng)老徹底變天!國家不再全額兜底,普通人如何自救?

養(yǎng)老徹底變天!國家不再全額兜底,普通人如何自救?

了舞天下
2026-05-25 20:03:13
我定居日本20年,娶過3個妻子,發(fā)現(xiàn)日本的女人都有一個共同特點

我定居日本20年,娶過3個妻子,發(fā)現(xiàn)日本的女人都有一個共同特點

千秋文化
2026-05-20 20:33:05
輕斷食再次封神!復(fù)旦大學(xué)研究證實,讓肝臟脂肪在5個月內(nèi)少20.5%

輕斷食再次封神!復(fù)旦大學(xué)研究證實,讓肝臟脂肪在5個月內(nèi)少20.5%

健康科普365
2026-05-23 23:00:03
iPhone 18 Pro Max今年穩(wěn)了,續(xù)航可能封神

iPhone 18 Pro Max今年穩(wěn)了,續(xù)航可能封神

搞機小帝
2026-05-27 00:09:26
IU、邊佑錫道歉難止血!《21世紀(jì)》遭要求廢劇、下架 連署破5萬

IU、邊佑錫道歉難止血!《21世紀(jì)》遭要求廢劇、下架 連署破5萬

ETtoday星光云
2026-05-26 14:51:17
2026-05-27 01:12:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
15313文章數(shù) 66891關(guān)注度
往期回顧 全部

科技要聞

中國AI要向外卷,而不只是做第二個OpenAI

頭條要聞

留神峪逃生礦工在宿舍不肯離開:拿到被拖欠的工資再走

頭條要聞

留神峪逃生礦工在宿舍不肯離開:拿到被拖欠的工資再走

體育要聞

上賽季差點降入英甲,下賽季要踢英超了

娛樂要聞

臺媒貼臉!S媽被問大S嗑藥當(dāng)場沉默

財經(jīng)要聞

中國鋁行業(yè)爆單 下一個“煤炭”大周期?

汽車要聞

涉水加強 福特烈馬亞馬遜限量版上市 售價39.98萬

態(tài)度原創(chuàng)

時尚
本地
手機
數(shù)碼
公開課

藍色系穿搭太適合夏天了!快來看看這些穿搭示范,美得不重樣

本地新聞

用云錦的方式,打開江蘇南京

手機要聞

OPPO Reno16系列線下上手體驗:不吐不快,說說優(yōu)缺點!

數(shù)碼要聞

小米Poco Pad C1海外發(fā)布,入門平板也卷高刷?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版