无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Python逆天改命!開源Hermes首次擊敗OpenAI Codex

0
分享至


新智元報道


【新智元導讀】一個純Python寫的開源項目,竟把OpenAI用Rust寫的王牌給秒了!最終戰績6比5,Hermes直接上演工程暴力美學,解釋型語言終于逆天改命。

一個純Python寫的開源項目,竟擊潰了OpenAI王牌!

今天,全網都被Hermes Agent的硬核實力狠狠刷屏了:

在針對真實世界CLI任務的11項基準測試中,它以6:5的戰績,直接把Codex按在地上摩擦。


在這場備受矚目的對決中,Hermes Agent展現出了驚人的底層優化能力。

通過一連串的硬核操作,成功把系統的啟動時間,從701ms縮短至258ms。


更讓人震撼的是,Hermes完全由Python編寫,而Codex是用Rust寫的。

這一仗,Python打贏了Rust!

這在編程界,屬是「逆天改命」了。



三大狠招,砍掉63%啟動時間

就在這次優化之前,Hermes還是5-6落后的那個。

這次逆轉不是靠換模型、不是靠堆算力,而是靠三個純工程優化,刀刀見血。


那么,它是具體如何做到的?

第一刀:Bitwarden磁盤緩存

原來Hermes每次啟動都會調用Bitwarden Secrets Manager的API去拉取憑據,一次就是380毫秒。

問題在于,之前的緩存是「純進程內」,連續執行兩次hermes chat -q,第二次還是要重新拉。

解決方案是,加了一個L2磁盤緩存。

緩存文件權限鎖死0600,存放在 /cache/bws_cache.json ,默認TTL 300秒。

另外,訪問token本身絕不落盤,默認300秒TTL,過期才重新拉取。

一刀砍掉380ms。


第二刀:模型目錄延遲加載

hermes_cli.models._PROVIDER_MODELS,一個包含所有AI供應商模型信息的巨型字典。

之前在模塊加載時就急切導入,吃掉約55ms。

實際上只有model_flow相關的處理函數才需要它。

團隊用PEP 562的模塊級getattr實現了懶加載,只在真正訪問模型目錄時才付出這筆開銷。。

這一步,又省了55毫秒。

第三刀:配置文件去重

main.py頂部原本讀了兩次config.yaml

一次yaml.safe_load用于密鑰脫敏橋接,一次完整的load_config()(含深度合并)只為檢查一個布爾值。

合并成一次原始加載,省下17ms。

這三刀加起來, 啟動時間從701ms暴降至258ms,降幅63%。

不得不說,這才是真正的工程暴力美學,純靠profiling找到瓶頸,一刀一刀切掉冗余。


戰績6:5,Hermes翻盤時刻

最終結果,是不會說謊的。

在優化前,Hermes對Codex的總戰績是5勝6負:單輪任務被Codex壓制,多輪任務略有優勢但不夠明顯。

優化后,局面徹底反轉。

單輪任務(8項):Hermes的中位框架開銷,降到了與Codex持平甚至略低的水平。

原本被Codex碾壓的啟動劣勢,被完全抹平。

多輪任務(3項):Hermes在5輪對話的總開銷上已經領先,優化后優勢進一步拉大。


最后的總分,6:5,Hermes實現了反超。

這意味著,一個用Python寫的開源項目,在框架開銷——

一個最考驗底層功力的維度,擊敗了用Rust寫的、背后站著萬億市值公司的閉源產品。


Python,打贏了Rust

真正反直覺的部分在于,Python憑什么贏下Rust?

長期以來,Python在性能圈幾乎是「原罪」般的存在:解釋型語言、GIL鎖、動態類型開銷……

當OpenAI選擇用Rust構建Codex CLI時,所有人都覺得理所當然——

Rust生來,就是為性能而生的。


但Hermes的這次逆襲說明了一個關鍵事實:

在Agent這個賽道上,框架層面的架構決策,比語言層面的原始速度更重要。

開發者netrunner的評論一針見血,「Python在多輪任務上打贏Rust,本質上是架構決策的勝利,而不是語言速度的勝利」。

「Codex可能在上下文處理上,過度工程化了」。


還有人問道,「為何不把Hermes也遷移到Rust?那不是更快」?

Hermes聯創兼首席科學家Teknium直言,「那樣就無法編輯代碼,以及實時改進和迭代」

也就是說,Python的優勢不在于快,而在于活。


對于一個需要持續進化、從每次交互中學習的Agent來說,開發者友好性和迭代速度,就是最大的性能優勢。

GitHub沖爆16.7萬星

硬剛萬億巨頭

Hermes Agent的爆發速度,本身就是一組讓人瞠目的數據。

從2026年2月25日上線至今,僅僅三個月,GitHub星標已經突破16萬。

日活Token消耗量達到353B,是同類項目OpenClaw的近兩倍。

可以說,它是2026年增長最快的開源Agent框架,沒有之一。


GitHub地址:https://github.com/nousresearch/hermes-agent

Hermes的核心殺手锏,是一套閉環學習架構:

每次完成復雜任務后,Agent會自動將解決方案提煉為可復用的Skill(技能)。

下次遇到類似任務,直接調用已有技能,跳過從頭推理。

NousResearch內部基準測試顯示,積累20個以上自創技能的Hermes實例,完成同類任務的速度比全新實例快40%。


更狠的是,v0.12版本引入的自治Curator——

一個后臺自動運行的Agent,會定期評分、修剪、合并你的技能庫。

換句話說,Hermes不僅能學,還能自己整理學到的東西。

語言不是天花板,架構才是

Python打贏Rust這件事,看起來是一個編程語言之間的「逆襲爽劇」。

但它真正揭示的東西,要深刻得多。

在AI Agent的世界里,底層語言的性能差異正在變得越來越不重要。

Hermes這次優化砍掉的443毫秒,已經是框架層能擠出的極限了。而一次LLM調用的延遲,動輒幾百毫秒甚至數秒。

這意味著,在通往ASI的路上,真正的競爭從來不是「用什么語言寫」,而是「怎么讓Agent越用越聰明」。

而Hermes這次用Python干翻Rust,恰恰證明了——

在Agent進化的賽道上,開放、可編輯、可迭代的架構,比「跑得快」更接近ASI的本質。

Rust是一把好刀,但ASI需要的不是一把更快的刀。

參考資料:

https://x.com/Teknium/status/2058885472513065471?s=20

https://github.com/NousResearch/hermes-agent/pull/31968

編輯:桃子 David

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
深圳市一套涉刑的豪宅房子拍賣,被人1378萬拿下了

深圳市一套涉刑的豪宅房子拍賣,被人1378萬拿下了

天天話事
2026-05-25 17:41:31
羞辱!文班差1票全票一陣,NBA記者認領:我就是不投他

羞辱!文班差1票全票一陣,NBA記者認領:我就是不投他

林子說事
2026-05-26 13:14:28
又一款國民飲料,賣不動了

又一款國民飲料,賣不動了

鳳凰網財經
2026-05-25 21:38:00
她若不犧牲,十大元帥可能會有女元帥?賀龍:她的軍事成就比我高

她若不犧牲,十大元帥可能會有女元帥?賀龍:她的軍事成就比我高

史之銘
2026-05-26 19:18:30
日本丈夫加班養家,“晝顏妻”出軌26年不翻車!法院竟然這樣判

日本丈夫加班養家,“晝顏妻”出軌26年不翻車!法院竟然這樣判

孤獨的獨角獸影視
2026-04-28 09:20:19
章子怡現身女兒鋼琴演奏會,低調抱兒子觀看,汪峰發文大贊女兒

章子怡現身女兒鋼琴演奏會,低調抱兒子觀看,汪峰發文大贊女兒

韓小娛
2026-05-26 05:38:06
算力、芯片、量子科技、腦機接口……深圳“十五五”規劃綱要發布

算力、芯片、量子科技、腦機接口……深圳“十五五”規劃綱要發布

數據寶
2026-05-26 21:53:01
他建國前戰功平平,建國后卻立不世之功,毛主席直言堪比三大戰役

他建國前戰功平平,建國后卻立不世之功,毛主席直言堪比三大戰役

比利
2026-05-26 10:25:21
上海三大亨后人何在?一人絕后一人敗光家產,一人子孫皆成才

上海三大亨后人何在?一人絕后一人敗光家產,一人子孫皆成才

DELIXI
2024-12-01 19:16:53
同是竇唯女兒,一個在香港被大佬捧,一個北京租房打工,差距明顯

同是竇唯女兒,一個在香港被大佬捧,一個北京租房打工,差距明顯

白面書誏
2026-05-25 16:12:15
俄羅斯曝軍火丑聞,3000中國零件不合格,損失3500萬,5人被追責

俄羅斯曝軍火丑聞,3000中國零件不合格,損失3500萬,5人被追責

蜉蝣說
2026-05-25 17:47:56
生是我家人,死是我家鬼:姐姐勸弟弟打斷妻子腿,弟弟直接打死了

生是我家人,死是我家鬼:姐姐勸弟弟打斷妻子腿,弟弟直接打死了

江山揮筆
2026-05-26 10:39:53
阿森納終結22年無冠:極致效率成就王者,英超進入務實時代

阿森納終結22年無冠:極致效率成就王者,英超進入務實時代

星耀國際足壇
2026-05-26 23:13:21
南宋為了雪靖康之恥,手段有多狠?拼命把百萬金人弄到只剩10萬

南宋為了雪靖康之恥,手段有多狠?拼命把百萬金人弄到只剩10萬

鶴羽說個事
2026-05-23 23:01:27
拉夫羅夫通知美國撤人:俄方要打基輔“決策中心”,歐盟拒絕離開

拉夫羅夫通知美國撤人:俄方要打基輔“決策中心”,歐盟拒絕離開

桂系007
2026-05-26 12:05:43
夫妻性生活別急著進入!學會這招“延遲滿足”,爽感增倍

夫妻性生活別急著進入!學會這招“延遲滿足”,爽感增倍

精彩分享快樂
2026-05-13 12:05:07
極端高溫下,印度人想在喜馬拉雅山開個口子送走熱浪,這可能嗎?

極端高溫下,印度人想在喜馬拉雅山開個口子送走熱浪,這可能嗎?

一口娛樂
2026-05-26 20:09:53
47歲高圓圓在公園被抓拍,麒麟臂、涼拖鞋,活脫脫一個買菜大姐

47歲高圓圓在公園被抓拍,麒麟臂、涼拖鞋,活脫脫一個買菜大姐

胖松松與瘦二毛
2026-05-06 12:40:53
全網炸鍋!稻城亞丁宰客亂象曝光,天價物價太離譜,游客硬核硬剛

全網炸鍋!稻城亞丁宰客亂象曝光,天價物價太離譜,游客硬核硬剛

暖心萌阿菇涼
2026-05-26 21:34:53
形勢有多嚴峻?35歲失業男與年輕女人事激烈碰撞,評論區炸鍋…

形勢有多嚴峻?35歲失業男與年輕女人事激烈碰撞,評論區炸鍋…

世界圈
2026-04-18 08:49:47
2026-05-27 00:12:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15313文章數 66891關注度
往期回顧 全部

科技要聞

中國AI要向外卷,而不只是做第二個OpenAI

頭條要聞

留神峪逃生礦工在宿舍不肯離開:拿到被拖欠的工資再走

頭條要聞

留神峪逃生礦工在宿舍不肯離開:拿到被拖欠的工資再走

體育要聞

上賽季差點降入英甲,下賽季要踢英超了

娛樂要聞

臺媒貼臉!S媽被問大S嗑藥當場沉默

財經要聞

中國鋁行業爆單 下一個“煤炭”大周期?

汽車要聞

涉水加強 福特烈馬亞馬遜限量版上市 售價39.98萬

態度原創

手機
游戲
時尚
房產
公開課

手機要聞

紅米新機入網,首發驍龍4 Gen 4?

索尼PS官宣炸裂折扣!PS PLUS會員67折 還有新福利

藍色系穿搭太適合夏天了!快來看看這些穿搭示范,美得不重樣

房產要聞

招商地產接盤碧桂園!海口這個爛尾豪宅,要徹底改命?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版