亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

一曲新詞酒一杯,喝到Harness我就醉

0
分享至

現(xiàn)在Harness已是AI業(yè)界的熱詞。Anthropic和OpenAI在二三月間于官網(wǎng)技術(shù)博客上發(fā)文介紹后,如今人人都在聊。

AI明星林俊旸近日于社交媒體上轉(zhuǎn)發(fā)一篇斯坦福大學(xué)研究人員的Harness新產(chǎn)品論文時(shí)稱:“現(xiàn)在模型+harness的模式已經(jīng)超過單純的AI模型。Harness的設(shè)計(jì)和質(zhì)量能顯著影響AI智能體性能。開發(fā)Harness是正確的道路”。

當(dāng)概念已經(jīng)被炒熱成這樣,那么就需要捋清概念:何謂AI的Harness?

01

Harness起源:拿AI管AI寫AI

AI現(xiàn)在是產(chǎn)學(xué)研齊頭前進(jìn)的行業(yè),說概念,先從實(shí)例和溯源說起。

Anthropic的Claude Code現(xiàn)在是AI智能體編程的頭部產(chǎn)品。Claude Code的爸爸、從原初雛形至今的創(chuàng)作者和負(fù)責(zé)人鮑里斯·切爾尼(Boris Cherny)在社交媒體和出席各種播客節(jié)目時(shí)詳細(xì)描述了自己開發(fā)Claude Code的歷程。

在切爾尼的描述中,工作量增加后,團(tuán)隊(duì)成員開始用Claude Code寫Claude Code自己的代碼、并用AI管理寫代碼的AI。

切爾尼說,自己會(huì)在工作機(jī)器上開五個(gè)以上終端標(biāo)簽頁,每個(gè)標(biāo)簽頁里都是一個(gè)獨(dú)立運(yùn)作的Claude Code副本。如果終端標(biāo)簽頁不夠使,他將編程任務(wù)“溢出”進(jìn)Claude Code的Web或桌面端app,和標(biāo)簽頁的子副本都是隔離分別運(yùn)行。

每次寫碼從進(jìn)入總管這些副本的Claude Code的計(jì)劃模式(Plan Mode)開始,訂好工作流程:

第一批Claude Code的子副本寫代碼。

第二批子副本做檢查代碼的評(píng)審(Reviewer),關(guān)注代碼的邊界條件、風(fēng)格一致性和可維護(hù)性等易失誤處。

第三批子副本再審核第二批代碼的工作是否符合md(Markdown)文件的要求。

子副本們之前的常見錯(cuò)誤、期望達(dá)到的代碼風(fēng)格、常用命令與文件目錄、動(dòng)作禁則,簡潔概括后寫入總管的Claude Code的md文件中,作為以后AI自動(dòng)寫碼的指導(dǎo)。

“用AI管AI寫AI代碼”的模式下,切爾尼個(gè)人每天能發(fā)出10-30個(gè)合并代碼的拉取請(qǐng)求(PR),數(shù)月內(nèi)不用手動(dòng)寫碼,效率激增。依靠這種模式,Anthropic才能達(dá)到現(xiàn)在幾乎隔日一次重大更新的產(chǎn)品發(fā)布頻率。



如果熟悉Anthropic的官網(wǎng)更新動(dòng)態(tài),就會(huì)發(fā)現(xiàn)《為長期應(yīng)用運(yùn)行開發(fā)的Harness設(shè)計(jì)》(Harness design for long-running application development)這篇3月熱門文章的內(nèi)容,切爾尼提前兩三個(gè)月在播客上就嘮過了。

3月熱文中的“三智能體”Harness架構(gòu),三層的規(guī)劃者(Planner)、生成器(Generator)、評(píng)估器(Evaluator),基本是切爾尼上節(jié)目時(shí)的大白話內(nèi)容,不過做了概括后再包裝。

02

Harness本質(zhì):高成本高效率的多智能體架構(gòu)

切爾尼描述的這個(gè)過程就是Harness的本質(zhì)。Harness不只是自動(dòng)完成任務(wù)的子智能體、不只是總管子智能體工作的上層智能體、也不只是告訴AI工作事項(xiàng)的md文件,而是總括了這些的AI智能體自動(dòng)運(yùn)轉(zhuǎn)的整體流程。

使用Harness這個(gè)字眼來描述此流程,是借用電氣工程中的“線束工程”概念。電氣工程的“線束”統(tǒng)籌的是線路與信號(hào)走向,AI智能體的Harness統(tǒng)籌的是子智能體與模塊的動(dòng)作功能,殊途同歸。

當(dāng)然,真要咬文嚼字起來,Harness可以翻譯成中文中的“輐”與“軛”,是連接馬匹與車身的傳動(dòng)兼指向車具。不過古天主教和尚的“若無必要,勿增實(shí)體”原則在六七百年后的AI時(shí)代更加有用,不用新造字眼給大眾增加理解負(fù)擔(dān),真要中文意譯,用電氣工程中已通行、最簡潔的“線束”最合適。

如果更仔細(xì)考證技術(shù)底蘊(yùn),能發(fā)現(xiàn)在2025年6月中Anthropic發(fā)布的官網(wǎng)文章《我司如何構(gòu)建多智能體》,已經(jīng)開始嘗試多智能體Harness架構(gòu)。以Claude Opus 4為上層智能體底座、Sonnet 4為子智能體底座的多智能體架構(gòu),在他們的內(nèi)部評(píng)測(cè)中,性能比Opus 4單一模型強(qiáng)出90.2%。

高效率的同義詞往往是高成本。2026年3月Anthropic的Harness文章中示例,用同一組提示詞,讓AI自行編寫一個(gè)2D復(fù)古小游戲。以此對(duì)比Opus 4.5單一模型和多智能體Harness架構(gòu)的性能:單一模型運(yùn)行20分鐘,成本9美元,成品不可用;全套harness運(yùn)行6小時(shí),成本200美元,成品可用。

該文除了展現(xiàn)Harness架構(gòu)性能,也以此做了Opus 4.6更新的廣告:“Opus 4.6計(jì)劃更仔細(xì),運(yùn)行智能體任務(wù)的時(shí)長更久,能在更大的代碼庫中更可靠地運(yùn)行,并有更好的代碼審查和調(diào)試功能來自我糾正?!?/p>

用白話說,就是更強(qiáng)的模型才能驅(qū)動(dòng)更高效的Harness,有多快馬跑多快車。從2025年6月至今,多智能體架構(gòu)耗費(fèi)token的速度始終是普通聊天機(jī)器人的15倍以上,但將工作流拆分成子任務(wù)集合完成的效率也不減此數(shù)。顧客們要不要掏錢惠顧模型廠,須有一番思量。

03

Harness精髓:用AI體現(xiàn)傳統(tǒng)軟件工程要?jiǎng)t

00后程序員趙晨陽現(xiàn)在由開源項(xiàng)目SGLang衍生的“基數(shù)方舟AI”(RadixArk AI)公司供職,按他在社交媒體上的解析,現(xiàn)在業(yè)界狂炒Harness,反而很不AI風(fēng),是疊床架屋地增加智識(shí)負(fù)擔(dān)。

趙晨陽認(rèn)為,所有Harness的關(guān)鍵點(diǎn),都是用AI重新實(shí)現(xiàn)了一遍“古代”傳統(tǒng)軟件工程原則中的要點(diǎn):

不在AI聊天機(jī)器人的每次對(duì)話紀(jì)錄用提示詞重復(fù)闡明工作準(zhǔn)則,而將準(zhǔn)則保存在AI智能體的md文件,這是“文檔即代碼”(docs-as-code)原則在AI中的體現(xiàn);

不期待一個(gè)超級(jí)AI模型解決整個(gè)工作任務(wù),將工作任務(wù)拆成分隔的專門版塊,讓單個(gè)子智能體只處理單一版塊,這是“關(guān)注點(diǎn)分離”(separation of concerns)和“單一職責(zé)”(single responsibility)原則在AI中的體現(xiàn);



將AI子智能體在工作流中的權(quán)責(zé)結(jié)構(gòu)化,不讓總管的AI上層智能體自行猜測(cè),這是“左移約束”(shift-left constraints)原則在AI中的體現(xiàn)。

Anthropic的研究員尼古拉斯·卡利尼在2月底公布的實(shí)驗(yàn),也體現(xiàn)了此原則??ɡ崾褂昧思s2萬美元的API總額度、并發(fā)約兩千次Claude Code會(huì)話、并行16個(gè)Claude Opus 4.6驅(qū)動(dòng)的子智能體、用時(shí)兩周、生成了10萬行Rust代碼,最后構(gòu)建出可運(yùn)行C編譯器。

按Anthropic官網(wǎng)上的卡利尼自述,他的精力不在寫提示詞上,提示詞可以盡量簡單,工作的重點(diǎn)是設(shè)計(jì)子智能體架構(gòu)的基礎(chǔ)環(huán)境:測(cè)試、運(yùn)行、反饋等機(jī)制,如此才能讓多AI智能體無人工干預(yù)自行運(yùn)轉(zhuǎn)。

ChatGPT奇跡的三年內(nèi),第一年大家在思考如何給AI聊天機(jī)器人寫出更好的提示詞、在聊天窗口調(diào)用大模型的性能。

第二年大家發(fā)現(xiàn)完成調(diào)用不用人類來做提示詞仙人,讓AI自己學(xué)會(huì)調(diào)用不同大模型和同一大模型的不同功能API,這是Manus和AI智能體火熱的一年。

第三年大家發(fā)現(xiàn)可以讓AI自己學(xué)會(huì)自動(dòng)調(diào)用并讀懂用戶終端里的本地文件、和云端的各種AI子智能體,這是OpenClaw和Harness架構(gòu)火熱的一年。

時(shí)代趨勢(shì)是AI的調(diào)用層級(jí)越來越高,完成的任務(wù)越來越復(fù)雜。但技術(shù)皆有脈絡(luò)可循,基礎(chǔ)原理并不是大眾不能理解的黑魔法。(作者/李熙)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
外交部:中美雙方就美國總統(tǒng)特朗普訪華事保持著溝通

外交部:中美雙方就美國總統(tǒng)特朗普訪華事保持著溝通

環(huán)球網(wǎng)資訊
2026-04-15 18:16:43
曝俄羅斯竟向赫爾松的部隊(duì)分配土地?烏克蘭空襲俄指揮部

曝俄羅斯竟向赫爾松的部隊(duì)分配土地?烏克蘭空襲俄指揮部

項(xiàng)鵬飛
2026-04-13 16:32:51
年輕男性睪酮暴跌:一場被忽視的生理危機(jī)

年輕男性睪酮暴跌:一場被忽視的生理危機(jī)

字節(jié)漫游指南
2026-04-15 08:58:14
百度伐謀反轉(zhuǎn)奪冠國際榜單背后:中國產(chǎn)業(yè)進(jìn)化需要怎樣的AI工程?

百度伐謀反轉(zhuǎn)奪冠國際榜單背后:中國產(chǎn)業(yè)進(jìn)化需要怎樣的AI工程?

產(chǎn)業(yè)家
2026-04-14 11:44:10
又是美人計(jì)!駐外“間諜”曝光,作案手段狡猾,央視發(fā)聲呼之欲出

又是美人計(jì)!駐外“間諜”曝光,作案手段狡猾,央視發(fā)聲呼之欲出

阿褲趣聞君
2026-04-16 02:41:00
居民貸款腰斬,這或許才是“小陽春”的真相

居民貸款腰斬,這或許才是“小陽春”的真相

大川東山再起
2026-04-15 15:56:39
一夜暴富!北京女子花1.2萬買復(fù)式彩票中562萬,自稱“理性購彩”

一夜暴富!北京女子花1.2萬買復(fù)式彩票中562萬,自稱“理性購彩”

王曉愛體彩
2026-04-15 19:31:40
歷史性突破!人民幣躍居全球二大結(jié)算貨幣,美元霸權(quán)加速崩塌!

歷史性突破!人民幣躍居全球二大結(jié)算貨幣,美元霸權(quán)加速崩塌!

夢(mèng)回千年a
2026-04-15 10:48:20
小鵬GX出手,傳統(tǒng)車企還怎么玩?

小鵬GX出手,傳統(tǒng)車企還怎么玩?

BigCarShow
2026-04-15 21:30:10
馬筱梅自曝婚姻出問題,和汪小菲沒關(guān)系,矛頭指向張?zhí)m 娃才2月大

馬筱梅自曝婚姻出問題,和汪小菲沒關(guān)系,矛頭指向張?zhí)m 娃才2月大

樂天閑聊
2026-04-16 01:16:58
接下來的廣州,地鐵、燃?xì)狻⑺M(fèi)都要漲價(jià)?

接下來的廣州,地鐵、燃?xì)狻⑺M(fèi)都要漲價(jià)?

南沙部落
2026-04-15 09:53:21
功虧一簣!徐思遭威爾遜逆轉(zhuǎn)絕殺,中國名將無緣世錦賽32強(qiáng)!

功虧一簣!徐思遭威爾遜逆轉(zhuǎn)絕殺,中國名將無緣世錦賽32強(qiáng)!

世界體壇觀察家
2026-04-16 04:24:26
忍無可忍!特朗普發(fā)飆,“反華專家”章家敦翻車,中國1萬億打臉

忍無可忍!特朗普發(fā)飆,“反華專家”章家敦翻車,中國1萬億打臉

你是我的小甜甜
2026-04-16 00:23:58
摩納哥王妃夏琳2套裙裝封神,王室時(shí)尚教科書!普通人直接抄作業(yè)

摩納哥王妃夏琳2套裙裝封神,王室時(shí)尚教科書!普通人直接抄作業(yè)

明星私服穿搭daily
2026-04-15 10:10:40
簽約,中國和俄羅斯談成了

簽約,中國和俄羅斯談成了

太陽來
2026-04-15 09:27:18
恒大歌舞圖再曝光:許家印親自面試 貴賓房比外界說的夸張 刷三觀

恒大歌舞圖再曝光:許家印親自面試 貴賓房比外界說的夸張 刷三觀

念洲
2026-04-15 15:32:14
羅伯遜看好趙心童世錦賽衛(wèi)冕:他讓很多球手畏懼,打法太有壓迫性

羅伯遜看好趙心童世錦賽衛(wèi)冕:他讓很多球手畏懼,打法太有壓迫性

楊華評(píng)論
2026-04-15 21:33:53
大連市普蘭店區(qū)人民法院副院長蘇欣欣接受監(jiān)察調(diào)查

大連市普蘭店區(qū)人民法院副院長蘇欣欣接受監(jiān)察調(diào)查

半島晨報(bào)
2026-04-15 10:52:27
民進(jìn)黨,極有可能在下一屆臺(tái)灣地區(qū)選舉后,成為長期一家獨(dú)大政黨

民進(jìn)黨,極有可能在下一屆臺(tái)灣地區(qū)選舉后,成為長期一家獨(dú)大政黨

李橑在北漂
2026-04-02 10:22:26
一運(yùn)動(dòng)就痛,深圳一中學(xué)生確診!醫(yī)生痛心:很多家長都做錯(cuò)了這一步......

一運(yùn)動(dòng)就痛,深圳一中學(xué)生確診!醫(yī)生痛心:很多家長都做錯(cuò)了這一步......

深圳晚報(bào)
2026-04-15 16:46:40
2026-04-16 05:19:02
字母榜 incentive-icons
字母榜
讓未來不止于大。
2379文章數(shù) 8059關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

法國全票通過 “將不義之財(cái)歸還中國”

頭條要聞

法國全票通過 “將不義之財(cái)歸還中國”

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財(cái)經(jīng)要聞

業(yè)績失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

數(shù)碼
健康
親子
旅游
教育

數(shù)碼要聞

明基新款顯示器首發(fā)12499元:4K專業(yè)級(jí)色彩校準(zhǔn) 根據(jù)環(huán)境光自動(dòng)調(diào)整

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

親子要聞

孕婦200買水果被罵后續(xù):已終止妊娠,男方崩潰砸東西,網(wǎng)友炸鍋

旅游要聞

拉豬車?yán)@關(guān)闖禁區(qū):隱秘危險(xiǎn)游該踩剎車了

教育要聞

黃岡小升初招生題,求面積,方法思路太絕了

無障礙瀏覽 進(jìn)入關(guān)懷版