henry 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
Workflow、Skill、SOP,可能真的要過時(shí)了。
在Fable 5發(fā)布24小時(shí)后,Reddit 9年老兵Bohdanowicz連肝一天一夜,最后寫下這樣一句評價(jià):
“工作流的變化,比模型的變化更大。而模型的進(jìn)步,是真的。”
![]()
過去幾個(gè)月,為了讓模型更好用,他親手搭了一整套工作流,把任務(wù)拆得明明白白,甚至連Harness都是自己手搓的。
結(jié)果Fable 5發(fā)布后,一切突然變得有些多余。
用他的話來說,是時(shí)候重寫劇本了!人類自己精心設(shè)計(jì)的Agent工作流,已經(jīng)過時(shí)了。
以前需要拆成4到6步、全程盯著推進(jìn)的任務(wù),現(xiàn)在一句話交代下去,F(xiàn)able 5自己就跑完了。
可以說,幾個(gè)月攢下來的經(jīng)驗(yàn)和技巧,一夜之間成了歷史。
(所以說嘛就不用學(xué),反正最后都會(huì)自動(dòng)化!)
而有這種感受的人,不止他一個(gè)。
Fable發(fā)布72小時(shí)后,全網(wǎng)已經(jīng)攢出一批深度體驗(yàn)報(bào)告,大家反復(fù)討論的是同一個(gè)問題:人和模型之間,該重新怎么分工。
除了Bohdanowicz,其中流傳最廣的幾份,畫風(fēng)是這樣的:
- Simon Willison(Django聯(lián)合創(chuàng)建者):離開電腦去干了趟家務(wù),回來看見自己的Firefox自己在動(dòng)。為了修一個(gè)2行CSS的bug,F(xiàn)able當(dāng)場發(fā)明了一整套瀏覽器自動(dòng)化。
- Ethan Mollick(沃頓商學(xué)院教授):要一張1881年風(fēng)格的全球旅行時(shí)間地圖,模型自己查了2200多條航班,連去太平洋小島的船期都翻了出來。
- Matt Van Horn(開發(fā)者):扒下865條全網(wǎng)討論做成第一天生存指南,發(fā)現(xiàn)整個(gè)社區(qū)風(fēng)向變了:直接給模型目標(biāo)吧,別整提示詞和SOP了。
兩行CSS,逼它發(fā)明了一套自動(dòng)化
咱先說Django聯(lián)創(chuàng)Simon Willison用Fable 5的心得。
兩天用下來,Simon最大的感受是“relentless proactive”(堅(jiān)持不懈的主動(dòng)),說人話就是,Fable 5特別愛主動(dòng)干活。
![]()
事情是這樣的。
6月11日,他在自己的項(xiàng)目里發(fā)現(xiàn)一個(gè)小bug,輸入框下面多了一條不該出現(xiàn)的橫向滾動(dòng)條。
他截了張圖丟給Claude Code里的Fable 5,只留下一句提示:去依賴庫里查查原因。然后起身做家務(wù)去了。
![]()
幾分鐘后回來,他愣住了。Firefox自己開了,正在自動(dòng)跳轉(zhuǎn)到出Bug的頁面。
接著Safari也開了,而Simon壓根沒裝過任何瀏覽器自動(dòng)化工具。
![]()
事后復(fù)盤日志時(shí),他發(fā)現(xiàn)Fable干了一件非常離譜的事:為了修這個(gè)Bug,它給自己現(xiàn)造了一套自動(dòng)化工具鏈。
具體來說,F(xiàn)able 5先是自己啟動(dòng)本地服務(wù),在不同瀏覽器里復(fù)現(xiàn)問題。
發(fā)現(xiàn)復(fù)現(xiàn)不了之后,又直接打開Simon真實(shí)機(jī)器上的瀏覽器。
接著為了看清頁面,它繞過常規(guī)方案,用Python調(diào)用macOS底層接口給窗口截圖。
![]()
遇到彈窗打不開的問題時(shí),它直接修改網(wǎng)頁模板,自動(dòng)模擬按鍵。
![]()
當(dāng)頁面尺寸拿不到時(shí),它就直接順手手搓了個(gè)本地服務(wù)器,把瀏覽器里的數(shù)據(jù)回傳回來。
![]()
整個(gè)過程里,沒有人告訴它該怎么做。它只是一步步發(fā)現(xiàn)缺什么,就補(bǔ)什么。
最后折騰半天,修復(fù)方案落地:
兩行CSS。
這中間還有個(gè)插曲。把這些招全部摸索出來之后,F(xiàn)able觸發(fā)了某個(gè)看不見的護(hù)欄,被自動(dòng)降級成了Opus 4.8。
但好在Opus拿著完整的對話記錄,沿用Fable發(fā)明的全部技巧,把修復(fù)跑完了。相當(dāng)于一個(gè)模型給另一個(gè)模型留好了施工圖紙。
Simon給這種行為起了個(gè)名字,relentlessly proactive,不依不饒地主動(dòng)。
它會(huì)的招數(shù)極多,而且為了達(dá)成目標(biāo),幾乎什么招都肯用,完全不需要人來介入,教他。
一個(gè)prompt,它自己干了九個(gè)半小時(shí)
接下來是拿到早期訪問權(quán)限的沃頓商學(xué)院教授Ethan Mollick。
先說結(jié)論。
在他看來,F(xiàn)able 5相比此前所有模型都是一次巨大的躍遷。而真正變化的,不只是能力,而是人與AI的關(guān)系。
![]()
拿到模型后,Mollick先搬出了一個(gè)老題目——等時(shí)線地圖。
這是一類誕生于19世紀(jì)的地圖:從某座城市出發(fā),經(jīng)過多少天能夠抵達(dá)世界哪些地方。
雖然看起來只是生成一張地圖,但背后卻需要整合海量交通數(shù)據(jù),還要做無數(shù)細(xì)小判斷。
過去他拿這個(gè)題目考過不少模型,沒有一個(gè)真正過關(guān)。
而這一次,他只給了Fable 5一個(gè)超長Prompt:
我想讓你構(gòu)建一張經(jīng)過完整研究且美麗的等時(shí)線地圖,讓我能選擇不同的城市,并基于真實(shí)數(shù)據(jù)看到真實(shí)的等時(shí)線。我希望設(shè)計(jì)獨(dú)特。你應(yīng)該考慮機(jī)場(以及往返機(jī)場的交通時(shí)間)、火車、步行和開車。數(shù)據(jù)不必是實(shí)時(shí)的,但應(yīng)基于你的研究和數(shù)據(jù)是真實(shí)的。你可以從幾個(gè)城市開始,但越通用越好,這應(yīng)該是一個(gè)全新的項(xiàng)目。
(大家可以試試)
并接受了Fable 5按照原始地圖的風(fēng)格來實(shí)現(xiàn)的建議,然后奇跡發(fā)生了:
Fable 5接到prompt后,先自己啟動(dòng)子Agent(可能是sonnet這樣的便宜模型)做研究,檢索了超過2200條航班數(shù)據(jù),從法國TGV到日本新干線的時(shí)刻表,再到不同國家的公路通行速度。
![]()
與此同時(shí),它自己寫代碼、自己驗(yàn)證結(jié)果、自己記錄進(jìn)度。
Mollick后來提了一條意見:偏遠(yuǎn)地區(qū)不要估算,要真實(shí)數(shù)據(jù)。
于是模型又啟動(dòng)了一套互相挑錯(cuò)的Agent流程,一組查資料,一組負(fù)責(zé)找漏洞。
![]()
從太平洋上的皮特凱恩島補(bǔ)給船班次,到加拿大北極圈內(nèi)小鎮(zhèn)Grise Fiord的交通路線,全被翻了出來。
最終結(jié)果是一個(gè)可以互動(dòng)的地圖,你手拖到哪里,就會(huì)顯示到達(dá)那里需要多久。
(注:地圖鏈接:
https://isochronic-passage-chart.netlify.app/#nyc)
而真正讓Mollick震驚的,還不只是這張地圖。后來他又把一個(gè)研究界的老難題丟給了Fable 5:
如何校準(zhǔn)人類評分員與AI評判之間的差異,這是個(gè)很多研究者都頭疼的問題。
模型接到任務(wù)后,先寫出一份19頁設(shè)計(jì)文檔,然后開始干活。
九個(gè)半小時(shí)后,它交出了一套完整的軟件工具:Concord。
![]()
Mollick后來把它開源到了GitHub。
作為領(lǐng)域?qū)<遥?dāng)然還是挑出了不少問題,讓模型繼續(xù)修改。但整個(gè)過程中,他最強(qiáng)烈的感受卻是:自己越來越?jīng)]什么事可做。
數(shù)百個(gè)技術(shù)決策,模型直接替他做了,過程長到甚至不值得跟讀。
于是Mollick寫下了一句很有意思的話:
“歡喜,因?yàn)槲抑皇翘崃藗€(gè)要求,事情就成了。
“不安,也因?yàn)槲抑皇翘崃藗€(gè)要求,事情就成了。”
去年,他還把使用AI形容成當(dāng)巫師。念出咒語,然后等待奇跡發(fā)生。
但這一次,他改口了。“我已經(jīng)不確定自己還是不是那個(gè)巫師。我更像一個(gè)甲方。描述需求,付錢,驗(yàn)收。至于煉金術(shù)發(fā)生在哪里,我已經(jīng)看不見了。”
Fable 5最先淘汰的,是提示詞工程師?
如果說前面兩位講的還是個(gè)人體驗(yàn),那么開發(fā)者大佬Matt Van Horn干脆替大家做了一次社區(qū)普查。
他從Reddit、X、YouTube一路爬到TikTok,讀完865條關(guān)于Fable 5的討論,最后整理出一份《第一天生存指南》。
![]()
當(dāng)然,865條里不少人還是在整活。
有人剛拿到號稱”Mythos級”的新模型,轉(zhuǎn)頭就讓它寫待辦清單和貪吃蛇。
常年仰望AGI的r/singularity版面上,一個(gè)高贊帖子則直接宣布:
“兄弟們,我覺得我們摸到AGI了。”
但把這些段子濾掉之后,社區(qū)其實(shí)很快形成了一些共識(shí)。
比如,Fable只做計(jì)劃,讓同門便宜的Sonnet寫實(shí)現(xiàn),更便宜的Haiku跑測試,一半agent干活,一半agent驗(yàn)收,驗(yàn)收通過才許提交代碼。
與此同時(shí),網(wǎng)上也出現(xiàn)了邪修版本,直接用Fable 5,努力程度設(shè)置為Max,然后讓它作為協(xié)調(diào)者,管理Opus這樣的模型。
![]()
還有開發(fā)者發(fā)現(xiàn),F(xiàn)able開中等思考強(qiáng)度,效果甚至好過Opus 4.8火力全開,Token反而更省。
但整份指南排在第一條的結(jié)論,卻繞了一整圈互聯(lián)網(wǎng),又回到了文章開頭那位Bohdanowicz身上。
給目標(biāo),別給步驟。
啥意思呢?過去大家寫提示詞,喜歡把任務(wù)拆得明明白白,生怕模型理解錯(cuò),Skill、SOP,都是這套方法的衍生品。
但,現(xiàn)在越來越多開發(fā)者發(fā)現(xiàn),這套方法開始失效了。
連Anthropic自己都在調(diào)整工作方式。Claude Code團(tuán)隊(duì)成員Thariq形容,這是從微觀管理任務(wù)轉(zhuǎn)向高層目標(biāo)對齊,
![]()
翻譯一下就是:舊時(shí)代的Prompt Skill是在教AI怎么做事,新時(shí)代的Prompt Skill是在告訴AI什么叫做好這件事。
而Bohdanowicz正是對此感受最深的人。
他原來的工作流極其嚴(yán)格:調(diào)研、規(guī)劃、實(shí)現(xiàn)、測試,每一步都單獨(dú)下指令。
但換成Fable 5之后,他發(fā)現(xiàn)這套腳手架不僅沒幫助,反而成了負(fù)擔(dān)。
因?yàn)槟P捅旧砭驮谝?guī)劃,額外塞進(jìn)去的人類流程,反而會(huì)限制它判斷任務(wù)邊界。
于是他總結(jié)出一句被廣泛轉(zhuǎn)發(fā)的話:
“別再規(guī)定How(如何),只規(guī)定什么What(什么),以及什么算完成。”
這里有個(gè)容易誤解的地方。這不意味著提示詞不重要了。恰恰相反,機(jī)器能夠驗(yàn)證的驗(yàn)收標(biāo)準(zhǔn),依然是人類最有價(jià)值的輸入。
真正過時(shí)的,是那些手把手教模型做事的過程說明書。
帖子里他還提到一個(gè)此前很少被討論的能力:
爆炸半徑分析(Blast Radius Analysis)。
Fable修改一段代碼之前,會(huì)先把上下游依賴關(guān)系摸一遍,再派出對抗Agent專門挑戰(zhàn)那些隱藏假設(shè),而類似機(jī)制,Bohdanowicz過去是自己手工搭的。
“看到它原生長出來的那一刻,我徹底服了。”
幾個(gè)月搭出來的工作流,一夜之間成了負(fù)資產(chǎn)。
One More Thing
Matt Van Horn那份生存指南的文末,有一行小字。
![]()
這篇關(guān)于Fable 5的文章,由Fable 5協(xié)助完成。它沒有觸發(fā)自己的安全分類器。
第一天,一切正常。
我們不知道未來的SOTA模型會(huì)不會(huì)徹底吞掉那些由人類總結(jié)出來的Workflow、Skill和SOP。
但至少這一周,很多開發(fā)者已經(jīng)發(fā)現(xiàn):
自己研究了幾個(gè)月的提示詞技巧,可能還沒有模型一晚上悟出來的新方法好用。
AI時(shí)代最殘酷的事,或許不是學(xué)不會(huì)。
而是剛學(xué)會(huì),就自動(dòng)化了。
[1]https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/
[2]https://digg.com/tech/zrppa6ui
[3]https://www.oneusefulthing.org/p/what-it-feels-like-to-work-with-mythos
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.