![]()
新智元報道
![]()
【新智元導讀】Fable 5剛解禁就接入了Claude Tag。往后最吃香的,不再是最會寫代碼的人,是最會驗收AI干活的人。
Fable 5剛被放回,就接入Claude Tag,住進工作群,變成一個能連著跑好幾天、還會自己給你發PR的同事。
你不用再守著它補全下一行,只管派下一個活。
過去,一個人坐在那兒,一次敲一行代碼。后來,一個人帶著十個Claude,一次寫一堆功能。
而現在,方向盤直接遞到了Claude手里,坐在它對面的也不再是一個人,是一整個團隊。
Claude,從一輛車,變成了開車的人。
![]()
Boris Cherny回憶AI輔助編程的兩次躍遷:過去一個人對著屏幕一次敲一行代碼,現在一個人身邊帶著十來個Claude,一次并行寫一堆功能。(圖源:Anthropic官方視頻)
Claude Code之父Boris Cherny說:
有了Tag,它把整件事全干了。寫完一個功能,端到端跑完一個實驗,連數據分析都包了。兩年,跨了兩大步。
兩年前,Boris還在用輸入聯想(typeahead)寫代碼。AI幫你補半行,這行怎么落,還得你自己拍板。
今天,他手上跑著幾十個Claude Tag會話,有的連著跑了幾天,有的跑了幾周。
他每天做的事,就是看著PR一個一個提上來,看著數據一份一份發過來。
Boris甩出的一個數字更狠:產品團隊65%的代碼,現在由內部版Claude Tag寫出,而且這個比例還會持續攀升。
![]()
![]()
這個65%,是「代碼占比」,并非「65%的PR自主完成」。
但它已經夠說明問題:Anthropic內部,「@一下AI派活」已經變成主流的干活方式。
一個人也能擁有一支Claude小隊
6月23日,Anthropic把Claude Tag扔進了Slack。
最大的一個變化:你手里的AI不再是一個工具,而是一個能替你干活的隊友。
![]()
Anthropic官方演示中,@一下Claude即可派活。(圖源:Anthropic官方視頻)
官方給Claude Tag的定位不是又一個聊天機器人,而是Claude Code的一次演進。
從此,Claude Code、Claude Tag、Fable 5,三條產品線,各干一攤。
Claude Code就像個埋頭干活的老師傅。
它管的是「改代碼」,是面向開發者的智能體編碼工具(agentic coding tool),能讀懂你的代碼庫、編輯文件、修bug、跑測試。
你把代碼庫丟給它,它悶聲不響就改好了。
Claude Tag是群里那個攬活的工頭。
它管的是「派任務」,你在Slack群里@一下Claude,說清要什么,它就把任務拆成幾個階段,一段一段往下推,調用它有權限的工具。
干完,在Slack線程里回你一句它辦成了啥。
Fable 5是全隊的體力兼腦力擔當。它管的是「能扛多重的活」,是這三個中的大腦。大型遷移、復雜重構、要連著跑好幾天的任務,都能頂上。
前兩個把臺子搭好,真正把重擔挑起來的就是它。
三個湊一塊,就等于一個人有了一支Claude小隊。
前兩個都是殼
Fable 5才是發動機
Claude Tag是入口,Claude Code是手腳,真正讓它敢接長活的,是底下的大腦Fable 5。
它到底比別的模型強在哪?答案是:它能自己把一件大事從頭扛到尾。
在Claude Code這類智能體運行框架(agent harness)里,Fable 5能連著跑好幾天(work for days at a time)。
它自己排布幾個階段的活,忙不過來就把子任務甩給子智能體,末了還回頭把自己干的檢查一遍。
任務越長越復雜,它甩開其他模型的差距就越大。
Cherny還在官方視頻里透露了一個數字:按最新的METR評估,前沿模型的自主任務時長已經爬到16小時這條線附近,甚至進了「連它到底能跑多久都測不準」的區間。
![]()
不同模型能以50%成功率完成的任務時長,六年間沿指數曲線一路爬升。圖頂斜紋區標注:超過16小時的測量,現有任務集已經測不準了。(圖源:METR)
而在Claude Tag里,模型能給自己排后續的活,一個16小時的任務,可以被它自己續到幾天、幾周之后再接著干。
這里需要注意的是,長任務能力,并非單純模型的功勞。
這一點,Anthropic在自己的工程博客里講得很透徹。
長期運行的智能體最大的坎,是它只能分段干活,每開一個新會話都失憶,就像一個工程項目輪班倒,每個新來的工程師都不記得上一班干了啥。
光靠上下文壓縮(compaction)不夠,模型要么想一口氣把整個app寫完,中途撐爆上下文;要么看一眼有進展,就宣布「完工」。
Anthropic的解法是給它配一套「班組交接」的機制:一個初始化智能體先搭好環境,寫好進度文件和功能清單。
后面每個編碼智能體只干一件事,干完把進度提交到git、寫清楚交接說明,再交給下一班。
所以真正的變化是「模型+框架+工具鏈」的系統能力。
Fable 5干的事,是把這套系統的上限,從小時級延長到了天級。
PR成了新的交付單位
當然,對于普通開發者,也先別急著把整個代碼庫交出去。
一個正確的打開方式,是先把那些低風險、邊界清晰、有測試可驗收的活,切成一個個任務交給智能體跑。
在Anthropic那條介紹Claude Tag的官方視頻里,用法都是一些很日常的場景。
Boris自己說,他平時用得隨手得很。誰報個bug,按鈕偏了幾像素,他一句「幫我修一下」就甩過去;碰上個數據問題,扔給Tag先跑一遍就完事。
而那些跑了好幾天的會話,本質是一個長期實驗:Tag每天替他查數據,偶爾冒個bug就順手發個修復,PR自己就一個個提上來了。
因此,這里有一個關鍵的使用分水嶺,并非你敢不敢把活全交給AI,而是你會不會把任務切成AI能驗收的顆粒度。
給AI派活的最小單位,正在從一個函數,變成一個PR。
新的門檻
不是prompt
當AI能跑多日任務、能自己提PR,人的價值挪到哪去了?
Anthropic給的答案是:工程師轉向架構、產品判斷和持續編排——并行管起多個智能體,給方向,做那些真正決定「要造什么」的決策。
但AI提上來的PR,終究要有人點下合并(merge),即把某個分支上的代碼改動并進主代碼庫,相當于給這份代碼蓋章放行、正式采納。
這意味著,程序員最稀缺的能力,也在悄悄改變。
過去你比誰更會寫prompt、更會問問題;往后你比誰更會寫任務邊界、測試標準、review清單和回滾方案。
寫代碼的門檻在降,驗收代碼的門檻在升。
下一個吃香的工種,可能是最會給智能體定驗收標準的人。
![]()
AI已經幾乎能把代碼寫完了。
剩下的問題只有一個:它寫的代碼,你敢不敢認,會不會認。
參考資料:
https://x.com/claudeai/status/2072725610061803522?s=20https://youtu.be/MhfnicQVkgY
https://www.anthropic.com/news/introducing-claude-tag
https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/
編輯:元宇
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.