无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

碼農(nóng)連任務(wù)都不寫了?Codex開始自己給自己派活

0
分享至


新智元報道


【新智元導(dǎo)讀】從寫指令,到給目標,再到只給一句意圖:有人干脆讓Codex自己定任務(wù)——人類還能留在編程的計劃層嗎?

「我基本上再也不自己寫/goal了。」

近日,前Anthropic成員、現(xiàn)MagicPath CEO的Pietro Schirano在X上甩出這句話,評論區(qū)瞬間炸開。


他的做法是:不再手寫那份/goal,而是讓Codex為自己寫一份,再為它派生的每個子智能體(agent)各寫一份。

把一個高層意圖丟給Codex,讓它先給自己寫一份詳細的/goal——怎么拆任務(wù)、哪些并行、最后怎么匯總,全由模型自己定。

從頭到尾,人類只用在最開始說出自己的意圖,剩下的拆解、調(diào)度、收尾,模型自己都能安排得明明白白。

Pietro Schirano @skirano在X上分享的演示視頻

別小看Pietro這句話,這次他交給AI的并非是體力,而是判斷力:過去開發(fā)者交給AI的是「怎么寫」,這一次交出去的是「寫什么」。

先是寫一句提示詞,AI把活干了。

后來連提示詞都懶得細寫,只丟一句模糊的目標,剩下怎么做、分幾步,讓它自己琢磨。

到現(xiàn)在,索性連「目標」都不寫了。

評論區(qū)一位網(wǎng)友感嘆道:

我們好像已經(jīng)進入這樣一個時代:我給AI一個目標,AI把這個目標改得更好,然后我禮貌地假裝自己一直是那個項目經(jīng)理。

這句話剛好戳中了這次變遷的核心。

當(dāng)一個程序員連「要干什么」都不再親手寫,他在這條流水線上,到底還剩下什么?

人只管給意圖

任務(wù)交給agent去想

過去幾年,提示詞工程被捧成AI時代的硬技能。會寫提示詞,就好比握住了駕馭模型的關(guān)鍵。

再往后是元提示(meta-prompting):你不直接寫指令,而是讓模型幫你把指令寫得更好。

而這次Codex所演示的更進一步:自生成目標(self-goal generation)。模型并非把你的話潤色成更漂亮的指令,它直接接管了「目標」本身:你給意圖,它寫/goal。

這套玩法的底座,是Codex今年4月底上線的/goal功能,先在Codex CLI里出現(xiàn),近期在config.toml里把features.goals打開就能用。

官方把它塞進Codex CLI的0.128.0版本,默認關(guān)閉,要手動改配置文件才能打開。

開發(fā)者圈給它起了個外號,叫「Ralph循環(huán)」:規(guī)劃、執(zhí)行、測試、復(fù)查、迭代,一路自轉(zhuǎn),不到目標不收手。

它與普通對話提示詞最大的不同,是goal這段文字會同時充當(dāng)兩樣?xùn)|西:起始指令,和「完成審計」。

Codex每跑完一輪,就回頭對照目標問自己兩句:還該做什么,是不是已經(jīng)做完了。一輪接一輪,直到任務(wù)完成、被你叫停,或者token燒到上限。

所以官方反復(fù)強調(diào)一件事:目標一定要寫到Codex能判斷「做完沒有」,要避免「優(yōu)化一下」「完善一下」這種虛詞。

真正給這件事定調(diào)的,是OpenAI的Codex負責(zé)人Tibo(Thibault Sottiaux)。


他在X上說,我們造的每一個工具,都同時是給智能體用的:

Codex能查看、也能設(shè)置自己的/goal。這是元提示的泛化,用一句話概括就是:人給意圖,智能體來生成任務(wù)。

開發(fā)者@MikelEcheve把這套能力進一步解釋為:Codex能自建/goal、為并行的智能體生成目標、自主切分工作。


Codex自述:「因為你明確要并行智能體,我就用多智能體工具」,并已「Created an agent」,右側(cè)子智能體面板出現(xiàn)首個分身Gibbs。圖源:Pietro Schirano @skirano演示視頻

有人已經(jīng)用它干了18個小時

/goal的自轉(zhuǎn)能力,已經(jīng)有人拿真實項目驗證過。

有開發(fā)者實測:給Codex一句高層目標,把BACKLOG.md里的18個功能全部交付,然后人就離開了。

約18小時后回來,Codex已經(jīng)自主實現(xiàn)其中14個,每一處改動都過了測試、在CI里合并,全程沒要一次人工點頭,連代碼自審都交給了GPT子智能體。

算下來,這趟跑了約4.20美元。

skirano展示的,是更上面那一層:不只讓Codex執(zhí)行一份goal,而是讓它給自己和每個子智能體各寫一份goal,智能體的層級自動就長了出來。

只丟給它一句話,Codex就把該干全干了。


運行約10秒,狀態(tài)變?yōu)椤窩reating 2 agents」,右側(cè)子智能體已擴展為Gibbs與Leibniz兩個并行分身。圖源:Pietro Schirano @skirano演示視頻


主智能體「Created 3 agents」,右窗子智能體Gibbs正在執(zhí)行自己的專屬/goal:設(shè)計一條數(shù)學(xué)化的過山車軌道。各自一份goal,正是這套打法的核心。圖源:Pietro Schirano @skirano演示視頻

這套打法正在被模板化。

開發(fā)者Pablo Stanley把它做成了模板,給出一套「Build [THING]+功能+風(fēng)格」的提示詞框架,讓Codex照著自動生成goal、再孵化對應(yīng)的子智能體。整套流程,人只負責(zé)開頭那句話。這個模板被skirano本人點贊。

在Reddit的r/codex社區(qū),開發(fā)者已經(jīng)用/goal做長期任務(wù)對齊、自動生成驗收標準、規(guī)避死循環(huán)。

另一位開發(fā)者RTK(@riverkhan)走得更遠。OpenAI團隊前不久發(fā)了一篇講怎么把/goal用好的文章,他直接把里面的最佳實踐封裝成開源skill,取名Infinite Skills,仿照Superpowers的結(jié)構(gòu),每個skill就是skills目錄下扁平的一份SKILL.md。

里頭那個叫g(shù)oal的skill,干的事很有意思:在你正式發(fā)起/goal之前,它先反過來「面試」你,把一個含糊的目標,一句句盤問成具體、可驗證的契約,再把整理好的完整目標喂給goal模式。


https://github.com/Infinite-Labs-AI/infinite-skills

換句話說,goal模式跑得好不好,本就取決于目標寫得夠不夠具體、能不能讓Codex自己判斷做完沒有。

如今連「把目標盤問清楚」這一步,都有人做成工具替你包辦了。

三家把同一件事做了

這股潮流并非Codex獨自引領(lǐng)。

幾乎在同一個時間窗口里,三家主流編程智能體,把「讓AI自己拆任務(wù)、自己派智能體」這項功能,不約而同地推了出來。

Anthropic的多智能體編排5月6日上線,Cursor的/orchestrate只隔一天、5月7日跟上。

再往前推到4月底,Codex早把/goal這塊自治循環(huán)這層底子鋪好了。

三家?guī)缀跏乔昂竽_,方向卻出奇一致。

社區(qū)里很快有網(wǎng)友把它和Claude Code的CLAUDE.md放在一起比較:同樣是讓智能體讀一份「寫給自己看的說明」,再據(jù)此行動。

因此,它更像一個跨產(chǎn)品的共性方向,而非某一家的獨門特性。

有意思的是細節(jié)上的取舍。

Claude的coordinator最多能派20個subagent,而且刻意限制只派一層:深度超過1,直接忽略。

這和Codex那種放手并行派生的路子,正好是兩種心態(tài)。

這背后藏著一條更長的線。

當(dāng)Codex能給自己、給一群子智能體派活,它就不再只是一個寫代碼的助手,而更像一個跑在后臺的任務(wù)調(diào)度器,寫代碼只是它順手能干的一件事。

OpenAI想讓智能體自己設(shè)定任務(wù),盯著的顯然是比「幫人寫代碼」大得多的盤子。

小心token賬單爆了

自己寫目標、自己派agent,聽上去很爽,但代價就是可能刷爆你的token賬單。

任務(wù)跑得越久、越不需要人盯,token就燒得越兇。

a16z的Andrew Chen,拿/goal在一個真實的eGPU加Mac設(shè)備驅(qū)動項目上跑了一整夜:不是教學(xué)demo,是真干活,14小時過去,第二天早上它還在推進。

Andrew Chen直言,這會讓token用量翻一萬倍。


你手動提20次、每次盯著看的會話,撐死幾十萬token;一個跑14小時、沒人管的會話,量級完全不是一回事。

就連官方也在教人踩剎車:建議你在goal末尾加一句token預(yù)算,也別一上來就發(fā)/goal,先把項目跑出個雛形再說。

目標會漂

智能體可能偷懶

熱鬧歸熱鬧,社區(qū)的討論里,質(zhì)疑聲并不少:

讓AI自己寫目標,會不會出現(xiàn)目標漂移,跑著跑著就偏了?

智能體會不會偷懶,專挑省事的近路走?

這套東西,到底進不進得了真正的生產(chǎn)環(huán)境?

Reddit的r/codex里,大家把/goal主要還是用在長任務(wù)對齊、生成驗收標準、避免死循環(huán)上:本質(zhì)上,還是「人得在旁邊盯著」的狀態(tài)。

網(wǎng)友nick吐槽,再讓它遞歸派生幾層,Codex的首要目標,怕是要變成把我們重構(gòu)出局。

而Claude那個「只派一層」的限制也說明今天的所謂自治,更像是帶著護欄的放權(quán),離一個真正完整的自治多智能體系統(tǒng),還有很遠的距離。

但真正的遷移正在發(fā)生,人從規(guī)劃層后移了一步:先是不寫代碼,后是不寫任務(wù),如今只剩下一句話。

當(dāng)Codex、Cursor、Claude集體把「定義任務(wù)」也交還給模型,新的問題是當(dāng)代碼、任務(wù)、意圖一層層交出去之后,程序員要如何重新定義自己的角色。

參考資料:

https://x.com/thsottiaux/status/2066270561081454989

https://x.com/skirano/status/2066225908202053818

https://github.com/Infinite-Labs-AI/infinite-skills

編輯:元宇


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
西班牙vs佛得角前瞻:新軍遇上奪冠大熱門 西班牙掌控比分

西班牙vs佛得角前瞻:新軍遇上奪冠大熱門 西班牙掌控比分

智道足球
2026-06-15 15:11:19
凌晨客流仍為0!杭州最“孤獨”世界杯看球點,老板“認輸”

凌晨客流仍為0!杭州最“孤獨”世界杯看球點,老板“認輸”

極目新聞
2026-06-15 17:33:41
形勢有多嚴峻?坐標上海:80末90初程序員都開始失業(yè),評論區(qū)炸了

形勢有多嚴峻?坐標上海:80末90初程序員都開始失業(yè),評論區(qū)炸了

慧翔百科
2026-05-14 09:00:11
“小面事件”發(fā)酵!網(wǎng)友稱出餐流程和煮方便面毫無差別,賣到30元

“小面事件”發(fā)酵!網(wǎng)友稱出餐流程和煮方便面毫無差別,賣到30元

火山詩話
2026-06-15 05:16:55
中國網(wǎng)協(xié)公示!鄭欽文無緣亞運會參賽名單,上屆曾在主場奪冠

中國網(wǎng)協(xié)公示!鄭欽文無緣亞運會參賽名單,上屆曾在主場奪冠

全景體育V
2026-06-15 18:50:05
英格蘭涼了!圖赫爾世界杯作死!棄用最佳球員,要上半年沒踢球的

英格蘭涼了!圖赫爾世界杯作死!棄用最佳球員,要上半年沒踢球的

奶蓋熊本熊
2026-06-16 00:58:34
震撼!美國頂級芯片工程師確認:華為無需ASML依舊能實現(xiàn)1.4nm

震撼!美國頂級芯片工程師確認:華為無需ASML依舊能實現(xiàn)1.4nm

林子說事
2026-06-15 17:16:57
55歲男子患有肝硬化每天吃豬肝,半年后復(fù)查,醫(yī)生:你都吃了什么

55歲男子患有肝硬化每天吃豬肝,半年后復(fù)查,醫(yī)生:你都吃了什么

芹姐說生活
2026-06-08 15:25:46
外媒:阿爾及利亞將購買殲-10C和空警-500,歐洲緊張

外媒:阿爾及利亞將購買殲-10C和空警-500,歐洲緊張

世家寶
2026-06-15 22:18:54
楊坤補位《歌手2026》:直播讓"歌手"二字更有分量

楊坤補位《歌手2026》:直播讓"歌手"二字更有分量

北青網(wǎng)-北京青年報
2026-06-15 17:40:02
花旗:AMD GPU被嚴重低估

花旗:AMD GPU被嚴重低估

快科技
2026-06-15 18:36:03
既然給臉不要臉,那就徹底撕破臉!王毅外長已經(jīng)把話挑明了

既然給臉不要臉,那就徹底撕破臉!王毅外長已經(jīng)把話挑明了

安安說
2026-02-01 14:01:51
中國靈活就業(yè)者突破3.2億大關(guān),占就業(yè)人口比例高達44%。

中國靈活就業(yè)者突破3.2億大關(guān),占就業(yè)人口比例高達44%。

流蘇晚晴
2026-06-13 18:21:18
油價大跌超8毛/升,“創(chuàng)2個多月新低”的油價,6月18日或再大跌

油價大跌超8毛/升,“創(chuàng)2個多月新低”的油價,6月18日或再大跌

油價早知道
2026-06-14 01:49:21
姆巴佩:22年世界杯決賽后沒哭不是忍住了,而是當(dāng)時被打懵了

姆巴佩:22年世界杯決賽后沒哭不是忍住了,而是當(dāng)時被打懵了

懂球帝
2026-06-15 02:28:11
觸目驚心!惠州博羅突降暴雨,數(shù)十輛汽車漂浮在水面上,僅露車頂

觸目驚心!惠州博羅突降暴雨,數(shù)十輛汽車漂浮在水面上,僅露車頂

火山詩話
2026-06-15 15:13:28
美國媒體:日本隊和日本球迷是最整潔的,世界杯48隊他們排名第一

美國媒體:日本隊和日本球迷是最整潔的,世界杯48隊他們排名第一

楊華評論
2026-06-14 22:08:14
陽氣入髓,百病全退!記住這個補陽正確的順序,把陽氣補進骨縫里

陽氣入髓,百病全退!記住這個補陽正確的順序,把陽氣補進骨縫里

垚垚分享健康
2026-06-15 20:15:10
四野旅長王化一授銜少校,苦笑申請轉(zhuǎn)業(yè)去往大連,7年后送上情報

四野旅長王化一授銜少校,苦笑申請轉(zhuǎn)業(yè)去往大連,7年后送上情報

磊子講史
2026-06-08 14:09:21
網(wǎng)傳多家互聯(lián)網(wǎng)大廠在裁員,裁員比例很高!

網(wǎng)傳多家互聯(lián)網(wǎng)大廠在裁員,裁員比例很高!

燈錦年
2026-06-15 15:38:26
2026-06-16 01:44:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
15476文章數(shù) 66926關(guān)注度
往期回顧 全部

科技要聞

白宮一個電話,最強Claude上線三天就沒了

頭條要聞

從副部級降為副處級后 王鐵再次被查

頭條要聞

從副部級降為副處級后 王鐵再次被查

體育要聞

世界杯開賽4天,亞足聯(lián)依然保持不敗!

娛樂要聞

黃大煒猝逝過程太離奇,母親追查真相

財經(jīng)要聞

活鼠、活蛆、農(nóng)殘超標 山姆回應(yīng)被約談

汽車要聞

網(wǎng)易X智己 夏日尊享內(nèi)購會,熱力收官

態(tài)度原創(chuàng)

本地
時尚
教育
手機
公開課

本地新聞

當(dāng)年輕人重新愛上黃金,非遺有了新的打開方式

女人不管多大年齡,夏天都應(yīng)該準備一條短褲,舒適百搭又松弛

教育要聞

明確:這類復(fù)讀生,高考減少志愿填報數(shù)量!

手機要聞

麒麟9030被拆解:沒有EUV的突圍,卻仍贏了Intel 18A!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版