網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

Codex自我蒸餾玩法火了！OpenAI員工：復(fù)制就能讓AI消滅重復(fù)勞動

2026-05-27 13:16:01　來源: 量子位

北京舉報(bào)

分享至

聽雨發(fā)自凹非寺量子位 | 公眾號 QbitAI

Codex自家程序員，直接把Codex「自我蒸餾」的秘籍給爆出來了…

只需要把一段提示詞，直接復(fù)制粘貼進(jìn)Codex。

它就會主動翻查你的歷史會話，找出你一直在手動重復(fù)做的事，然后替你把這些工作流打包成可復(fù)用的工具。

這位Codex成員可以說是相當(dāng)慷慨，經(jīng)過網(wǎng)友反饋之后，他還立馬迭代出了一個2.0版本。

這怎么說呢…老哥還是太全面了。

OpenAI總裁Greg Brockman也親自趕來轉(zhuǎn)發(fā)點(diǎn)贊了。

有意思的是，Brockman還同時轉(zhuǎn)發(fā)了一條冷知識：Codex是開源的

Codex自我蒸餾，怎么做到的？

我們來細(xì)品一下Vabihav（就叫他VB吧）發(fā)布的這兩版提示詞。

第一版是醬嬸兒的：

看看我最近的會話，找出重復(fù)的工作流或重復(fù)的請求。
對于我一直在手動做的事，給我建議：

如果是可復(fù)用工作流，創(chuàng)建一個skill；2. 如果是有邊界的角色或調(diào)查任務(wù)，創(chuàng)建一個custom subagent。

重點(diǎn)關(guān)注CI失敗、PR審查、changelog、文檔更新、發(fā)版準(zhǔn)備、調(diào)試、測試分診這類實(shí)際工作。
只創(chuàng)建有用的，保持簡潔。

很短，只有9行。

直接把這段提示詞復(fù)制粘貼進(jìn)Codex，它就會開始開始翻你的歷史會話，找出那些你反復(fù)在做的動作。

然后告訴你這件事該做成skill，那件事更適合派個subagent去專門負(fù)責(zé)。

咋說呢，這提示詞簡潔是簡潔。

但CI失敗、PR審查、changelog這些名詞…感覺都太專業(yè)了，好像是程序員專屬提示詞。

果不其然，第一版發(fā)出來之后，評論區(qū)立刻涌進(jìn)了一堆反饋。

VB老哥也是沒閑著，緊趕慢趕當(dāng)天就更新了第二版。

直接把數(shù)據(jù)源和覆蓋范圍都擴(kuò)大了一圈。

提示詞也變長了不少，從9行變成了35行：

中文版也貼在這里：

回顧我過去30天的工作記錄，找出值得打包的重復(fù)手動工作流。

按優(yōu)先級使用以下數(shù)據(jù)源：最近的Codex會話和任務(wù)摘要；Codex Memories和匯總記錄，找跨會話的重復(fù)模式；如果開了Chronicle，用它發(fā)現(xiàn)Codex以外的重復(fù)工作（僅用于發(fā)現(xiàn)，重要細(xì)節(jié)需回原始系統(tǒng)確認(rèn)）；已有的skill、custom agent和automation，優(yōu)先復(fù)用或擴(kuò)展，不要重復(fù)造輪子。

要廣撒網(wǎng)：編碼、調(diào)研、寫作、規(guī)劃、溝通、運(yùn)營、分析、個人事務(wù)都算。

只在以下條件都滿足時才動手：發(fā)生過至少兩次，或明確可能再發(fā)生且重來代價高；有穩(wěn)定輸入、可重復(fù)流程和明確輸出；能實(shí)質(zhì)改善速度、質(zhì)量或可靠性；現(xiàn)有工具還沒覆蓋。選最小適用形式：Skill、Custom subagent、Automation、Skip。

先輸出候選清單，再創(chuàng)建高置信度的項(xiàng)目，最后告訴我創(chuàng)建了什么、跳過了什么、還需要更多證據(jù)的是什么。

和第一版相比呢，主要有三處升級：

數(shù)據(jù)源從「最近會話」擴(kuò)展到了Memories和Chronicle，Codex能看到的東西也是多出不少。

覆蓋范圍從編碼任務(wù)擴(kuò)到寫作、規(guī)劃、溝通、運(yùn)營，幾乎包含了你全部的工作場景。

（不只是程序員哈，咱寫文章的、做運(yùn)營的、搞策劃的都能用了）

輸出也從「給建議」升級成了「直接創(chuàng)建」，高置信度的條目，它自己就動手了。

打包出來的結(jié)果分四種：

每周重復(fù)的固定流程，做成Skill；
需要專門角色去搞定的調(diào)查任務(wù)，派Subagent；
定時觸發(fā)、不需要人盯的檢查，做成Automation；
只發(fā)生過一次、邊界模糊的，直接Skip，不打包。

評論區(qū)的反應(yīng)也印證了這條提示詞的實(shí)用性。有網(wǎng)友當(dāng)場喊話：

「把它做成插件，叫 /dream，給我發(fā)版稅。」

VB本人也在評論里承認(rèn)，確實(shí)應(yīng)該做成正式插件，只是dream這個名字…他不太買賬哈。

不過也有網(wǎng)友質(zhì)疑，回看30天的歷史記錄，這得燒多少token啊？？

不得不說，token確實(shí)是大家最關(guān)心的問題…

不過VB并沒有給出回應(yīng)，可能作為內(nèi)部人員在token方面還是很有保障的吧。

而且OpenAI最近一直在瘋狂重置Codex的速率限制，感興趣的友友們還是可以大膽一試的。

還有網(wǎng)友試用后發(fā)現(xiàn)，他自動生成的skill有一半來自「在輸入還沒穩(wěn)定的時候就做過兩次的事」。

結(jié)果維護(hù)這些抽象的成本比直接重做還高。

他的問題是：到底是讓Codex自己判斷要不要打包，還是人工把關(guān)？

它依賴哪些Codex新功能

可能大家也看出來了。

VB這條提示詞涉及的Chronicl、Memory和Subagent，都是Codex這兩個月猛猛連發(fā)的幾個新功能。

最新的是Chronicle，4月20日剛上線，目前還是預(yù)覽版。

它的作用是屏幕截取，如果你開了這個功能，Codex就能看到你在瀏覽器、Slack、郵件里做了什么。

當(dāng)然，它也可以看到你所做的重復(fù)工作了。

不過，Chronicle目前只對macOS上的ChatGPT Pro訂閱用戶開放，而且記憶未加密存儲在本地，會快速消耗rate limit，提示詞注入風(fēng)險也更高。

Memory功能，是4月16日隨Codex大更新一起上線的，也是預(yù)覽功能。

它可以記住用戶偏好、修正記錄和項(xiàng)目專屬知識，并在未來會話中自動調(diào)用。

Subagent功能則更早一些，3月正式上線。

它由一個管理Agent協(xié)調(diào)多個專門編碼Agent，每個Agent在獨(dú)立的云端沙盒中運(yùn)行。

VB，一個愛整活的OpenAI員工

最后我們來介紹一下Vaibhav Srivastav，這也是一個很有意思的人。

他是OpenAI Codex團(tuán)隊(duì)成員，也是前HuggingFace成員。

曾在HuggingFace擔(dān)任機(jī)器學(xué)習(xí)開發(fā)者布道師，以及開發(fā)者體驗(yàn)與社區(qū)負(fù)責(zé)人。

他應(yīng)該是目前Codex生態(tài)里最能整活的內(nèi)容輸出者之一。

在他的X賬號里，全是他依賴Codex處理日常事務(wù)的印記。

就在昨天，他還在試圖用Codex配置自己的樹莓派，確保設(shè)備接入家庭WiFi后能遠(yuǎn)程訪問。

而在5月22日，他宣稱自己「已經(jīng)超過一個月沒有打開過IDE了」，光用Codex已經(jīng)完全足夠。

「一個App統(tǒng)治一切！」

真是Codex最最最忠實(shí)的粉絲了。

除了這條自我蒸餾提示詞，從他的推文里，量子位還挖出了不少Codex有意思的玩法。

比如Codex的/goal 命令：給Codex定一個「完成態(tài)」，告訴它成功的樣子是什么，然后讓它一直跑到達(dá)成目標(biāo)。

背后有一個驗(yàn)證器在每一步結(jié)束后判斷「目標(biāo)是否達(dá)成」，如果沒有，主模型繼續(xù)執(zhí)行。

這個功能特別適合大規(guī)模重構(gòu)、代碼遷移、長期實(shí)驗(yàn)，或者那些「只要不停就能做完」的任務(wù)。

Codex 0.128.0版本起可用，通過 /goal 命令觸發(fā)。

感興趣的友友們，鏈接已經(jīng)附在下方，快打開你的Codex試試吧~

[1]https://x.com/reach_vb/status/2058538305872949490
[2]https://x.com/reach_vb/status/2052805243268718803

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.