聽雨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI
Codex自家程序員,直接把Codex「自我蒸餾」的秘籍給爆出來了…
只需要把一段提示詞,直接復(fù)制粘貼進(jìn)Codex。
它就會主動翻查你的歷史會話,找出你一直在手動重復(fù)做的事,然后替你把這些工作流打包成可復(fù)用的工具。
![]()
這位Codex成員可以說是相當(dāng)慷慨,經(jīng)過網(wǎng)友反饋之后,他還立馬迭代出了一個2.0版本。
![]()
這怎么說呢…老哥還是太全面了。
OpenAI總裁Greg Brockman也親自趕來轉(zhuǎn)發(fā)點(diǎn)贊了。
![]()
有意思的是,Brockman還同時轉(zhuǎn)發(fā)了一條冷知識:Codex是開源的
![]()
Codex自我蒸餾,怎么做到的?
我們來細(xì)品一下Vabihav(就叫他VB吧)發(fā)布的這兩版提示詞。
第一版是醬嬸兒的:
- 看看我最近的會話,找出重復(fù)的工作流或重復(fù)的請求。
- 對于我一直在手動做的事,給我建議:
- 如果是可復(fù)用工作流,創(chuàng)建一個skill;2. 如果是有邊界的角色或調(diào)查任務(wù),創(chuàng)建一個custom subagent。
- 重點(diǎn)關(guān)注CI失敗、PR審查、changelog、文檔更新、發(fā)版準(zhǔn)備、調(diào)試、測試分診這類實(shí)際工作。
- 只創(chuàng)建有用的,保持簡潔。
![]()
很短,只有9行。
直接把這段提示詞復(fù)制粘貼進(jìn)Codex,它就會開始開始翻你的歷史會話,找出那些你反復(fù)在做的動作。
然后告訴你這件事該做成skill,那件事更適合派個subagent去專門負(fù)責(zé)。
咋說呢,這提示詞簡潔是簡潔。
但CI失敗、PR審查、changelog這些名詞…感覺都太專業(yè)了,好像是程序員專屬提示詞。
果不其然,第一版發(fā)出來之后,評論區(qū)立刻涌進(jìn)了一堆反饋。
VB老哥也是沒閑著,緊趕慢趕當(dāng)天就更新了第二版。
直接把數(shù)據(jù)源和覆蓋范圍都擴(kuò)大了一圈。
提示詞也變長了不少,從9行變成了35行:
![]()
中文版也貼在這里:
回顧我過去30天的工作記錄,找出值得打包的重復(fù)手動工作流。
按優(yōu)先級使用以下數(shù)據(jù)源:最近的Codex會話和任務(wù)摘要;Codex Memories和匯總記錄,找跨會話的重復(fù)模式;如果開了Chronicle,用它發(fā)現(xiàn)Codex以外的重復(fù)工作(僅用于發(fā)現(xiàn),重要細(xì)節(jié)需回原始系統(tǒng)確認(rèn));已有的skill、custom agent和automation,優(yōu)先復(fù)用或擴(kuò)展,不要重復(fù)造輪子。
要廣撒網(wǎng):編碼、調(diào)研、寫作、規(guī)劃、溝通、運(yùn)營、分析、個人事務(wù)都算。
只在以下條件都滿足時才動手:發(fā)生過至少兩次,或明確可能再發(fā)生且重來代價高;有穩(wěn)定輸入、可重復(fù)流程和明確輸出;能實(shí)質(zhì)改善速度、質(zhì)量或可靠性;現(xiàn)有工具還沒覆蓋。選最小適用形式:Skill、Custom subagent、Automation、Skip。
先輸出候選清單,再創(chuàng)建高置信度的項(xiàng)目,最后告訴我創(chuàng)建了什么、跳過了什么、還需要更多證據(jù)的是什么。
和第一版相比呢,主要有三處升級:
數(shù)據(jù)源從「最近會話」擴(kuò)展到了Memories和Chronicle,Codex能看到的東西也是多出不少。
覆蓋范圍從編碼任務(wù)擴(kuò)到寫作、規(guī)劃、溝通、運(yùn)營,幾乎包含了你全部的工作場景。
(不只是程序員哈,咱寫文章的、做運(yùn)營的、搞策劃的都能用了)
![]()
輸出也從「給建議」升級成了「直接創(chuàng)建」,高置信度的條目,它自己就動手了。
打包出來的結(jié)果分四種:
- 每周重復(fù)的固定流程,做成Skill;
- 需要專門角色去搞定的調(diào)查任務(wù),派Subagent;
- 定時觸發(fā)、不需要人盯的檢查,做成Automation;
- 只發(fā)生過一次、邊界模糊的,直接Skip,不打包。
評論區(qū)的反應(yīng)也印證了這條提示詞的實(shí)用性。有網(wǎng)友當(dāng)場喊話:
「把它做成插件,叫 /dream,給我發(fā)版稅。」
![]()
VB本人也在評論里承認(rèn),確實(shí)應(yīng)該做成正式插件,只是dream這個名字…他不太買賬哈。
不過也有網(wǎng)友質(zhì)疑,回看30天的歷史記錄,這得燒多少token啊??
不得不說,token確實(shí)是大家最關(guān)心的問題…
不過VB并沒有給出回應(yīng),可能作為內(nèi)部人員在token方面還是很有保障的吧。
![]()
而且OpenAI最近一直在瘋狂重置Codex的速率限制,感興趣的友友們還是可以大膽一試的。
![]()
還有網(wǎng)友試用后發(fā)現(xiàn),他自動生成的skill有一半來自「在輸入還沒穩(wěn)定的時候就做過兩次的事」。
結(jié)果維護(hù)這些抽象的成本比直接重做還高。
他的問題是:到底是讓Codex自己判斷要不要打包,還是人工把關(guān)?
![]()
它依賴哪些Codex新功能
可能大家也看出來了。
VB這條提示詞涉及的Chronicl、Memory和Subagent,都是Codex這兩個月猛猛連發(fā)的幾個新功能。
最新的是Chronicle,4月20日剛上線,目前還是預(yù)覽版。
![]()
它的作用是屏幕截取,如果你開了這個功能,Codex就能看到你在瀏覽器、Slack、郵件里做了什么。
當(dāng)然,它也可以看到你所做的重復(fù)工作了。
不過,Chronicle目前只對macOS上的ChatGPT Pro訂閱用戶開放,而且記憶未加密存儲在本地,會快速消耗rate limit,提示詞注入風(fēng)險也更高。
Memory功能,是4月16日隨Codex大更新一起上線的,也是預(yù)覽功能。
它可以記住用戶偏好、修正記錄和項(xiàng)目專屬知識,并在未來會話中自動調(diào)用。
![]()
Subagent功能則更早一些,3月正式上線。
它由一個管理Agent協(xié)調(diào)多個專門編碼Agent,每個Agent在獨(dú)立的云端沙盒中運(yùn)行。
![]()
VB,一個愛整活的OpenAI員工
最后我們來介紹一下Vaibhav Srivastav,這也是一個很有意思的人。
![]()
他是OpenAI Codex團(tuán)隊(duì)成員,也是前HuggingFace成員。
曾在HuggingFace擔(dān)任機(jī)器學(xué)習(xí)開發(fā)者布道師,以及開發(fā)者體驗(yàn)與社區(qū)負(fù)責(zé)人。
他應(yīng)該是目前Codex生態(tài)里最能整活的內(nèi)容輸出者之一。
在他的X賬號里,全是他依賴Codex處理日常事務(wù)的印記。
就在昨天,他還在試圖用Codex配置自己的樹莓派,確保設(shè)備接入家庭WiFi后能遠(yuǎn)程訪問。
![]()
而在5月22日,他宣稱自己「已經(jīng)超過一個月沒有打開過IDE了」,光用Codex已經(jīng)完全足夠。
「一個App統(tǒng)治一切!」
![]()
真是Codex最最最忠實(shí)的粉絲了。
除了這條自我蒸餾提示詞,從他的推文里,量子位還挖出了不少Codex有意思的玩法。
比如Codex的/goal 命令:給Codex定一個「完成態(tài)」,告訴它成功的樣子是什么,然后讓它一直跑到達(dá)成目標(biāo)。
![]()
背后有一個驗(yàn)證器在每一步結(jié)束后判斷「目標(biāo)是否達(dá)成」,如果沒有,主模型繼續(xù)執(zhí)行。
這個功能特別適合大規(guī)模重構(gòu)、代碼遷移、長期實(shí)驗(yàn),或者那些「只要不停就能做完」的任務(wù)。
Codex 0.128.0版本起可用,通過 /goal 命令觸發(fā)。
感興趣的友友們,鏈接已經(jīng)附在下方,快打開你的Codex試試吧~
[1]https://x.com/reach_vb/status/2058538305872949490
[2]https://x.com/reach_vb/status/2052805243268718803
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.