網易首頁 > 網易號 > 正文申請入駐

Codex正經歷GPT時刻？我們更關心的是它居然能自己賺錢 | AI實測

2026-05-12 19:27:54　來源: 頭號AI玩家

上海舉報

分享至

作者 | 博雯

編輯 | 張潔

最近Codex來了波大更新，直接接管了谷歌瀏覽器，整個AI圈又玩嗨了。

有人拿它做多人在線小游戲，有人拿它編學術PPT，甚至還有個叫Chris的開發者給Codex丟下一條“去掙5美元”的指令，結果22小時內，Codex居然真自己找了個開源安全審計的賞金路徑，完成并提交了PR，16美元就這么成功到賬。

這一下可真在開發者圈子炸了鍋了，Chris這條帖子短短一天就超過了上百萬瀏覽量，奧特曼看到估計都要笑開花了。

畢竟在去年年初，奧特曼就預言說，2025年可能看到第一批AI智能體“加入勞動力大軍”，并實質性改變公司產出。

現在看來，自家的Codex似乎成為了他最好的證據。

奧特曼顯然也對Codex十分滿意，就在今年五一假期前，他就發帖稱“Codex正在經歷一個ChatGPT時刻”，一句話獲得97萬閱讀。

這句話發出一周后，Codex谷歌瀏覽器插件于5月8日正式推出，在AI圈掀起一陣熱潮。

事實上，從4月30日奧特曼這句話之后，Codex的下載量就開始暴漲。根據海外AI數據平臺TickerTrends，從4月30日到5月3日，Codex的npm下載量達到8610萬次，周環比暴漲1397%。而到了5月8日，這個數字進一步攀升至單周9000萬。

相對應的，老對頭Claude Code則跌至720萬次。

也難怪在X、抖音、小紅書等多個社區，Codex已經成了不少開發者口中“腳踩Claude Code”“干翻所有AI瀏覽器”的存在了……

那么，Codex新功能真有那么厲害嗎？“AI新榜”也進行了一波實測。

0代碼生成小游戲？

響應速度較慢，仍面向專業程序員

這次Codex最核心的更新，就是上線了谷歌瀏覽器插件——讓用戶在桌面，即可操控以前需要打開網頁才能使用的功能，比如測試Web應用、看控制臺、調試、登錄各種內部系統等等。

而且它可以打開多個標簽并行處理，不會霸占瀏覽器，不影響人工同時操作電腦。

對于一天大部分工作時間都泡在瀏覽器上的現代人來說，這聽起來確實很讓人興奮。

官方演示里也給了一個挺有意思的案例，用Codex控制谷歌瀏覽器，同時派出4個AI子代理，用各自的瀏覽器標簽頁一起玩一個多人畫圖游戲。

這就和以前見到的AI編程不一樣了，不僅是測試代碼成果，還能協調多個AI代理并行測試復雜的網頁交互場景，比如多人協作/多人在線應用這種人工測試比較麻煩的流程。

于是我們模仿這個官方案例，做了一個“胡鬧廚房mini版”，同樣設置了四個玩家位，分別負責切菜、傳菜、滅火、收錢，由系統隨機生成客人需求，四個玩家共同配合出餐。

和官方演示稍有不同的是，它直接新增了一個多人測試臺，同時打開了四個真實的客戶端頁面，點擊“開始四人協作”之后就能看到四個頁面并排運行：P1切菜、P2傳菜、P3滅火、P4收錢，各自做自己的事，每個操作都會實時同步到其他頁面。

雖然最后生成的結果是不錯的，但實際上在過程中，我們差點跟Codex吵起來。

一個是未經優化的Codex會隨著會話加長，性能慢慢下滑，因此在編寫代碼的過程中，平均響應速度算不上快。

另一個，由于并非專業編程人士，哪怕整個過程中我們可以不寫一行代碼，但對于Codex不斷拋出的“重啟服務器窗口”“將命令行在終端執行”之類的請求，我們只能不斷反問，這些對技術人員堪稱“常識”的話到底是什么意思。

重復太多次，不禁升起一種對自身智商的羞愧，差點氣急敗壞地對著Codex罵起來。

冷靜下來再思索，到底哪些場景非要頻繁地用Agent去操作瀏覽器，讀取本地文件呢？內容創作者的實用場景可能不多，真正用得上的還是前端測試、調試驗證、檢查日志、PR review等面向開發者的場景。

所以Codex的目標受眾很明確——仍然是面向專業的程序員，或至少有一定編程經驗的個人開發者。對于此前沒有任何經驗的普通人來說，還是很難達到“一句話出一個小游戲”那樣驚艷的效果，更不用說能大幅度地提高工作效率。

再看這次Codex發布后的技術社區，也出現不少論戰。最激烈的就是——Codex和Claude Code相比到底誰強？

畢竟此前奧特曼自己也暴言：如果世界將只剩下兩個AI編程智能體，那將是Claude Code和Codex——于是社區里的爭論，就更加甚囂塵上。

獵豹集團CEO傅盛就發帖，表示自己還是覺得“Claude Code更強”，在評論區引發大范圍討論。

不少博主的觀點是：在一次性腳本、算法題，或者demo級web應用上，確實是Codex的推理密度更高，但一旦進入長期開發中，要維護三個月，要多輪修改，要保持對上下文和風格的長期記憶時，Claude code的優勢就出來了。

也有評論總結了兩個產品的不同：

實測選題、輿情分析、行文邏輯：

有驚喜，但也有平替

而在代碼能力之外，一個新出的AI工具最直接的影響，就是能否嵌入普通人的工作流，實打實地提升工作效率。

作為新媒體人，每天最重要的就是選題。

直接丟給它過往500多篇稿件和常年積累下來的一眾選題渠道，包括公眾號、自媒體（抖音/X）博主、國內外的新聞網站、以及多個技術論壇。

最終得到了一份今日新聞的推送，一共8個選題。

說實話，還不錯，內容都符合我們過往的選題范圍，分了“快選題”和“深度選題”兩個版塊，也標注了各自的信源。

但實際上，受限于部分渠道本身反爬蟲、內容折疊、風控等限制，Codex推送的選題其實并不全面。同時，在對選題的取舍上，人常常會帶有一些微妙而模糊的判斷，有時候是對于選題重磅程度的判斷，有時候又是對于某種行業現象的更深層的思考。在這些較為模糊的地方，Codex還并無法將其很清晰地量化出來。

其次，對某個具體選題進行分析。

比如，我們要做一個關于“追覓俞浩”的社交媒體輿情分析，寫篇文章。

Codex可以直接生成輿情分析，用圖表進行表達。這個圖表雖然算不上非常有設計感，但也不用像過往那樣，還要再全網尋覓一個好用又免費的在線圖表制作工具，而是直接在一個對話框里就全都能完成了。

最后在生成具體文字內容上，我們直接讓Codex幫忙打包了電腦本地囤積的大量本地文檔稿件，并總結了過往的所有文檔資料，體量共超過200M。

最后讓它生成的帶有自我風格的寫作skill，說實話還蠻驚喜的。

因為它不是機械復制某篇文章，而是進行全量語義分析。把所有歷史文檔的結構、主題、關注的選題、開篇的寫法，乃至自媒體人常用的“反轉”等結構，都進行了精準總結，它甚至敏銳地挖掘了測試文章結尾中，那些常用來調動情緒的“套路”。

當然，文字內容的生成效果需要長期實操選題才能有比較清晰的感受，每個人都有各自的主觀偏好。

但有亮點，不等于完全可以替代內容創作者目前用的產品。

Codex的本地電腦操控、控制瀏覽器等功能，此前國內云廠商集成的龍蝦，還有很多國內外大廠推出的桌面版Agent，也都能實現。

而在涉及到專業內容的生成，比如用內置的remotion插件生成具有科技感的視頻片段，或者通過風格化的寫作skill生成稿件，離媒體質量要求還有距離，且仍需要專業人士全程監控，沒法真的做到“撒手不管”。

更何況，不管是剪輯素材的搜尋，還是寫作選題的尋找，Codex都無法做到全覆蓋所有渠道，而這些前期的搜尋與準備工作，恰恰是媒體人工作中最消耗時間的部分之一。

更重要的是，國內跑Codex比較慢，而且非常耗Token。作為GPT初級會員，我們只是跑了上述關于俞浩的一條內容，用量就已經消耗了近2%。

總之，對內容創作者而言，Codex有新意，可也有相對低成本的解決方案。

不僅有賣萌桌寵能做學術PTT，還能自己打工賺錢

而除了代碼與內容能力之外，其他有趣的玩法也不少。

比如這次Codex就新上線了一個桌面寵物功能，通過左下角的設置-外觀-寵物，就可以喚起一個像素風的桌面寵物，實時反應Codex的回應狀態。

而點擊寵物，可以快速打開Codex主界面；鼠標放上去會有交互動畫；Codex在忙的時候，寵物可能會撓頭、展示忙碌動畫；在你輸入時，寵物會安靜待機；而當Codex終于返回結果時，寵物就會揮手提醒你去審核。

除了內置8個默認寵物，你還可以登錄官方提供的社區寵物畫廊平臺Petdex，里面已開源了幾百款，包括某只死鳥（多鄰國）、禰豆子、菲比啾比，還有咕咕嘎嘎……

一個寵物通常搭載九種狀態，每種動畫狀態都做得很精致。

而廣大用戶們也不滿足于此，圍繞“電子寵物”開發出了更多玩法。

比如在小紅書，就興起了一股“用Codex將我家小貓住進電腦”的熱潮，一眾用戶紛紛把自家小貓的照片直接丟給Codex，讓小貓的電子形象陪著自己上班。其中播放量最高的超過70萬閱讀，小紅書4.5萬點贊，抖音也有超過1萬贊。

在視頻演示中，電子小貓一般會在程序塢或者任務欄里住著，也可以直接將貓拖動到任務欄上，讓其在邊框來回走動，玩耍，伸懶腰。

此外，用Codex做學術PPT的玩法也火了起來，小紅書和抖音出現了多條萬贊視頻，基本上都是直接輸入學術內容，Codex就能生成一整套PPT的outline，確認無誤后再直接生成圖片。

生成的效果也是各種風格都有，看起來相當專業。

有博主提出，可以讓Codex再寫一個skill，將這些圖片再轉換為可編輯的VBA狀態。還有博主提出，可以使用Codex本體+內置插件image2+內置插件presentations，從項目經理到視覺素材生產，再到PPT排版和導出，一條龍做好PPT。

最后再說說開頭提到的Codex“自主打工第一單”。

根據Chris在X發帖公布的流程，在收到“去GitHub上找活賺錢，目標5美元”的指令后，Codex便定位到一個bounty（賞金）平臺，讀代碼、改代碼、提交拉取請求（PR）、和維護者來回回復評論，最終在PR合并和驗證流程完成幾天后，Chris收到了16.88美元付款。

Chris說，這次總共跑了約10-15個安全審計項目，消耗了22M tokens。根據OpenAI API公開定價是輸出30美元/1M tokens，輸入是5美元/1M tokens。如果按照這個成本來算的話，這單生意看著似乎又沒那么劃算了。

不過Chris也在后續的跟帖中說，現在的重點根本不是能不能盈利，而是GPT-5.5未來的價格還會再降。等到未來模型成本越來越低，這條商業閉環，也就能越來越便宜地被跑通。

說白了，重要的不是一條現在就成熟的商業路徑，而是“有東西跑通了”的信號。

整體來看，Codex這次更新確實是一次AI編程工具突破能力邊界的新嘗試。

對程序員來說，它是一個值得嘗試的新玩具；對內容創作者來說，它是一個有趣的補充，但也遠沒有到"讓所有人扔掉手頭工具"的程度。

至于那個像素風桌寵——好吧，這可能是我們整個測評過程中最不想關掉的功能了。

歡迎分享、點贊、推薦

一起研究AI

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

頭號AI玩家

做內容從業者關心的AI研究

474文章數 24關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

房產

手機

本地

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
布洛芬是怎么給人止痛的？
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

Codex正經歷GPT時刻？我們更關心的是它居然能自己賺錢 | AI實測

華為：邏輯折疊將大幅提升麒麟CPU核心頻率

世界杯-挪威2-1巴西首進八強 哈蘭德梅開二度

世界杯-挪威2-1巴西首進八強 哈蘭德梅開二度

姆巴佩點走巴拉圭：巴黎三代左鋒傳承

霉霉婚禮照片泄露 有四人違規

揭秘跨境“對敲”換匯黑產

方程豹鈦9內飾曝光 用上了長聯屏設計/下半年上市

態度原創

《漫威爭鋒》美國隊長性感皮膚遭修改 粉絲們生氣了

總裁空缺17個月、現金缺口超1000億：金融局“局外人”入局萬科

郭明錤稱蘋果折疊屏可能重演iPhone X劇本：同場發布，較晚開賣

國內足球之旅？這座小城給你高分答案

世界杯-挪威2-1巴西首進八強哈蘭德梅開二度

世界杯-挪威2-1巴西首進八強哈蘭德梅開二度

霉霉婚禮照片泄露有四人違規

方程豹鈦9內飾曝光用上了長聯屏設計/下半年上市

《漫威爭鋒》美國隊長性感皮膚遭修改粉絲們生氣了