![]()
作者 | 博雯
編輯 | 張潔
最近Codex來了波大更新,直接接管了谷歌瀏覽器,整個AI圈又玩嗨了。
有人拿它做多人在線小游戲,有人拿它編學術PPT,甚至還有個叫Chris的開發者給Codex丟下一條“去掙5美元”的指令,結果22小時內,Codex居然真自己找了個開源安全審計的賞金路徑,完成并提交了PR,16美元就這么成功到賬。
![]()
這一下可真在開發者圈子炸了鍋了,Chris這條帖子短短一天就超過了上百萬瀏覽量,奧特曼看到估計都要笑開花了。
畢竟在去年年初,奧特曼就預言說,2025年可能看到第一批AI智能體“加入勞動力大軍”,并實質性改變公司產出。
現在看來,自家的Codex似乎成為了他最好的證據。
奧特曼顯然也對Codex十分滿意,就在今年五一假期前,他就發帖稱“Codex正在經歷一個ChatGPT時刻”,一句話獲得97萬閱讀。
![]()
這句話發出一周后,Codex谷歌瀏覽器插件于5月8日正式推出,在AI圈掀起一陣熱潮。
事實上,從4月30日奧特曼這句話之后,Codex的下載量就開始暴漲。根據海外AI數據平臺TickerTrends,從4月30日到5月3日,Codex的npm下載量達到8610萬次,周環比暴漲1397%。而到了5月8日,這個數字進一步攀升至單周9000萬。
相對應的,老對頭Claude Code則跌至720萬次。
![]()
也難怪在X、抖音、小紅書等多個社區,Codex已經成了不少開發者口中“腳踩Claude Code”“干翻所有AI瀏覽器”的存在了……
那么,Codex新功能真有那么厲害嗎?“AI新榜”也進行了一波實測。
![]()
0代碼生成小游戲?
響應速度較慢,仍面向專業程序員
這次Codex最核心的更新,就是上線了谷歌瀏覽器插件——讓用戶在桌面,即可操控以前需要打開網頁才能使用的功能,比如測試Web應用、看控制臺、調試、登錄各種內部系統等等。
而且它可以打開多個標簽并行處理,不會霸占瀏覽器,不影響人工同時操作電腦。
對于一天大部分工作時間都泡在瀏覽器上的現代人來說,這聽起來確實很讓人興奮。
![]()
官方演示里也給了一個挺有意思的案例,用Codex控制谷歌瀏覽器,同時派出4個AI子代理,用各自的瀏覽器標簽頁一起玩一個多人畫圖游戲。
這就和以前見到的AI編程不一樣了,不僅是測試代碼成果,還能協調多個AI代理并行測試復雜的網頁交互場景,比如多人協作/多人在線應用這種人工測試比較麻煩的流程。
于是我們模仿這個官方案例,做了一個“胡鬧廚房mini版”,同樣設置了四個玩家位,分別負責切菜、傳菜、滅火、收錢,由系統隨機生成客人需求,四個玩家共同配合出餐。
和官方演示稍有不同的是,它直接新增了一個多人測試臺,同時打開了四個真實的客戶端頁面,點擊“開始四人協作”之后就能看到四個頁面并排運行:P1切菜、P2傳菜、P3滅火、P4收錢,各自做自己的事,每個操作都會實時同步到其他頁面。
雖然最后生成的結果是不錯的,但實際上在過程中,我們差點跟Codex吵起來。
一個是未經優化的Codex會隨著會話加長,性能慢慢下滑,因此在編寫代碼的過程中,平均響應速度算不上快。
另一個,由于并非專業編程人士,哪怕整個過程中我們可以不寫一行代碼,但對于Codex不斷拋出的“重啟服務器窗口”“將命令行在終端執行”之類的請求,我們只能不斷反問,這些對技術人員堪稱“常識”的話到底是什么意思。
重復太多次,不禁升起一種對自身智商的羞愧,差點氣急敗壞地對著Codex罵起來。
冷靜下來再思索,到底哪些場景非要頻繁地用Agent去操作瀏覽器,讀取本地文件呢?內容創作者的實用場景可能不多,真正用得上的還是前端測試、調試驗證、檢查日志、PR review等面向開發者的場景。
所以Codex的目標受眾很明確——仍然是面向專業的程序員,或至少有一定編程經驗的個人開發者。對于此前沒有任何經驗的普通人來說,還是很難達到“一句話出一個小游戲”那樣驚艷的效果,更不用說能大幅度地提高工作效率。
再看這次Codex發布后的技術社區,也出現不少論戰。最激烈的就是——Codex和Claude Code相比到底誰強?
畢竟此前奧特曼自己也暴言:如果世界將只剩下兩個AI編程智能體,那將是Claude Code和Codex——于是社區里的爭論,就更加甚囂塵上。
獵豹集團CEO傅盛就發帖,表示自己還是覺得“Claude Code更強”,在評論區引發大范圍討論。
![]()
不少博主的觀點是:在一次性腳本、算法題,或者demo級web應用上,確實是Codex的推理密度更高,但一旦進入長期開發中,要維護三個月,要多輪修改,要保持對上下文和風格的長期記憶時,Claude code的優勢就出來了。
也有評論總結了兩個產品的不同:
![]()
![]()
實測選題、輿情分析、行文邏輯:
有驚喜,但也有平替
而在代碼能力之外,一個新出的AI工具最直接的影響,就是能否嵌入普通人的工作流,實打實地提升工作效率。
作為新媒體人,每天最重要的就是選題。
直接丟給它過往500多篇稿件和常年積累下來的一眾選題渠道,包括公眾號、自媒體(抖音/X)博主、國內外的新聞網站、以及多個技術論壇。
最終得到了一份今日新聞的推送,一共8個選題。
![]()
![]()
![]()
說實話,還不錯,內容都符合我們過往的選題范圍,分了“快選題”和“深度選題”兩個版塊,也標注了各自的信源。
但實際上,受限于部分渠道本身反爬蟲、內容折疊、風控等限制,Codex推送的選題其實并不全面。同時,在對選題的取舍上,人常常會帶有一些微妙而模糊的判斷,有時候是對于選題重磅程度的判斷,有時候又是對于某種行業現象的更深層的思考。在這些較為模糊的地方,Codex還并無法將其很清晰地量化出來。
其次,對某個具體選題進行分析。
比如,我們要做一個關于“追覓俞浩”的社交媒體輿情分析,寫篇文章。
![]()
Codex可以直接生成輿情分析,用圖表進行表達。這個圖表雖然算不上非常有設計感,但也不用像過往那樣,還要再全網尋覓一個好用又免費的在線圖表制作工具,而是直接在一個對話框里就全都能完成了。
![]()
最后在生成具體文字內容上,我們直接讓Codex幫忙打包了電腦本地囤積的大量本地文檔稿件,并總結了過往的所有文檔資料,體量共超過200M。
![]()
最后讓它生成的帶有自我風格的寫作skill,說實話還蠻驚喜的。
因為它不是機械復制某篇文章,而是進行全量語義分析。把所有歷史文檔的結構、主題、關注的選題、開篇的寫法,乃至自媒體人常用的“反轉”等結構,都進行了精準總結,它甚至敏銳地挖掘了測試文章結尾中,那些常用來調動情緒的“套路”。
當然,文字內容的生成效果需要長期實操選題才能有比較清晰的感受,每個人都有各自的主觀偏好。
![]()
但有亮點,不等于完全可以替代內容創作者目前用的產品。
Codex的本地電腦操控、控制瀏覽器等功能,此前國內云廠商集成的龍蝦,還有很多國內外大廠推出的桌面版Agent,也都能實現。
而在涉及到專業內容的生成,比如用內置的remotion插件生成具有科技感的視頻片段,或者通過風格化的寫作skill生成稿件,離媒體質量要求還有距離,且仍需要專業人士全程監控,沒法真的做到“撒手不管”。
更何況,不管是剪輯素材的搜尋,還是寫作選題的尋找,Codex都無法做到全覆蓋所有渠道,而這些前期的搜尋與準備工作,恰恰是媒體人工作中最消耗時間的部分之一。
更重要的是,國內跑Codex比較慢,而且非常耗Token。作為GPT初級會員,我們只是跑了上述關于俞浩的一條內容,用量就已經消耗了近2%。
總之,對內容創作者而言,Codex有新意,可也有相對低成本的解決方案。
![]()
不僅有賣萌桌寵能做學術PTT,還能自己打工賺錢
而除了代碼與內容能力之外,其他有趣的玩法也不少。
比如這次Codex就新上線了一個桌面寵物功能,通過左下角的設置-外觀-寵物,就可以喚起一個像素風的桌面寵物,實時反應Codex的回應狀態。
而點擊寵物,可以快速打開Codex主界面;鼠標放上去會有交互動畫;Codex在忙的時候,寵物可能會撓頭、展示忙碌動畫;在你輸入時,寵物會安靜待機;而當Codex終于返回結果時,寵物就會揮手提醒你去審核。
![]()
除了內置8個默認寵物,你還可以登錄官方提供的社區寵物畫廊平臺Petdex,里面已開源了幾百款,包括某只死鳥(多鄰國)、禰豆子、菲比啾比,還有咕咕嘎嘎……
![]()
一個寵物通常搭載九種狀態,每種動畫狀態都做得很精致。
![]()
而廣大用戶們也不滿足于此,圍繞“電子寵物”開發出了更多玩法。
比如在小紅書,就興起了一股“用Codex將我家小貓住進電腦”的熱潮,一眾用戶紛紛把自家小貓的照片直接丟給Codex,讓小貓的電子形象陪著自己上班。其中播放量最高的超過70萬閱讀,小紅書4.5萬點贊,抖音也有超過1萬贊。
在視頻演示中,電子小貓一般會在程序塢或者任務欄里住著,也可以直接將貓拖動到任務欄上,讓其在邊框來回走動,玩耍,伸懶腰。
![]()
此外,用Codex做學術PPT的玩法也火了起來,小紅書和抖音出現了多條萬贊視頻,基本上都是直接輸入學術內容,Codex就能生成一整套PPT的outline,確認無誤后再直接生成圖片。
![]()
生成的效果也是各種風格都有,看起來相當專業。
有博主提出,可以讓Codex再寫一個skill,將這些圖片再轉換為可編輯的VBA狀態。還有博主提出,可以使用Codex本體+內置插件image2+內置插件presentations,從項目經理到視覺素材生產,再到PPT排版和導出,一條龍做好PPT。
![]()
最后再說說開頭提到的Codex“自主打工第一單”。
根據Chris在X發帖公布的流程,在收到“去GitHub上找活賺錢,目標5美元”的指令后,Codex便定位到一個bounty(賞金)平臺,讀代碼、改代碼、提交拉取請求(PR)、和維護者來回回復評論,最終在PR合并和驗證流程完成幾天后,Chris收到了16.88美元付款。
![]()
Chris說,這次總共跑了約10-15個安全審計項目,消耗了22M tokens。根據OpenAI API公開定價是輸出30美元/1M tokens,輸入是5美元/1M tokens。如果按照這個成本來算的話,這單生意看著似乎又沒那么劃算了。
不過Chris也在后續的跟帖中說,現在的重點根本不是能不能盈利,而是GPT-5.5未來的價格還會再降。等到未來模型成本越來越低,這條商業閉環,也就能越來越便宜地被跑通。
說白了,重要的不是一條現在就成熟的商業路徑,而是“有東西跑通了”的信號。
![]()
整體來看,Codex這次更新確實是一次AI編程工具突破能力邊界的新嘗試。
對程序員來說,它是一個值得嘗試的新玩具;對內容創作者來說,它是一個有趣的補充,但也遠沒有到"讓所有人扔掉手頭工具"的程度。
至于那個像素風桌寵——好吧,這可能是我們整個測評過程中最不想關掉的功能了。
歡迎分享、點贊、推薦
一起研究AI
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.