這段時間,Codex 的變化速度有點驚人。先是桌面端的史詩級更新,接著是遠程 SSH,再到 Computer Use 和 Chrome 插件,周活躍用戶已經(jīng)突破了 400 萬。
今天,OpenAI 又把 Codex 塞進了 ChatGPT 手機 App。按照官方的說法,Codex 移動版已經(jīng)以 Preview 形式在 iOS 和 Android 版 ChatGPT 上線,支持連接運行 Codex 的 macOS 設(shè)備,Windows 的支持則還要再等一等。
![]()
圖片來源:OpenAI
不過,Codex 移動版其實更準確地說,是 Codex 桌面端在手機的一個入口。你在手機上的 ChatGPT 就可以直接進入 Codex,連接桌面端運行中的環(huán)境,然后在手機上發(fā)起新的需求,讓桌面端 Codex 去完成任務(wù)。
Claude Code 在 3 月其實就上線了類似的 Dispatch 功能,可以通過手機上的 Claude App 指揮桌面端的 Claude Code。而更早之前,OpenClaw(龍蝦)也已經(jīng)通過接入各大 IM 平臺實現(xiàn)了這一點。
雖遲但到。但更重要的是 Codex 移動版實際的完成度,在硅谷「AI 御三家」中以產(chǎn)品能力見長的 OpenAI,這次能有后發(fā)優(yōu)勢嗎?
手機成了Codex的第二個入口
必須說明,Codex 移動版并不是一個獨立的新 App。
實際上,OpenAI 這次沒有再推出一個單獨的 Codex iOS 或 Android 應(yīng)用,而是直接把入口放進了 ChatGPT App,在手機上打開 ChatGPT 就能在側(cè)欄看到「Codex」的入口。
![]()
圖片來源:雷科技
所以在某種程度上,你也可以將這次更新的核心理解為:讓用戶在手機上的 ChatGPT 里指揮電腦上的 Codex 執(zhí)行任務(wù)。
不只是讓全球超過 10 億的 ChatGPT 用戶可以少裝了一個 App,更重要的是,OpenAI 沒有把 Codex 移動版做成一個新的開發(fā)工具,而是把它收進 ChatGPT 這個統(tǒng)一入口。對用戶來說,這意味著使用路徑很短,只要桌面端和移動端登錄同一個賬號,手機上的 ChatGPT 就能很方便地連接到安裝 Codex 的 macOS 桌面端。
![]()
我用安卓上的 Codex 連接了 macOS 上的 Codex,圖片來源:雷科技
實際用下來,Codex 移動版已經(jīng)可以直接在手機上發(fā)起新的需求,再讓電腦上的桌面端 Codex 去完成任務(wù)。這個時候,手機更像是一個輕量的任務(wù)控制臺,你把需求說清楚,真正讀取項目、執(zhí)行命令、修改文件、跑測試的,仍然是桌面端 Codex。
與此同時,桌面端 Codex 的實時狀態(tài)也會同步顯示在手機上,包括思考、操作過程和結(jié)果。所以我們完全可以在電腦開始指揮 Codex 工作,出門時在手機上查看進展,或者直接引導(dǎo)執(zhí)行、推動長任務(wù)繼續(xù)向前,而不是被設(shè)備綁住。
甚至,手機上還能直接調(diào)整模型、速度和推理程度。
![]()
圖片來源:雷科技
這個分工設(shè)計我覺得很聰明,手機受限于環(huán)境、性能和屏幕尺寸等因素,本來就不適合獨立運行 Coding 等復(fù)雜任務(wù),更適合作為桌面端「隨時隨地」的入口。
Codex 移動版沒有硬搬,而是把最適合移動端的幾件事拎了出來:發(fā)需求、看過程、批操作、續(xù)對話、查結(jié)果。桌面端 Codex 正在進行的完整思考、操作過程和執(zhí)行結(jié)果,手機上都能同步看到;唯一不會同步顯示的是輸出文件,它們只保存在電腦上。
這個處理也不奇怪,畢竟文件和運行環(huán)境本來就在本地機器上,移動端只負責同步狀態(tài)和交互,沒必要把所有產(chǎn)物也復(fù)制一份到手機里。
此外,Codex 移動版不只能連接一臺 Mac,可以同時連接多個桌面端,比如一臺 MacBook Pro 和一臺 Mac mini 都在運行 Codex,一臺手機就可以管理不同電腦上的桌面端 Codex。這也挺符合 Codex 這類 Agent 產(chǎn)品的真實工作流。
![]()
圖片來源:雷科技
很多開發(fā)者本來就不只用一臺機器,一臺隨身 MacBook 處理日常項目,一臺 Mac mini 或遠程環(huán)境跑更重的任務(wù)。過去這些環(huán)境往往是割裂的,現(xiàn)在 Codex 至少開始嘗試把它們統(tǒng)一到一個手機入口里。你可以在手機上切到不同 Host,看不同任務(wù)的進展,甚至把不同需求分發(fā)給不同機器。
不過,Codex 移動版還是有一些明顯需要完善的地方,比如對話編輯還不支持,這個問題看起來不大,但在移動場景里反而很重要。因為手機輸入更容易出現(xiàn)錯別字、漏掉上下文,或者剛發(fā)出去就意識到需求沒說完整。
對于一個可以遠程調(diào)度桌面端執(zhí)行任務(wù)的入口來說,不能編輯對話會讓人更謹慎,也會降低移動端發(fā)起任務(wù)的爽感。這一點后續(xù)確實需要補上。
不過,我這次上手遇到的最大痛點,是手機端經(jīng)常需要重連。有時你剛在手機上打好一段需求,結(jié)果連接斷了,消息發(fā)不出去。
更糟心的是,有時桌面端 Codex 明明還在運行,手機端卻突然進入重連狀態(tài),界面短暫空白。因為真正的任務(wù)執(zhí)行都發(fā)生在桌面端,所以這種斷連通常不會影響運行過程和最終結(jié)果。但從手機端交互來看,這個體驗確實有點糟心。
![]()
圖片來源:雷科技
好在這類問題更像 Preview 階段的工程穩(wěn)定性問題,而不是產(chǎn)品思路上的問題。
除此之外,Codex 移動版也沒有只服務(wù)本地桌面端。它同樣支持連接 Codex 云端,這讓手機入口覆蓋的范圍更大,桌面版里自定義寵物這類細節(jié)也能同步到移動端。后者當然不是核心能力,但它更說明了 OpenAI 并沒有把 Codex 移動版當成一個臨時的遠程查看方式,而是真的在圍繞 Codex 打造新的 AI 工作流和體驗。
再把 Codex 移動版放到整個 Agent 產(chǎn)品里看,會更有意思,尤其是對移動場景下 Agent 體驗的理解,大家其實還有點不一樣。
上手機,Codex 和「龍蝦」不一樣
現(xiàn)在 Agent 產(chǎn)品基本都會支持移動入口,核心讓用戶隨時發(fā)需求,再由 Agent 去調(diào)用工具、打開網(wǎng)頁、處理文件或完成流程,強調(diào)「有事就找 Agent」。這件事在手機端天然成立,因為大量需求本來就來自移動場景。
大體有幾種思路。一種是 OpenClaw、Hermes 這類開源 Agent 工具,基本都支持接入 IM,讓用戶可以通過常用的聊天 APP,隨時隨地把需求丟給 Agent。年初各種「龍蝦」的爆火,很大程度上就離不開這一點。
![]()
圖片來源:Hermes Agent
另一種是把桌面端的 Agent 工作流接到手機上,讓用戶可以在外面繼續(xù)盯任務(wù)、發(fā)指令、做確認,這也是 Claude Code 和現(xiàn)在的 Codex 的做法。
但哪怕都是實現(xiàn)在手機上「用 Agent」,兩者的體驗重心其實差異很大。在 OpenClaw 或者 Hermes 上,你不需要理解一個復(fù)雜的新客戶端,也不需要切到專門的開發(fā)工具,只要像給朋友發(fā)消息一樣,把需求丟給微信、飛書、Telegram 里的 bot 機器人。
對于普通任務(wù)來說,這種體驗甚至比打開一個專門 App 更順。尤其是這類強調(diào)長期記憶、自動化和多工具調(diào)用的 Agent,IM 入口天然適合處理「提醒我」「幫我查」「繼續(xù)跟進」「執(zhí)行某個流程」這類跨時間、跨場景的任務(wù)。
不過把 IM 當入口也有問題。對話可以承載任務(wù)需求,卻很難承載復(fù)雜的過程狀態(tài)。Agent 正在調(diào)用什么工具、跑到哪一步、改了哪些文件、測試是否通過、某個策略是否合理,這些信息如果都通過聊天氣泡呈現(xiàn),很快就會變得擁擠。
對通用 Agent 來說,這不一定是致命問題;但對 AI Coding 來說,過程本身就是產(chǎn)品體驗的一部分。你不只是要知道「完成了」,還要知道它怎么做、哪里失敗、下一步該不該繼續(xù)。
相比之下,Claude Code 和 Codex 的移動化就不太一樣,它們沒有選擇 IM Bot,而是從 Claude/ChatGPT 的手機端 App 出發(fā),比起 Hermes、OpenClaw 的聊天入口更適合復(fù)雜任務(wù)。
![]()
圖片來源:Anthropic
但不同的是,Claude Code 的雙端連接更多通過 Dispatch,更像是結(jié)合 OpenClaw 或者 Hermes 的 IM 思路打造的一個功能,通過 Dispatch 這個功能頁面實現(xiàn)在手機上「指揮」電腦上的 Claude Code。而 Codex 移動版是直接同步桌面版的對話,包括桌面端實際運行中思考、操作和結(jié)果的實時同步。
簡言之,Codex 在桌面和移動場景下的切換實際上更加無縫、自然,可能也是因為這一點,目前時不時就重連的問題也顯得更煩人。
Codex 移動版當然還談不上成熟。真正復(fù)雜的代碼審查、架構(gòu)判斷和高風(fēng)險變更,仍然需要開發(fā)者回到電腦前完成。對于普通用戶來說,這個入口短期內(nèi)也不太會像 ChatGPT 聊天一樣高頻。
但方向已經(jīng)很清楚,OpenAI 更多把手機當成 Agent 的調(diào)度入口。這個判斷非常關(guān)鍵,因為當這些 AI Coding Agent 的能力已經(jīng)毋庸置疑,接下來的問題則是讓這種能力可以變得更容易、更自然地獲取和使用,產(chǎn)品的交互設(shè)計就成了新的關(guān)鍵。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.