Alexander Embiricos 是 OpenAI Codex 的產(chǎn)品負(fù)責(zé)人。在加入 OpenAI 之前,他在 Dropbox 做過(guò)產(chǎn)品經(jīng)理,后來(lái)創(chuàng)辦了協(xié)作工具 Multi(前身為 Remotion),做了五年結(jié)對(duì)編程方向的創(chuàng)業(yè),2024年被 OpenAI 收購(gòu)。他親歷了 AI 編程工具從“輔助補(bǔ)全”到“全權(quán)委托”的轉(zhuǎn)變。Codex 自2025年8月以來(lái)增長(zhǎng)了20倍,剛在2026年2月的一周內(nèi)密集發(fā)布了 macOS 獨(dú)立應(yīng)用、GPT-5.3模型、超級(jí)碗廣告,并向免費(fèi)用戶開(kāi)放。
這期訪談覆蓋了幾個(gè)核心話題:AI 編碼的現(xiàn)狀與工程師的未來(lái)、人類為什么是 AGI 的真正瓶頸、OpenAI 內(nèi)部怎么用 Codex、開(kāi)放標(biāo)準(zhǔn)與競(jìng)爭(zhēng)策略,以及 SaaS 行業(yè)和 Agent 市場(chǎng)的終局。
來(lái)源:20VC with Harry Stebbings,2026年2月21日原始視頻:
https://www.youtube.com/watch?v=S1rQngjpUdI
要點(diǎn)速覽
- OpenAI 內(nèi)部大多數(shù)人已不再打開(kāi) IDE,代碼的絕大部分由 AI 編寫,拐點(diǎn)發(fā)生在 GPT-5.2 Codex
- AI 應(yīng)該每天幫助人類數(shù)萬(wàn)次,但當(dāng)前即使是重度用戶也只用幾十次,瓶頸不在模型而在人機(jī)交互
- “所有 Agent 本質(zhì)上都是編碼 Agent”,因?yàn)榇a是 Agent 操作計(jì)算機(jī)的最佳方式
- OpenAI 自認(rèn)工作不是“Codex 的成功”而是 “智能的分發(fā)”,訓(xùn)練模型然后服務(wù)給競(jìng)爭(zhēng)對(duì)手
- 通用 Agent 會(huì)打敗垂直 Agent,未來(lái)可能只有少數(shù)幾家 Agent 提供商捕獲大部分價(jià)值
【1】編碼不會(huì)消亡,但編碼的含義會(huì)改變
馬斯克說(shuō)編碼是最先被大規(guī)模自動(dòng)化的職業(yè)之一。你身處前線,同意這個(gè)判斷嗎?
Embiricos 同意 LLM 在編碼領(lǐng)域確實(shí)很強(qiáng),但 “自動(dòng)化”是個(gè)很重的說(shuō)法。他舉了幾個(gè)歷史類比:當(dāng)我們從匯編語(yǔ)言轉(zhuǎn)向高級(jí)語(yǔ)言時(shí),沒(méi)人說(shuō)“編碼被自動(dòng)化了”,我們只是能寫更多代碼,結(jié)果是對(duì)代碼的需求反而爆炸了,需要更多軟件工程師。
![]()
他又提到了”computer”一詞的起源。在 Bletchley Park(二戰(zhàn)時(shí)期英國(guó)的密碼破譯中心),有大量人力負(fù)責(zé)打孔卡、做制表運(yùn)算。最早的電子表格軟件也脫胎于類似場(chǎng)景:一間辦公室里,桌子按網(wǎng)格排列,每個(gè)人做一部分計(jì)算,然后把工作表傳給下一個(gè)人。這些具體任務(wù)都被自動(dòng)化了,但每次自動(dòng)化之后,對(duì)產(chǎn)出的需求都出現(xiàn)爆炸式增長(zhǎng)。
【注:Embiricos 對(duì)“computer”一詞起源的描述不完全準(zhǔn)確——“computer”作為人類職位的稱呼早于 Bletchley Park,最早可追溯到17世紀(jì),后來(lái) NASA 的女性數(shù)學(xué)計(jì)算員也被稱為 computers。】
- “You still need software engineers today. You still need designers. I'm a PM. Do you need PMs? I don't think you need them.”(你現(xiàn)在仍然需要軟件工程師、設(shè)計(jì)師。我是 PM。你需要 PM 嗎?我覺(jué)得不需要。)
五年后會(huì)有更多工程師還是更少?Embiricos 說(shuō)會(huì)有更多“構(gòu)建者”。但他觀察到一個(gè)趨勢(shì):人才棧在壓縮。幾年前前端和后端還是兩種人,現(xiàn)在至少在 Codex 團(tuán)隊(duì)內(nèi)部,工程師越來(lái)越全棧化。
至于 PM 這個(gè)自嘲式的判斷,他解釋說(shuō) PM 的角色本質(zhì)上是“顯式未定義的”,目標(biāo)是適應(yīng)團(tuán)隊(duì)或業(yè)務(wù)的任何需要。但這些功能也可以由一個(gè)思考產(chǎn)品的工程負(fù)責(zé)人或設(shè)計(jì)師來(lái)承擔(dān)。所以 PM 有用,但在團(tuán)隊(duì)很大之前,你可能不需要太多。
【2】AI 的瓶頸是人類打字速度,不是模型
你說(shuō)過(guò)人類打字速度和驗(yàn)證工作是 AGI 的關(guān)鍵瓶頸,能展開(kāi)說(shuō)說(shuō)嗎?
Embiricos 沒(méi)有直接回答,而是反問(wèn)。他先問(wèn) Harry 每天用 AI 多少次,答案是30多次。然后問(wèn)如果零成本使用,AI 每天能幫你多少次?答案是無(wú)限。
- “I think AI should be helping us tens of thousands of times per day.”(我認(rèn)為 AI 應(yīng)該每天幫助我們數(shù)萬(wàn)次。)
他說(shuō)在 OpenAI 內(nèi)部,工程師已經(jīng)到了“Codex 一直開(kāi)著,如果開(kāi)會(huì)時(shí)它沒(méi)在跑任務(wù),就覺(jué)得浪費(fèi)了時(shí)間”的狀態(tài)。但管理這些 Agent、確保它們一直在干活,本身就是大量工作。
而且即使是他自己這種天天做這個(gè)的人,也“太懶”去想出 AI 能幫忙的所有方式,最后每天的使用次數(shù)跟普通人差不多。當(dāng)他用 AI 做了什么新鮮事(比如準(zhǔn)備這次播客),還會(huì)覺(jué)得“挺自豪的”。
那理想的未來(lái)是什么?不需要學(xué)會(huì)怎么 prompt,不需要自己發(fā)現(xiàn) AI 能幫你的場(chǎng)景,AI 自動(dòng)連接你的上下文,在合適的時(shí)機(jī)介入。
Harry 追問(wèn):那 productize(產(chǎn)品化)這些 prompt 和人類動(dòng)作來(lái)移除瓶頸,是你們的工作嗎?
Embiricos 認(rèn)為是,但不是馬上就做到。他給出了一個(gè)三階段路線圖:
第一階段,讓 Agent 在軟件工程和編碼領(lǐng)域先做好,因?yàn)?LLM 恰好擅長(zhǎng)這個(gè)。
第二階段,意識(shí)到 Agent 要更廣泛地有用,就需要能操作計(jì)算機(jī),而代碼恰恰是 Agent 操作計(jì)算機(jī)的最佳方式。
- “All agents are actually coding agents because coding is just the best way for an agent to use a computer.”(所有 Agent 本質(zhì)上都是編碼 Agent,因?yàn)榇a是 Agent 操作計(jì)算機(jī)的最佳方式。)
![]()
第三階段,觀察什么有效后,做高度產(chǎn)品化的功能。他說(shuō)“我們會(huì)在接下來(lái)幾個(gè)月內(nèi)快速跑完這三個(gè)階段”。
他特別提到 Claude Code 最初推出時(shí)做對(duì)了一件事:**給你一個(gè)終端里的超簡(jiǎn)單工具,讓用戶自己去探索各種使用場(chǎng)景。**他認(rèn)為 OpenAI 也應(yīng)該優(yōu)先做這種開(kāi)放式工具,而不是只為特定行業(yè)做定制化產(chǎn)品。
Harry 指出了矛盾:如果你做開(kāi)放工具而不是垂直產(chǎn)品,不就是把責(zé)任推回給用戶了嗎?這正好回到了“人類是瓶頸”的原點(diǎn)。Embiricos 承認(rèn)這確實(shí)是瓶頸,所以三個(gè)階段的設(shè)計(jì)就是漸進(jìn)式地降低門檻。
【注:Claude Code 是 Anthropic 于2025年2月推出的命令行 AI 編程工具,在開(kāi)發(fā)者群體中迅速走紅。他也提到 Claude 的產(chǎn)品化做得好,比如 Claude for Legal、Claude in Excel,這些是 Anthropic 推出的垂直場(chǎng)景應(yīng)用,讓特定行業(yè)用戶可以不寫 prompt 就使用 AI。】
【3】先給人工具,再談自動(dòng)化——企業(yè) AI 部署的路徑之爭(zhēng)
企業(yè) AI 部署的數(shù)據(jù)安全、權(quán)限配置問(wèn)題很難,不需要實(shí)施工程師嗎?
Embiricos 承認(rèn)如果要從零到一部署一個(gè)完整的 workflow 自動(dòng)化系統(tǒng),確實(shí)需要實(shí)施工程師來(lái)打通安全合規(guī)和各種數(shù)據(jù)系統(tǒng)。但他的核心觀點(diǎn)是:自上而下部署的結(jié)果往往是“嚴(yán)重低估了 AI 在這家公司的潛力”。
他打了個(gè)比方:想象你是客服人員,AI 正在自動(dòng)化你的大部分工作,但你自己從來(lái)沒(méi)用過(guò) ChatGPT。在這種情況下你對(duì) AI 完全沒(méi)有直覺(jué),面對(duì)自動(dòng)化只會(huì)感到無(wú)力。但如果你同時(shí)在用 ChatGPT 處理日常工作,你會(huì)對(duì) AI 的能力有理解,也更有掌控感。
![]()
那數(shù)據(jù)安全問(wèn)題怎么辦?他指出,每個(gè)工具、每個(gè) workflow 最終都落到某個(gè)員工的瀏覽器或本地文件系統(tǒng)上。這就是為什么 OpenAI 在建 Atlas 瀏覽器。
【注:ChatGPT Atlas 是 OpenAI 于2025年10月推出的瀏覽器,基于 Chromium 構(gòu)建,內(nèi)置 ChatGPT 功能。它可以理解用戶正在瀏覽的網(wǎng)頁(yè)內(nèi)容,并支持 Agent 模式在瀏覽器中直接執(zhí)行任務(wù)。】
通過(guò)自建瀏覽器并端到端控制,OpenAI 可以為企業(yè)構(gòu)建安全的 Agent 瀏覽體驗(yàn),讓 Agent 訪問(wèn)那些尚未被實(shí)施工程師打通的系統(tǒng)。
- “For me the most exciting future with AI is one where everyone just feels like a superhuman, just like empowered by AI.”(對(duì)我來(lái)說(shuō),AI 最令人興奮的未來(lái)是每個(gè)人都覺(jué)得自己像個(gè)超人,被 AI 賦予了力量。)
【4】從配對(duì)編程到委托——OpenAI 內(nèi)部的工作方式變革
OpenAI 內(nèi)部有多少代碼是由 Codex 生成的?
Embiricos 沒(méi)給具體百分比,但說(shuō)大多數(shù)他認(rèn)識(shí)的人已經(jīng)不再打開(kāi)編輯器。
- “The code itself is not being written by humans anymore.”(代碼本身已經(jīng)不再由人類來(lái)寫了。)
- “The vast majority of code is written by AI and I would say that now probably most people are not even opening IDEs.”(代碼的絕大部分由 AI 編寫,而且我認(rèn)為現(xiàn)在大多數(shù)人甚至不打開(kāi) IDE 了。)
這個(gè)變化是階躍式的。拐點(diǎn)發(fā)生在2025年12月的 GPT-5.2 Codex:模型在長(zhǎng)時(shí)間運(yùn)行、端到端處理任務(wù)、管理上下文和遵循指令方面有了巨大提升。
【注:GPT-5.2 Codex 于2025年12月發(fā)布。2026年2月5日,OpenAI 又發(fā)布了 GPT-5.3 Codex,號(hào)稱是“迄今為止最強(qiáng)的 Agent 編碼模型”,比前代快25%,也是第一個(gè)被用來(lái)參與自身訓(xùn)練和部署的模型。】
![]()
在 GPT-5.2之前,AI 編碼輔助主要是 tab 補(bǔ)全或配對(duì)編程,你得坐在電腦前,手放在鍵盤上。GPT-5.2之后,工作方式變成了:跟 Agent 討論一個(gè)計(jì)劃,確認(rèn) spec(規(guī)格),然后“l(fā)et it cook”(放手讓它干)。
這也是為什么他們做了 Codex App,一個(gè)專門為“委托而非配對(duì)”設(shè)計(jì)的界面。App 有管理多個(gè) Agent 的工具、審查變更的功能、突出的 Skills(開(kāi)放標(biāo)準(zhǔn)的 Agent 能力擴(kuò)展),但有意沒(méi)有文本編輯功能。
【注:Codex App 于2026年2月2日發(fā)布 macOS 版,支持多 Agent 并行工作。同一周 OpenAI 還在超級(jí)碗投放了廣告(標(biāo)語(yǔ):“You can just build things”),并臨時(shí)向免費(fèi)和 Go 用戶開(kāi)放 Codex 功能。】
談到代碼審查,Embiricos 說(shuō)計(jì)劃審查(plan review)變得比以往更重要。
Codex 有一個(gè) Plan Mode:Agent 先以只讀方式研究代碼庫(kù),提出一個(gè)詳細(xì)方案,問(wèn)你是否同意再開(kāi)始執(zhí)行。這就像新員工在動(dòng)手前先給團(tuán)隊(duì)提 RFC(Request for Comments,征求意見(jiàn)稿)。
至于代碼本身的審查,他說(shuō) OpenAI 幾乎所有代碼在推送到 repo 時(shí)都會(huì)被 Codex 自動(dòng)審查。Codex 被專門訓(xùn)練為低誤報(bào)率的審查者,它給出的批評(píng)大多有價(jià)值,所以你可以信任它的反饋。他還提到:有人讓 Codex 審查其他模型生成的代碼,然后意識(shí)到“我可能應(yīng)該直接用 Codex 來(lái)寫代碼”。
【5】開(kāi)放標(biāo)準(zhǔn)——“除了 Claude,所有家都采用了agents.md ”
用戶在不同編碼工具間切換很容易,你怎么看粘性?
Embiricos 說(shuō)他們反而刻意讓用戶更容易切換。Codex 的核心 harness(運(yùn)行框架)是開(kāi)源的。去年 Codex 首發(fā)時(shí),他們建立了agents.md 這個(gè)約定,一個(gè)任何 Agent 都能讀取的配置文件,故意沒(méi)叫 codex.md 。上周他們又推動(dòng)把 Skills(Agent 的能力擴(kuò)展腳本)存放在名為 agents/ 的中性文件夾里,而不是 codex/ 之類的。
“所有人都跟進(jìn)了——除了那家。”他沒(méi)點(diǎn)名,但顯然在說(shuō) Anthropic 的 Claude Code,它使用自己的 格式。
【注: agents.md 是一個(gè)跨工具的 AI Agent 配置標(biāo)準(zhǔn)。OpenAI 推出了 agents.md (復(fù)數(shù)),Amp/Sourcegraph 推出了 agents.md (單數(shù)),后來(lái) Quinn Slack 在社交媒體上提出統(tǒng)一命名,促成了行業(yè)標(biāo)準(zhǔn)化。到2025年底已有超過(guò)6萬(wàn)個(gè)開(kāi)源項(xiàng)目采用,GitHub Copilot 也宣布支持。該標(biāo)準(zhǔn)已由 Linux 基金會(huì)旗下的 Agentic AI Foundation 管理。Claude Code 則使用自有的 CLAUDE.md 格式。】
![]()
但他也指出,這種容易切換的狀態(tài)是暫時(shí)的。當(dāng)前的編碼任務(wù)是“單集式”(episodic)的:你有一個(gè)通用的 agents 文件,任何 Agent 都能讀;Agent 寫代碼,產(chǎn)出一個(gè) patch(補(bǔ)丁),進(jìn)入 git。任務(wù)的兩端都是廠商中性的。
一旦 Agent 開(kāi)始對(duì)接外部系統(tǒng),比如跟 Sentry(錯(cuò)誤監(jiān)控服務(wù))對(duì)話或操作 Google Docs,粘性就會(huì)大幅增加。讓企業(yè)信任一個(gè) Agent 有權(quán)訪問(wèn)這些系統(tǒng)、同時(shí)確保有安全的沙箱和控制措施,這是一個(gè)不想重復(fù)做的決定。
Embiricos 說(shuō)他們正是基于這個(gè)預(yù)判來(lái)構(gòu)建 Codex 的。Codex 采用了最保守的沙箱機(jī)制,用 OS 級(jí)別的控制來(lái)限定 Agent 能做什么。
【6】“我們的工作不是 Codex 的成功,而是智能的分發(fā)”
怎么確保用戶留在 Codex 而不是跑去 Cursor 或 Claude Code?
Harry 用 Hamilton Helmer《七種力量》的框架追問(wèn)如何建立競(jìng)爭(zhēng)壁壘。Embiricos 說(shuō) OpenAI 的使命是“確保安全地將 AGI 的好處帶給全人類”,Codex 團(tuán)隊(duì)的工作本質(zhì)上不是 Codex 的成功,而是 “智能的分發(fā)”。
- “We put all this effort into training these models and then we serve these models to our competitors.”(我們投入巨大精力訓(xùn)練這些模型,然后把模型提供給我們的競(jìng)爭(zhēng)對(duì)手。)
Harry 直接說(shuō):“這對(duì)我作為風(fēng)險(xiǎn)投資人來(lái)說(shuō)太難理解了。”
Embiricos 解釋說(shuō)這是長(zhǎng)期博弈。競(jìng)爭(zhēng)對(duì)手變好,OpenAI 也能學(xué)習(xí)。即使競(jìng)爭(zhēng)對(duì)手是閉源的(暗指 Anthropic),也能從競(jìng)品的產(chǎn)品設(shè)計(jì)和創(chuàng)意中獲得靈感。他舉例說(shuō)自己當(dāng)天早上還在推特上轉(zhuǎn)發(fā)了 Warp(一款終端工具)的新功能,里面有關(guān)于“Agent 同時(shí)在云端和本地工作”的好想法。整個(gè)行業(yè)“都在不可避免地達(dá)到相同的結(jié)論”。
那 Codex 的真正優(yōu)勢(shì)是什么?他列了幾個(gè):ChatGPT 的巨大分發(fā)優(yōu)勢(shì)、自研模型在自家 harness 中的能力優(yōu)勢(shì)(沒(méi)人能提前拿到他們的新模型),以及模型和產(chǎn)品的協(xié)同優(yōu)化。
從公司層面看,最重要的是計(jì)算優(yōu)勢(shì)和最好的模型,為此需要建商業(yè)來(lái)產(chǎn)生收入,而且有趣的是,Codex 這種產(chǎn)品團(tuán)隊(duì)反過(guò)來(lái)也在加速模型改進(jìn)。從產(chǎn)品層面看,最重要的是做出個(gè)人用戶喜歡的產(chǎn)品。
他也承認(rèn)了企業(yè)側(cè)的教訓(xùn):不能只是“我們來(lái)了,隨便用吧”,需要大量教育、配置支持、跟開(kāi)發(fā)者體驗(yàn)負(fù)責(zé)人對(duì)接。
【7】速度、指標(biāo)與產(chǎn)品起伏
推理速度對(duì)開(kāi)發(fā)者有多重要?
Embiricos 說(shuō)“非常重要”。他們跟 Cerebras 合作正是為了解決延遲問(wèn)題。他暗示合作方面很快會(huì)有新消息。
【注:2026年2月12日,OpenAI 發(fā)布了 GPT-5.3-Codex-Spark,這是與 Cerebras 合作的首個(gè)成果。Spark 是 GPT-5.3 Codex 的輕量版,運(yùn)行在 Cerebras 的 Wafer Scale Engine 3芯片上,推理速度超過(guò)1000 tokens/秒,目標(biāo)是實(shí)現(xiàn)近乎即時(shí)的編碼交互。】
不過(guò)他不認(rèn)為推理會(huì)形成壟斷,競(jìng)爭(zhēng)壓力會(huì)催生多種方案。GPT-5.3 Codex 本身就比前代模型高效得多。他們還在 API 層面做了優(yōu)化,模型推理速度快了40%,Codex 用戶端快了25%。
Harry 轉(zhuǎn)述了 Jason Lemkin(SaaStr 創(chuàng)始人)的一個(gè)判斷:”AI 算力是新的銷售和營(yíng)銷”。這句話的意思是:過(guò)去企業(yè)花錢雇銷售團(tuán)隊(duì)、投廣告來(lái)獲客;未來(lái)企業(yè)花錢買 AI 算力(inference,即運(yùn)行模型的計(jì)算成本),讓用戶上手就能體驗(yàn)到產(chǎn)品價(jià)值,自己就轉(zhuǎn)化了——本質(zhì)上是 PLG(Product-Led Growth,產(chǎn)品驅(qū)動(dòng)增長(zhǎng))的 AI 版本,銷售團(tuán)隊(duì)可能不再需要。
Embiricos 不太認(rèn)同。他說(shuō)在一個(gè)人人都能構(gòu)建產(chǎn)品的世界里,市場(chǎng)上的選擇只會(huì)更多,跟客戶保持良好關(guān)系、真正理解他們需要什么,反而比以前更難了。銷售和營(yíng)銷解決的正是這個(gè)問(wèn)題,不會(huì)被取代。
你們的核心指標(biāo)是什么?
主要是周活躍用戶(WAU),不是收入。Harry 追問(wèn):如果 Codex 真的在替代 IDE,不應(yīng)該看日活嗎?Embiricos 當(dāng)場(chǎng)認(rèn)可了這個(gè)批評(píng):“你說(shuō)得對(duì),我們可能應(yīng)該轉(zhuǎn)向日活。”
他說(shuō)目標(biāo)是讓用戶的第一反應(yīng)變成 “有任何事都先問(wèn) Agent”,就像 Google 搜索對(duì)信息的作用、ChatGPT 對(duì)知識(shí)的作用一樣,下一階段應(yīng)該是“任何任務(wù)都先找 Agent”。
去年首發(fā)的云端 Agent 想法很好,給 Agent 自己的云端電腦、可以并行處理多個(gè)任務(wù),但“說(shuō)實(shí)話效果不如后來(lái)發(fā)布的版本”。2025年8月 GPT-5之后他們轉(zhuǎn)向交互式編碼,進(jìn)入了競(jìng)爭(zhēng)最激烈的市場(chǎng),增長(zhǎng)了20倍。2025年12月 GPT-5.2 Codex 上線成為又一個(gè)轉(zhuǎn)折點(diǎn),“12月到現(xiàn)在又翻了一倍”。
然后是2026年2月的集中爆發(fā):GPT-5.3 Codex 鞏固了模型智能的領(lǐng)先;Codex App 發(fā)布(首周超百萬(wàn)下載)解決了用戶體驗(yàn)的短板;超級(jí)碗廣告做了品牌宣傳;向免費(fèi)用戶開(kāi)放擴(kuò)大了覆蓋。
- “Even our biggest critics are converted.”(連我們最大的批評(píng)者都轉(zhuǎn)變了。)
他還不忘調(diào)侃競(jìng)爭(zhēng)對(duì)手:有個(gè)模型比我們?cè)绨l(fā)布了大約20分鐘——“說(shuō)這話可能有點(diǎn)毒舌,但它只當(dāng)了20分鐘的 SOTA(state of the art,最先進(jìn)水平)。”
【注:2026年2月5日 GPT-5.3 Codex 發(fā)布時(shí),Anthropic 幾乎同時(shí)發(fā)布了 Claude Opus 4.6。2月8日超級(jí)碗期間,OpenAI 和 Anthropic 各自播出了廣告,OpenAI 的口號(hào)是“You Can Just Build Things”,Anthropic 則諷刺 OpenAI 在 ChatGPT 中植入廣告。兩家公司在社交媒體上公開(kāi)交鋒。】
最想做不同的事情有兩件。第一,重新回到云端產(chǎn)品。 之前從云端轉(zhuǎn)到本地交互是因?yàn)闀r(shí)機(jī)不對(duì),如果用戶還沒(méi)熟悉你的工具就直接做工作流自動(dòng)化,等于搭了空中樓閣。但現(xiàn)在用戶基礎(chǔ)已經(jīng)建立起來(lái)了,該把云端和本地產(chǎn)品緊密整合了。
第二,投入更多精力解決代碼審查和質(zhì)量控制這類“被低估的瓶頸”。代碼生成已經(jīng)“基本上變得不值一提了”,但怎么知道代碼質(zhì)量好不好、方向?qū)Σ粚?duì),這才是難題。目標(biāo)是讓 Agent 擁有完整的迭代能力,包括收集用戶反饋并自行改進(jìn),不再需要人類審查。
【8】聊天是萬(wàn)能入口,但需要搭配專業(yè) GUI
聊天會(huì)是 AI 的持久界面嗎?
Harry 引用了 a16z 合伙人 Anish Akarya 的反對(duì)觀點(diǎn):聊天界面是 Sam Altman 和 Elon Musk 這類高效人士設(shè)計(jì)的產(chǎn)物,但地球上大多數(shù)人其實(shí)更想要瀏覽器式的、可以點(diǎn)擊發(fā)現(xiàn)的圖形界面。
Embiricos 的回答是”是,但要分兩層看”。他說(shuō)科幻電影是很好的未來(lái)預(yù)測(cè)器——科幻里的 AI 通常很簡(jiǎn)單,就是一個(gè)你可以隨便聊天的實(shí)體,不需要切換到”編碼 AI”再切換到”銷售 AI”。科幻之所以是好預(yù)測(cè)器,恰恰因?yàn)樗侵v故事的,而簡(jiǎn)單的東西通常是對(duì)的。
所以第一層是:聊天或語(yǔ)音作為通用入口,你可以跟它聊任何事,也可以把它加到任何群聊里,讓它自己發(fā)現(xiàn)怎么幫你。
但第二層同樣重要:專業(yè)用戶不想所有事都通過(guò)跟另一個(gè)”人”對(duì)話來(lái)完成。他打了個(gè)比方——想象你有個(gè)行政助理,但你只能通過(guò)跟他對(duì)話來(lái)工作,不能自己看文件、自己編輯。這太煩了,有時(shí)候你就是想直接打開(kāi)文檔自己改。
所以未來(lái)的模式是:聊天做通用入口,搭配針對(duì)特定領(lǐng)域的功能性 GUI。他自己用聊天做播客準(zhǔn)備,但看代碼還是要打開(kāi) Codex App 深入研究。營(yíng)銷人員用聊天問(wèn)產(chǎn)品問(wèn)題,但看廣告數(shù)據(jù)要用專門的分析界面——他們不會(huì)為了問(wèn)個(gè)產(chǎn)品問(wèn)題去下載 Codex App。
他還提到一個(gè)有意思的發(fā)現(xiàn):在構(gòu)建 Codex 的過(guò)程中,他們發(fā)現(xiàn)對(duì) Agent 最好用的界面,往往也是對(duì)人類最好用的界面。比如測(cè)試框架默認(rèn)會(huì)輸出所有測(cè)試結(jié)果,人類要在成千上萬(wàn)行里找到失敗的那一個(gè),很痛苦;AI 也一樣痛苦。但如果你只輸出失敗的測(cè)試,對(duì)人和 Agent 都更好。這意味著 Agent 和人類之間的交接點(diǎn)可以共用同一套界面設(shè)計(jì)。
【9】Agent 市場(chǎng)終局——少數(shù)通用 Agent 會(huì)贏
這個(gè)市場(chǎng)最終是雙頭壟斷還是三分天下?
Harry 用投資人的視角問(wèn)了這個(gè)問(wèn)題:Agent 市場(chǎng)的終局,是像 Uber 和 Lyft 那樣兩家瓜分(Codex 拿大頭),還是像 AWS、Azure、Google Cloud 那樣三分天下?
Embiricos 認(rèn)為最終只有少數(shù)提供商會(huì)捕獲大部分價(jià)值。他的邏輯鏈?zhǔn)沁@樣的:
回看過(guò)去一年,去年很多人以為 Agent 會(huì)在多個(gè)領(lǐng)域找到 PMF(Product Market Fit,產(chǎn)品市場(chǎng)契合),但實(shí)際上只有編碼 Agent 真正跑通了,客戶支持等其他領(lǐng)域還很初期。不過(guò)這是暫時(shí)的,未來(lái) Agent 能做任何事。
到了那個(gè)時(shí)候,你不會(huì)想在公司里配12個(gè) Agent,讓員工自己去找對(duì)的那個(gè)——因?yàn)樗麄儾粫?huì)對(duì)任何一個(gè)達(dá)到”熟練”狀態(tài)。不熟練就不會(huì)主動(dòng)把自動(dòng)化拉入自己的工作流。 但如果只有一個(gè) Agent,入職培訓(xùn)就是”有任何問(wèn)題找它”,人們會(huì)形成肌肉記憶,它會(huì)成為工作的重心。團(tuán)隊(duì)之間會(huì)分享使用技巧、辦黑客馬拉松來(lái)探索新用法,整個(gè)組織圍繞它運(yùn)轉(zhuǎn)。
這跟他在 Dropbox 看到的一模一樣。Slack 崛起之前,Dropbox 的文檔協(xié)作功能其實(shí)更高效——你可以在視頻的精確時(shí)間戳上留言,在文檔的特定段落上標(biāo)注。但人們就是涌向 Slack。沒(méi)人想去文檔上寫評(píng)論,大家只想在 Slack 里直接 @ 你。效率更低,但引力效應(yīng)更強(qiáng)。 Agent 市場(chǎng)會(huì)重演同樣的故事。
他認(rèn)為 ChatGPT 做這件事有天然優(yōu)勢(shì),它已經(jīng)是很多人的通用 AI 入口。
【10】數(shù)據(jù)護(hù)城河在哪里:編程數(shù)據(jù)夠了,知識(shí)工作數(shù)據(jù)才稀缺
編程數(shù)據(jù)護(hù)城河在誰(shuí)手里?Anthropic 是不是已經(jīng)拿到所有數(shù)據(jù)了?
這個(gè)問(wèn)題來(lái)自 Harry 在 LinkedIn 上征集的讀者提問(wèn)。Harry 用”伏地魔”來(lái)形容提問(wèn)者所在的公司——“'那個(gè)不能說(shuō)名字的公司'的一位優(yōu)秀投資人”,然后補(bǔ)了一句”我不想讓 Sam 殺了我”。大概率是 Anthropic 的投資人在問(wèn):你們的編碼數(shù)據(jù)護(hù)城河到底在不在?
Embiricos 的回答很直接:編程數(shù)據(jù)已經(jīng)夠了。他們”有足夠多的數(shù)據(jù)來(lái)構(gòu)建非常好的編碼模型”,這不是瓶頸。
真正有意思的數(shù)據(jù)缺口在知識(shí)工作領(lǐng)域。為什么?
因?yàn)榫幋a有一個(gè)天然的數(shù)據(jù)寶庫(kù),GitHub 上海量的開(kāi)源代碼,代碼怎么寫、怎么改、怎么審查,全都有跡可循。但知識(shí)工作完全不同:沒(méi)有人把自己怎么處理一封郵件、怎么準(zhǔn)備一場(chǎng)會(huì)議、怎么做一個(gè)決策的完整過(guò)程記錄下來(lái)放到網(wǎng)上。這類數(shù)據(jù)在互聯(lián)網(wǎng)上幾乎不存在,而且知識(shí)工作任務(wù)的分布比編碼復(fù)雜得多,編碼任務(wù)相對(duì)標(biāo)準(zhǔn)化,但知識(shí)工作千人千面。
獲取這類數(shù)據(jù)的路徑需要?jiǎng)?chuàng)新。Embiricos 提了兩個(gè)思路:一是付錢請(qǐng)人模擬做任務(wù),記錄完整的操作軌跡作為訓(xùn)練數(shù)據(jù);二是收購(gòu)一些不再運(yùn)營(yíng)但積累了大量工作流數(shù)據(jù)的創(chuàng)業(yè)公司,他舉的例子是”比如某個(gè) Slack 類的產(chǎn)品”,這些產(chǎn)品里存著大量真實(shí)的團(tuán)隊(duì)協(xié)作、決策溝通的記錄。
Harry 問(wèn)到跟外部數(shù)據(jù)公司(Turing、Invisible 等)的合作會(huì)不會(huì)加大投入。Embiricos 說(shuō)他們追求的是盡快推進(jìn),自建數(shù)據(jù)采集團(tuán)隊(duì)對(duì)小團(tuán)隊(duì)來(lái)說(shuō)太耗時(shí)間,大規(guī)模數(shù)據(jù)采集通常會(huì)找外部公司合作。
【11】SaaS 不會(huì)死,但"中間商"公司有麻煩
有人說(shuō)大型 SaaS 公司的收入可持續(xù)性為零,SaaS 已死。你怎么看?
Embiricos 說(shuō)關(guān)鍵問(wèn)題是:這家 SaaS 公司到底擁有什么?
他給出了兩個(gè)判斷標(biāo)準(zhǔn):
- 第一,它是否擁有跟人類的關(guān)系——用戶離不開(kāi)它,是因?yàn)榱?xí)慣了跟它打交道。
- 第二,它是否擁有重要的記錄系統(tǒng)(system of record)——企業(yè)的核心數(shù)據(jù)存在它那里。
如果占了其中一樣,它可能不會(huì)消亡,甚至這兩樣?xùn)|西在 AI 時(shí)代比以往更重要。
但如果一家 SaaS 公司只是個(gè) "glue layer"(膠水層),夾在用戶和數(shù)據(jù)之間做連接和搬運(yùn),既不擁有客戶關(guān)系也不擁有核心數(shù)據(jù),那就比較危險(xiǎn)了。這類公司本質(zhì)上是"中間商",而 AI Agent 天然擅長(zhǎng)的就是打通系統(tǒng)、搬運(yùn)數(shù)據(jù),正好替代它們的核心功能。
Harry 做了更具體的推演:Salesforce、ServiceNow 股價(jià)大跌但被過(guò)度恐慌了;Dropbox 確實(shí)處境艱難; 這種給大量中小企業(yè)用的待辦工具,用戶理論上可以用 vibe coding(憑感覺(jué)編程)做一個(gè),但考慮到定制和維護(hù)成本,大多數(shù)人還是會(huì)繼續(xù)用。他認(rèn)為客戶支持類別最危險(xiǎn)。
Embiricos 補(bǔ)充了一個(gè)關(guān)于創(chuàng)始人類型的判斷:之前有一段時(shí)間,投資“會(huì)做好產(chǎn)品的人”就夠了,因?yàn)樽龊卯a(chǎn)品太難了。但現(xiàn)在做產(chǎn)品變?nèi)菀琢耍銘?yīng)該回到投資 “懂分發(fā)、有行業(yè)經(jīng)驗(yàn)、想清楚客戶是誰(shuí)”的創(chuàng)始人。
那什么領(lǐng)域不會(huì)被模型提供商侵占?
Embiricos 說(shuō)“我不知道,這是個(gè)很難做投資的時(shí)期”。
Harry 給了自己的答案:有物理基礎(chǔ)設(shè)施的(比如能源供應(yīng)),以及有復(fù)雜金融關(guān)系的(比如跟東南亞銀行建立的500個(gè)合作關(guān)系)。
Embiricos 同意:進(jìn)入一個(gè)關(guān)系和行業(yè)知識(shí)決定一切的復(fù)雜市場(chǎng),仍然是好投資。
【12】工程師的黃金時(shí)代——稀缺的是品味和主動(dòng)性
給 CS 學(xué)生什么建議?
Harry 替即將進(jìn)入職場(chǎng)的 CS 學(xué)生問(wèn)了這個(gè)問(wèn)題:怎么在 AI 時(shí)代保持自己的價(jià)值?
Embiricos 的回答出乎意料地樂(lè)觀。他說(shuō)從未有比現(xiàn)在更好的時(shí)機(jī)做工程師。AI 工具讓你能做得更多,上手一個(gè)復(fù)雜代碼庫(kù)的速度前所未有,你可以直接問(wèn) AI 關(guān)于代碼庫(kù)的問(wèn)題,讓它規(guī)劃本來(lái)要花你幾天研究的變更。過(guò)去新人加入一個(gè)大型項(xiàng)目,光是理解現(xiàn)有代碼結(jié)構(gòu)可能就要花幾周,現(xiàn)在這個(gè)過(guò)程被大幅壓縮了。
但他話鋒一轉(zhuǎn):對(duì)能力應(yīng)該樂(lè)觀,但真正的問(wèn)題是怎么拿到那份工作。構(gòu)建變?nèi)菀缀螅∪钡臇|西變了。
- “Because it's never been easier to build things, the thing that becomes scarcer is agency, taste, and quality.”(因?yàn)闃?gòu)建東西從未如此容易,變得稀缺的是主動(dòng)性、品味和質(zhì)量。)
- Agency(主動(dòng)性):不是等別人告訴你做什么,而是自己發(fā)現(xiàn)問(wèn)題、主動(dòng)去解決。
- Taste(品味):在無(wú)數(shù)種實(shí)現(xiàn)方式中選擇最優(yōu)雅的那個(gè),知道什么該做什么不該做。
- Quality(質(zhì)量):當(dāng) AI 能幫所有人寫出80分的代碼,你靠什么脫穎而出?靠那最后20分的打磨

他的具體建議是:構(gòu)建東西,然后分享出去。OpenAI 收到大量的求職申請(qǐng),無(wú)論是通過(guò)官網(wǎng)投遞還是社交媒體私信。但真正能引起他注意的,不是一份漂亮的簡(jiǎn)歷,而是有人帶著有趣的想法和一個(gè)項(xiàng)目鏈接來(lái)找他。這個(gè)項(xiàng)目本身就能展示你的主動(dòng)性、品味和質(zhì)量,比任何學(xué)歷背景都有說(shuō)服力。
【13】Dropbox 的教訓(xùn)——人們會(huì)涌向他們喜歡使用的工具
從 Dropbox 學(xué)到的最大教訓(xùn)?
Harry 提到 Dropbox 校友群體在硅谷的影響力很大,問(wèn) Embiricos 從那段經(jīng)歷中學(xué)到了什么。Embiricos 說(shuō)這個(gè)問(wèn)題不用想就知道答案。
核心教訓(xùn):工具是 ”參與系統(tǒng)”(system of engagement),如果人們不喜歡用你的工具,他們就不會(huì)用。
他講了一個(gè)親歷的故事。在 Slack 崛起之前,Dropbox 內(nèi)部一直在討論一個(gè)問(wèn)題:用戶到底應(yīng)該在 Dropbox 里給文檔寫評(píng)論,還是去 Slack 里討論文檔?從效率角度看,答案很明顯:在 Dropbox 里直接評(píng)論更優(yōu),你可以在視頻的精確時(shí)間戳上留言,在文檔的特定段落上標(biāo)注,信息跟內(nèi)容綁定在一起,上下文完整。
但現(xiàn)實(shí)是:人們就是涌向了 Slack。 沒(méi)人想去文檔上寫評(píng)論,大家只想在 Slack 里直接 @ 你。效率更低,但 Slack 是人們交流的重心,引力效應(yīng)太強(qiáng)了。Dropbox 的協(xié)作功能就這樣被碾壓了。
他把這個(gè)教訓(xùn)直接應(yīng)用到了 Codex 的產(chǎn)品策略上:如果 Agent 只做 workflow 自動(dòng)化(工作流程自動(dòng)化),推廣就像”拔牙”一樣痛苦,你得雇 Accenture 這樣的咨詢公司進(jìn)場(chǎng),部署實(shí)施工程師(FTEE),一套流程走下來(lái)既慢又貴。
但如果你做出一個(gè)人們真心喜歡用的工具,哪怕一開(kāi)始只用它完成部分任務(wù),用戶會(huì)越來(lái)越擅長(zhǎng)使用它。隨著使用加深,工具會(huì)逐漸連接更多系統(tǒng),自動(dòng)化就自然而然地被拉入工作流,不是你推給用戶的,是用戶自己拉進(jìn)來(lái)的。這就是”參與系統(tǒng)”和”自上而下部署”的根本區(qū)別。
至于 Dropbox 今天怎么做?Embiricos 說(shuō) Dropbox 的獨(dú)特優(yōu)勢(shì)是桌面軟件,這是他們多年積累的核心能力。所有知識(shí)工作最終發(fā)生在用戶的電腦上,要么在瀏覽器里,要么在本地應(yīng)用里。
Agent 帶來(lái)的第一波生產(chǎn)力提升,一定是從用戶的電腦端開(kāi)始,先用用戶手邊已有的東西工作,不需要任何前期部署。如果他是 Dropbox,會(huì)利用桌面軟件專長(zhǎng)來(lái)做生產(chǎn)力 Agent,在用戶的電腦上構(gòu)建一個(gè)協(xié)作層。
【14】快問(wèn)快答
人才競(jìng)爭(zhēng)有多激烈? Embiricos 說(shuō)極其激烈。OpenAI 品牌強(qiáng)大,能吸引很多人才,但即使如此也要花大力氣說(shuō)服心儀的候選人加入。對(duì)于 PM 崗位,他們極度挑剔,如果不是完美匹配,可能弊大于利。
利潤(rùn)率重要嗎? Embiricos 認(rèn)為推理成本會(huì)顯著下降,但今年是 Agent 大規(guī)模接入企業(yè)系統(tǒng)的關(guān)鍵年,一旦連接建立就很有粘性。所以今年是一場(chǎng)競(jìng)賽,為了贏這場(chǎng)競(jìng)賽,可以接受一定的利潤(rùn)率損失。
過(guò)去12個(gè)月最大的認(rèn)知轉(zhuǎn)變: 加入 OpenAI 時(shí)以為很快就會(huì)有基于視頻和音頻的多模態(tài) Agent,大家可以跟電腦屏幕共享式協(xié)作。結(jié)果多模態(tài)模型進(jìn)展比預(yù)期慢,通過(guò)代碼操作計(jì)算機(jī)才是正道。這是他對(duì)“如何把 AI 的好處帶給普通人”的思路的徹底重構(gòu)。
最尊敬的競(jìng)爭(zhēng)對(duì)手: Amp,來(lái)自 Sourcegraph。不只是因?yàn)楫a(chǎn)品口碑超出體量,更因?yàn)樗麄儼l(fā)起了 agents.md 標(biāo)準(zhǔn)化。Amp 的 Quinn Slack 發(fā)了條推特說(shuō)“你們買了 agents.md 這個(gè)域名的話,我們就統(tǒng)一到你們的命名”,這個(gè)看似微小的舉動(dòng)啟動(dòng)了整個(gè)行業(yè)的標(biāo)準(zhǔn)化。
【注:Amp 是 Sourcegraph 孵化的編碼 Agent 工具,2026年初已從 Sourcegraph 分拆為獨(dú)立公司。聯(lián)合創(chuàng)始人是 Quinn Slack 和 Beyang Liu。】
對(duì) Anthropic 廣告的回應(yīng): 一家公司對(duì)未來(lái)很悲觀,另一家,“也就是我們 OpenAI”,在告訴人們你可以構(gòu)建東西、去追夢(mèng)。他認(rèn)為這個(gè)回應(yīng)“很精彩”。
【注:2026年超級(jí)碗廣告季,Anthropic 投放了一支廣告,被認(rèn)為在批評(píng) OpenAI 在 ChatGPT 免費(fèi)版中引入廣告的做法。OpenAI 的 Codex 廣告標(biāo)語(yǔ)是“You can just build things”(你就是可以構(gòu)建東西)。】
最痛苦的產(chǎn)品決策: Codex Cloud 一度提供無(wú)限使用(只需要 ChatGPT 訂閱就行),后來(lái)改為有限額度,引發(fā)了激烈的用戶反彈。雖然是很小一部分用戶在抱怨,但社交媒體上的噪音影響了所有地方。教訓(xùn):不能讓東西免費(fèi)太久。
5年后回看會(huì)覺(jué)得荒謬的事: 手動(dòng)編輯代碼。還有手動(dòng)管理部署和監(jiān)控。未來(lái)創(chuàng)業(yè)的方式可能是:先找一個(gè) Agent,讓它構(gòu)建東西,再加更多 Agent,然后才加入聯(lián)合創(chuàng)始人。你的主要溝通工具可能就是 Agent 溝通工具,而不是手動(dòng)管理 CI(持續(xù)集成)和部署流程。
- “The way you start a company is you start by getting an agent and just asking it to build things.”(創(chuàng)業(yè)的方式是先找一個(gè) Agent,讓它開(kāi)始構(gòu)建。)
10年內(nèi)最期待的事(他說(shuō)可能用不了10年):讓 AI 幫到所有人,不只是科技圈的人。他說(shuō)加入 OpenAI 時(shí)就覺(jué)得模型的能力遠(yuǎn)超產(chǎn)品化的程度,像他這樣的人比他奶奶從 AI 中獲益多得多。他的愿景是把 Agent 加入家庭 WhatsApp 群,它就自然而然地開(kāi)始幫忙,不需要任何人多想。
Embiricos 在這場(chǎng)訪談中展現(xiàn)了一個(gè)相對(duì)完整的產(chǎn)品世界觀,三個(gè)核心判斷貫穿始終:
第一,編程 Agent 只是起點(diǎn),通用 Agent 才是終局。 AI 編碼的瓶頸已經(jīng)從模型轉(zhuǎn)向人機(jī)交互,產(chǎn)品化和降低使用門檻是當(dāng)前最重要的工作。
第二,自下而上賦予個(gè)人用戶 AI 能力,比自上而下的企業(yè)部署更有價(jià)值。 先讓人們用上工具、建立直覺(jué),再談自動(dòng)化。
第三,開(kāi)放標(biāo)準(zhǔn)短期降低粘性,但長(zhǎng)期建立生態(tài)信任。 OpenAI 的策略是開(kāi)放標(biāo)準(zhǔn)加最強(qiáng)模型加最大分發(fā)的組合,服務(wù)于成為通用 Agent 入口的目標(biāo)。
值得持續(xù)關(guān)注的幾個(gè)信號(hào):
- Codex 免費(fèi)開(kāi)放策略是否可持續(xù)(他們已經(jīng)吃過(guò)一次“無(wú)限變限量”的虧)
- Codex 云端產(chǎn)品的回歸進(jìn)度(Embiricos 說(shuō)想重新做好這塊)
- Atlas 瀏覽器能否成為企業(yè) AI 落地的關(guān)鍵入口
- AI 代碼審查和質(zhì)量控制的進(jìn)展(他認(rèn)為這是當(dāng)前被低估的瓶頸)
- “所有 Agent 都是編碼 Agent”這個(gè)判斷在非技術(shù)領(lǐng)域是否成立
- agents.md 等開(kāi)放標(biāo)準(zhǔn)能否真正成為行業(yè)共識(shí),目前 Claude Code 仍然是最大的缺席者
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.