文 | 世界模型工場
Agent到底有沒有真的改變工作?
OpenAI最新發布的一份報告《The Shift to Agentic AI: Evidence from Codex》,給出了目前最直接的一組數據。
這份報告由OpenAI、哥倫比亞商學院、沃頓商學院、杜克大學Fuqua商學院的研究者共同完成。
報告分析了OpenAI Codex的真實使用數據,比較了三類人群:個人賬戶用戶、組織賬戶用戶,以及OpenAI內部員工。
它不僅展示了OpenAI內部是如何最大化使用Codex的,還會讓人產生一種感受:
AI的使用方式正在經歷一次靜默的范式轉移。
從和AI對話到讓AI干活,從自己動手到管理一群AI員工,這個過程已經在發生,但大多數人還沒意識到這件事已經在發生了。
![]()
Codex用戶半年增長五倍,但采用不均衡
報告顯示,2026年上半年,Codex的周活躍用戶數增長超過5倍。
但在個人用戶、組織用戶、OpenAI內部員工之間,Codex的使用強度差異很大。
報告數據表明,過去28天內使用過Codex的活躍用戶,個人用戶中的比例只有0.7%,組織用戶中的比例達到17.3%,OpenAI內部員工中達到97.9%。
![]()
也就是說,在普通個人用戶中,Codex仍然是早期產品;在企業組織中,Codex已經開始擴散;但在OpenAI內部,它已經接近全面普及。
報告特別指出,在OpenAI內部,Codex已經基本替代ChatGPT,成為主要的工作AI界面。
因為OpenAI是一個異常有利的環境,員工熟悉前沿模型、使用成本低、組織支持度高、培訓和非正式知識分享普遍。
盡管OpenAI的使用不代表今天的典型企業,但它展示了一個信號:
當所有的采用障礙都被移除后,Agent的使用會是什么樣子。
Agent任務越來越難,輸出越來越多
報告還分析了用戶交給Codex任務的復雜度,并為測試設置了一個巧妙的問題:
如果沒有AI,一個有經驗的人類完成同樣任務,需要多長時間?
結果很驚人。
2025年12月,只有35.4%的活躍個人用戶,發送過至少一個需要1小時以上人工完成的任務。
到了2026年5月,這個比例翻倍到了70.2%。
更夸張的是需要8小時以上人工完成的任務,發送過這類任務的用戶比例從2.1%,飆升到了25.6%,增長了10倍還多。
![]()
與此同時,產出也在暴漲。
2026年6月,OpenAI法律崗位的普通員工通過Codex和ChatGPT生成的月輸出Token,比2025年11月增長了13倍,普通研究人員的增長更是超過了50倍。
報告還發現一個有趣的現象:
在Agent時代,用戶從一開始就在委派最復雜的工作。用戶先提出最宏大、最復雜的需求,后續的對話只是不斷地細化和修正。
這跟傳統的“先問簡單問題、再逐步深入”的交互模式完全相反。
Codex早就不只是寫代碼了
雖然Codex最初是為軟件開發設計的,但它的使用早已超出這個范圍。
在Codex所有用戶群體中,最常見的仍然是工程運維、代碼實現、代碼理解等軟件相關任務。
但Codex也被廣泛用于文檔編寫、數據分析、研究、協作溝通等非編碼工作。
在OpenAI內部,Codex還被用于研究、規劃、溝通、招聘、銷售、產品工作和數據分析。
使用范圍越廣的組織,Agent的滲透越深,這似乎是一個自我強化的循環。
![]()
報告還比較了不同職能的使用差異。
在組織中,工程運維占大多數資歷組輸出Token的最大份額,但知識工件類任務在管理人員和高管中占比更高。
在OpenAI內部,個體貢獻者更偏向工程運維,而管理層更偏向協作類任務。
不同角色用Agent做不同的事,但所有人都在用。
最深度用戶在“管理一群AI員工”
如果說普通用戶還在用AI干活,那最前沿的用戶已經在管一群AI員工干活了。
在OpenAI內部,只有10.7%的員工在同一時間只運行一個Agent,近30%的員工在某個時間點同時管理5個或以上的并發Agent。
報告描述這是一種“人類監督一支Agent團隊”的工作方式,同時把任務分配給多個Agent,監控進度,選擇性介入。
在外部,這種并行工作流還不普遍。
約67%的組織用戶和64%的個人用戶,完全不使用并發Agent。
但在OpenAI內部,這批最重度用戶每天平均會讓Codex累計運行約71小時。
比如,一個員工同時讓3個Codex agents分別修bug、寫測試、整理文檔。如果這3個任務各自運行1小時,報告就會記為累計運行3小時。
![]()
報告顯示,從2026年4月7日以來,OpenAI內部這批前1%重度用戶的Codex累計每日運行時長,增長了近88%。
外部用戶也在增長,但強度明顯低得多。
在組織用戶中,使用強度排在前1%的用戶,每日運行時長增長約25%。
在個人用戶中,前1%重度用戶的每日運行時長增長約50%。
用戶開始把工作流封裝起來反復使用
一次性使用AI完成某個任務,跟把一套工作流封裝好讓AI反復執行,是兩種完全不同的深度。
Codex通過“技能”(Skills)和“插件”來實現工作流的系統化,即把指令、軟件和外部工具集成打包,可以反復調用,甚至跨用戶、跨組織共享。
2026年3月1日,只有5.4%的活躍Codex用戶調用過技能。到6月11日,這個比例達到了26.6%。
![]()
分群體看差距更明顯:
25.7%的個人用戶和30.4%的組織用戶調用了技能,而在OpenAI內部,96.2%的活躍用戶調用了至少一個技能。
報告特別提到,自定義技能的增長尤其快,就是那些用戶或組織自己編寫的、針對特定團隊標準或工作流程的技能。
這是一次更深層的工作方式變革。
一旦組織下定決心,AI轉型可以非常快
很多人以為,新技術總是從頂層先普及,但Codex的數據給出了相反的答案。
從職位來看,工程師是最早、最深地使用Codex的群體。
在組織用戶中,普通工程師有26.8%的Token是在Codex上生成的,這一份額自年初以來增長了5倍。
數據和數據分析從業者緊隨其后,達到15.2%。
但從資歷來看,Codex的采用橫跨了整個層級,從初級員工到高管都在用。
報告認為,高級用戶用Codex不只是為了寫代碼,更多是為了規劃、審查和委派任務。
有意思的是,在OpenAI內部,后來采用Codex的部門如:法務、招聘的轉型速度,反而比早期采用的工程部門更快。
2026年1月時,這些部門的Codex使用率接近于零,到4月初達到約20%,一個月內就飆升至75%。
這表明,一旦組織下定決心,轉型可以非常快。
![]()
最會造AI的人,也是把AI用得最狠的人
這份報告最核心的一個洞見是:
Agent的采用,不取決于模型有多強,而取決于組織環境有多支持。
同樣的Codex,在個人、組織和OpenAI內部,呈現出完全不同的使用模式。
報告認為,決定因素包括:相關文件和系統的訪問權限、管理層的期望、員工的技能水平、以及是否有配套的審查流程。
這跟歷史上所有通用技術的擴散規律一致。
技術本身只是催化劑,真正的變革發生在組織如何圍繞技術重新設計工作流程。
報告用了一個經典的類比:
19世紀末從蒸汽動力轉向電力的過程中,早期工廠只是把蒸汽機換成電動機,工廠布局和 工作流基本沒變。
真正的生產力爆發,發生在幾十年后工廠被重新設計、生產流程被徹底重構的時候。
Agent可能正在經歷同樣的過程。
當下的使用情況或許只是冰山一角,真正的變革還在后面。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.