網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AGI倒計(jì)時(shí)，OpenAI首席研究官重磅表態(tài)：留給人類(lèi)的窗口「很小」

2026-06-30 13:23:39　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

【新智元導(dǎo)讀】OpenAI首席研究官M(fèi)ark Chen釋放了一個(gè)強(qiáng)烈信號(hào)：OpenAI 并不認(rèn)為scaling laws已經(jīng)失效，恰恰相反，預(yù)訓(xùn)練、數(shù)據(jù)工程、推理訓(xùn)練和更長(zhǎng)任務(wù)鏈條，仍是通向AGI的主干道路。

通用人工智能AGI，即將到來(lái)。

剛剛，OpenAI首席研究官M(fèi)ark Chen豪言：

在某種意義上，就像希望你能感覺(jué)到，AGI（通用人工智能）即將到來(lái)……

我們正越來(lái)越接近這樣一個(gè)世界：模型能夠自主提出更多創(chuàng)新——它們能夠進(jìn)行自我維持的研究。

這不僅僅是效率的提升，「進(jìn)化」本身也被外包給了硅基生命。

當(dāng)Mark Chen在鏡頭前熟練地切著蘑菇和洋蔥時(shí)，他談?wù)摰牟粌H是一碗湯，而是人類(lèi)文明最后的一塊陣地。

如果AI能夠自己研究自己，那在AGI到來(lái)的前夜，人類(lèi)究竟該扮演什么角色？

每個(gè)領(lǐng)域都在經(jīng)歷自己的「神之一手」

要明白這句話的分量，得先回到Mark入行的那一刻。

2016年，AlphaGo對(duì)戰(zhàn)李世石。

第二局里有一手「第37手」，落子的瞬間，全人類(lèi)棋手集體看不懂。

后來(lái)才明白，那是機(jī)器走出的、人類(lèi)根本想不到的一手。那一刻點(diǎn)燃了無(wú)數(shù)人，也把Mark Chen拽進(jìn)了這個(gè)領(lǐng)域。

而如今呢？

「最瘋狂的是，」Mark說(shuō)，「你現(xiàn)在在幾乎每一個(gè)領(lǐng)域，都能看到『神之一手』。」

數(shù)學(xué)里有，計(jì)算機(jī)科學(xué)里有，編程里有。

他描述了一個(gè)很微妙的時(shí)間點(diǎn)：很多人是在今年年初「一覺(jué)醒來(lái)」，突然意識(shí)到：AI agent在我這一行，真的能干活了。

不是玩具。不是demo。是能替你完成有意義的、長(zhǎng)周期的真實(shí)工作（long-horizon work）。

這意味「模型自己做研究」這件事，不再是科幻片里的橋段。

它是從一連串已經(jīng)發(fā)生的「神之一手」里，自然外推出來(lái)的下一步。

你順著這條線往前看，終點(diǎn)處站著的，就是那個(gè)會(huì)自己搞研究的模型。

Scaling不止，預(yù)訓(xùn)練未死

可這種樂(lè)觀，到底靠什么撐著？

靠一個(gè)信念：Scaling曲線還沒(méi)到頭。

這兩年，「預(yù)訓(xùn)練已死」「語(yǔ)言模型到不了AGI」的論調(diào)隔三差五就要冒出來(lái)。

Mark Chen對(duì)這些唱衰「相當(dāng)激烈地反對(duì)」。

他點(diǎn)破了套路。

「預(yù)訓(xùn)練已死」聽(tīng)著很新鮮，其實(shí)是部老掉牙的劇本，過(guò)去這些年被反復(fù)重播。

每一次，都有人指著某個(gè)瓶頸說(shuō)「到頂了，過(guò)不去了」；每一次，OpenAI又總能掏出一個(gè)新的工程技巧、或某個(gè)研究上的新洞見(jiàn)，把那堵墻鑿穿。

Mark Chen堅(jiān)信，「我們正處在指數(shù)曲線上。它已經(jīng)撐過(guò)了將近10個(gè)數(shù)量級(jí)，沒(méi)有任何理由它不會(huì)繼續(xù)撐下去。」

而最有說(shuō)服力的證據(jù)，是OpenAI自己親手賭贏過(guò)一次。

賭的，就是推理（reasoning）。

o1剛立項(xiàng)時(shí)，連OpenAI內(nèi)部都有人不信。

當(dāng)時(shí)「預(yù)訓(xùn)練+后訓(xùn)練」的范式太能打了，有人會(huì)很自然地問(wèn)：機(jī)器已經(jīng)轉(zhuǎn)得好好的，何必再去折騰別的？

是Jakub Pachocki、Ilya Sutskever等幾個(gè)有信念、有判斷力的人硬推，才慢慢把它變成全公司的根本性賭注。

一年后，o1出世，推理范式引爆整個(gè)行業(yè)。

曲線還沒(méi)到頭，加上最大的突破往往來(lái)自一開(kāi)始沒(méi)人信的賭注，這兩條加在一起，就是Mark Chen敢說(shuō)「模型自我維持研究不遠(yuǎn)了」的底氣。

當(dāng)模型開(kāi)始在長(zhǎng)達(dá)數(shù)周、甚至數(shù)月的任務(wù)上進(jìn)行思考時(shí)，它所產(chǎn)生的創(chuàng)新，可能已經(jīng)超出了人類(lèi)專(zhuān)家的認(rèn)知盲區(qū)。

這正是「自我維持科研」的基石：如果它能推導(dǎo)出人類(lèi)沒(méi)見(jiàn)過(guò)的數(shù)學(xué)公式，它當(dāng)然也能寫(xiě)出比人類(lèi)更優(yōu)的算法架構(gòu)。

Vibe Researcher：當(dāng)執(zhí)行力變得廉價(jià)

我們已經(jīng)有了vibe coder——?jiǎng)觿?dòng)嘴，讓AI寫(xiě)代碼。

研究，也在往這個(gè)方向滑。

在訪談中，一個(gè)極具爭(zhēng)議的概念被反復(fù)提及：Vibe Researcher（氛圍研究員）。

這是一個(gè)略帶自嘲但深思熟慮的職業(yè)預(yù)測(cè)。

Mark認(rèn)為，未來(lái)的頂級(jí)研究員將不再是那個(gè)寫(xiě)下每一行PyTorch代碼的人，而是那個(gè)「拿捏感覺(jué)」的人。

無(wú)論是OpenAI還是其他實(shí)驗(yàn)室，你都開(kāi)始看到，大量的工作正在變成以「編排」（orchestration）為主。

翻譯成人話：人負(fù)責(zé)出主意，模型負(fù)責(zé)把活全干完。

研究員動(dòng)腦子想點(diǎn)子，剩下的實(shí)現(xiàn)、執(zhí)行、調(diào)度，模型自己搞定。

OpenAI的三年路線圖，終點(diǎn)寫(xiě)得明明白白：讓模型做端到端（end-to-end）的研究，從出主意到出成果，全程自己來(lái)。

但這條路上，全是還沒(méi)填平的坑

隨著AI能夠自主執(zhí)行和編排（Orchestration）任務(wù)，人類(lèi)的工作將被極限壓縮到兩端：

1、提出真正的問(wèn)題。

2、判斷AI給出的答案是否有「靈魂」。

這就是所謂的「品味」（Taste）。

因?yàn)闄C(jī)器沒(méi)有「生活」，所以它沒(méi)有「常識(shí)」，也就無(wú)從產(chǎn)生「品味」。

但冷靜下來(lái)想，Mark Chen自己比誰(shuí)都清楚，這條路遠(yuǎn)沒(méi)有鋪平。

第一個(gè)坑：評(píng)測(cè)，崩了。

他用了一個(gè)內(nèi)部詞，叫「Benchmaxxing」（刷榜）——找一堆和測(cè)試集長(zhǎng)得幾乎一模一樣的題，往死里訓(xùn)，分?jǐn)?shù)好看得不得了，泛化能力半點(diǎn)沒(méi)漲。

更糟的是，公認(rèn)的金標(biāo)準(zhǔn)benchmark數(shù)量太少。

「我們真的處在一場(chǎng)評(píng)測(cè)危機(jī)里。」他說(shuō)，SAT那種經(jīng)典測(cè)試，對(duì)今天的模型全都飽和了。

甚至，一個(gè)評(píng)測(cè)一旦被公開(kāi)到世界上，它就已經(jīng)不是好評(píng)測(cè)了，就像一張印出來(lái)就立刻作廢的考卷。

應(yīng)對(duì)這一問(wèn)題的兩種策略：

1、將評(píng)估創(chuàng)建團(tuán)隊(duì)與模型優(yōu)化團(tuán)隊(duì)分離，形成一種對(duì)抗性激勵(lì)。

2、大規(guī)模部署模型并觀察實(shí)際應(yīng)用中的失敗模式。

他還指出，每一項(xiàng)新能力的出現(xiàn)都會(huì)伴隨著對(duì)應(yīng)的評(píng)估需求，而引導(dǎo)評(píng)估方向是他工作中相當(dāng)重要的一部分。

第二個(gè)坑：參差的前沿（jagged frontier）。

模型能拿下奧數(shù)、信奧級(jí)別的難題，卻可能搞不定人類(lèi)隨手就能做的瑣事，就一個(gè)能心算微積分、卻不會(huì)自己系鞋帶的天才。

差在哪？差在「上下文」，差在持續(xù)學(xué)習(xí)（continual learning）——把一個(gè)任務(wù)里學(xué)到的教訓(xùn)，用到下一個(gè)任務(wù)上。

這對(duì)人太自然了，對(duì)模型，卻是全行業(yè)正在死磕的硬骨頭。

被問(wèn)到通往AGI是不是還需要兩三個(gè)根本性的突破，Mark沒(méi)接。

他說(shuō)，持續(xù)學(xué)習(xí)這種東西是「必須解鎖的基礎(chǔ)能力」，至于算不算"突破"他說(shuō)不好，但「很多發(fā)都已經(jīng)瞄準(zhǔn)了球門(mén)，我相當(dāng)確定它們會(huì)進(jìn)。」

這就是他的態(tài)度：坑是真的，每一個(gè)坑都已經(jīng)有人在填，而且他賭填得上。

湯的隱喻：在AGI之后去開(kāi)個(gè)面館

訪談中最溫馨的一幕，是關(guān)于「湯」的故事。

據(jù)說(shuō)Mark Zuckerberg曾試圖用自制的湯去挖走OpenAI的研究員，而Mark Chen的回應(yīng)則是：直接把湯帶到辦公室分給大家。

當(dāng)被問(wèn)到AGI實(shí)現(xiàn)后的終極愿望時(shí)，這位掌管著全球最強(qiáng)大AI大腦的人，回答：

「我想去開(kāi)個(gè)面館。這可能是我的AGI后愛(ài)好。」

這個(gè)回答里藏著深意。

當(dāng)AI能夠完成所有「自我維持的科研」，當(dāng)所有的知識(shí)和創(chuàng)新都能以光速產(chǎn)生，人類(lèi)最稀缺的資源將不再是智力，而是「體驗(yàn)」。

機(jī)器可以算出一碗湯的最佳咸度，但它永遠(yuǎn)無(wú)法賦予這碗湯以「溫度」和「故事」。

參考資料：

https://www.youtube.com/watch?v=fpAthTtha8c

https://finance.biggo.com/podcast/1241bc21164ccc75

編輯：大衛(wèi)

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.