![]()
新智元報(bào)道
![]()
【新智元導(dǎo)讀】OpenAI首席研究官M(fèi)ark Chen釋放了一個(gè)強(qiáng)烈信號(hào):OpenAI 并不認(rèn)為scaling laws已經(jīng)失效,恰恰相反,預(yù)訓(xùn)練、數(shù)據(jù)工程、推理訓(xùn)練和更長(zhǎng)任務(wù)鏈條,仍是通向AGI的主干道路。
通用人工智能AGI,即將到來(lái)。
剛剛,OpenAI首席研究官M(fèi)ark Chen豪言:
在某種意義上,就像希望你能感覺(jué)到,AGI(通用人工智能)即將到來(lái)……
我們正越來(lái)越接近這樣一個(gè)世界:模型能夠自主提出更多創(chuàng)新——它們能夠進(jìn)行自我維持的研究。
這不僅僅是效率的提升,「進(jìn)化」本身也被外包給了硅基生命。
當(dāng)Mark Chen在鏡頭前熟練地切著蘑菇和洋蔥時(shí),他談?wù)摰牟粌H是一碗湯,而是人類(lèi)文明最后的一塊陣地。
如果AI能夠自己研究自己,那在AGI到來(lái)的前夜,人類(lèi)究竟該扮演什么角色?
![]()
每個(gè)領(lǐng)域都在經(jīng)歷自己的「神之一手」
要明白這句話的分量,得先回到Mark入行的那一刻。
2016年,AlphaGo對(duì)戰(zhàn)李世石。
![]()
第二局里有一手「第37手」,落子的瞬間,全人類(lèi)棋手集體看不懂。
![]()
后來(lái)才明白,那是機(jī)器走出的、人類(lèi)根本想不到的一手。那一刻點(diǎn)燃了無(wú)數(shù)人,也把Mark Chen拽進(jìn)了這個(gè)領(lǐng)域。
而如今呢?
「最瘋狂的是,」Mark說(shuō),「你現(xiàn)在在幾乎每一個(gè)領(lǐng)域,都能看到『神之一手』。」
數(shù)學(xué)里有,計(jì)算機(jī)科學(xué)里有,編程里有。
![]()
他描述了一個(gè)很微妙的時(shí)間點(diǎn):很多人是在今年年初「一覺(jué)醒來(lái)」,突然意識(shí)到:AI agent在我這一行,真的能干活了。
不是玩具。不是demo。是能替你完成有意義的、長(zhǎng)周期的真實(shí)工作(long-horizon work)。
這意味「模型自己做研究」這件事,不再是科幻片里的橋段。
它是從一連串已經(jīng)發(fā)生的「神之一手」里,自然外推出來(lái)的下一步。
你順著這條線往前看,終點(diǎn)處站著的,就是那個(gè)會(huì)自己搞研究的模型。
Scaling不止,預(yù)訓(xùn)練未死
可這種樂(lè)觀,到底靠什么撐著?
靠一個(gè)信念:Scaling曲線還沒(méi)到頭。
這兩年,「預(yù)訓(xùn)練已死」「語(yǔ)言模型到不了AGI」的論調(diào)隔三差五就要冒出來(lái)。
Mark Chen對(duì)這些唱衰「相當(dāng)激烈地反對(duì)」。
他點(diǎn)破了套路。
「預(yù)訓(xùn)練已死」聽(tīng)著很新鮮,其實(shí)是部老掉牙的劇本,過(guò)去這些年被反復(fù)重播。
![]()
每一次,都有人指著某個(gè)瓶頸說(shuō)「到頂了,過(guò)不去了」;每一次,OpenAI又總能掏出一個(gè)新的工程技巧、或某個(gè)研究上的新洞見(jiàn),把那堵墻鑿穿。
Mark Chen堅(jiān)信,「我們正處在指數(shù)曲線上。它已經(jīng)撐過(guò)了將近10個(gè)數(shù)量級(jí),沒(méi)有任何理由它不會(huì)繼續(xù)撐下去。」
![]()
而最有說(shuō)服力的證據(jù),是OpenAI自己親手賭贏過(guò)一次。
賭的,就是推理(reasoning)。
o1剛立項(xiàng)時(shí),連OpenAI內(nèi)部都有人不信。
當(dāng)時(shí)「預(yù)訓(xùn)練+后訓(xùn)練」的范式太能打了,有人會(huì)很自然地問(wèn):機(jī)器已經(jīng)轉(zhuǎn)得好好的,何必再去折騰別的?
是Jakub Pachocki、Ilya Sutskever等幾個(gè)有信念、有判斷力的人硬推,才慢慢把它變成全公司的根本性賭注。
![]()
一年后,o1出世,推理范式引爆整個(gè)行業(yè)。
曲線還沒(méi)到頭,加上最大的突破往往來(lái)自一開(kāi)始沒(méi)人信的賭注,這兩條加在一起,就是Mark Chen敢說(shuō)「模型自我維持研究不遠(yuǎn)了」的底氣。
當(dāng)模型開(kāi)始在長(zhǎng)達(dá)數(shù)周、甚至數(shù)月的任務(wù)上進(jìn)行思考時(shí),它所產(chǎn)生的創(chuàng)新,可能已經(jīng)超出了人類(lèi)專(zhuān)家的認(rèn)知盲區(qū)。
這正是「自我維持科研」的基石:如果它能推導(dǎo)出人類(lèi)沒(méi)見(jiàn)過(guò)的數(shù)學(xué)公式,它當(dāng)然也能寫(xiě)出比人類(lèi)更優(yōu)的算法架構(gòu)。
Vibe Researcher:當(dāng)執(zhí)行力變得廉價(jià)
我們已經(jīng)有了vibe coder——?jiǎng)觿?dòng)嘴,讓AI寫(xiě)代碼。
![]()
研究,也在往這個(gè)方向滑。
在訪談中,一個(gè)極具爭(zhēng)議的概念被反復(fù)提及:Vibe Researcher(氛圍研究員)。
這是一個(gè)略帶自嘲但深思熟慮的職業(yè)預(yù)測(cè)。
Mark認(rèn)為,未來(lái)的頂級(jí)研究員將不再是那個(gè)寫(xiě)下每一行PyTorch代碼的人,而是那個(gè)「拿捏感覺(jué)」的人。
![]()
無(wú)論是OpenAI還是其他實(shí)驗(yàn)室,你都開(kāi)始看到,大量的工作正在變成以「編排」(orchestration)為主。
翻譯成人話:人負(fù)責(zé)出主意,模型負(fù)責(zé)把活全干完。
研究員動(dòng)腦子想點(diǎn)子,剩下的實(shí)現(xiàn)、執(zhí)行、調(diào)度,模型自己搞定。
OpenAI的三年路線圖,終點(diǎn)寫(xiě)得明明白白:讓模型做端到端(end-to-end)的研究,從出主意到出成果,全程自己來(lái)。
![]()
但這條路上,全是還沒(méi)填平的坑
隨著AI能夠自主執(zhí)行和編排(Orchestration)任務(wù),人類(lèi)的工作將被極限壓縮到兩端:
1、提出真正的問(wèn)題。
2、判斷AI給出的答案是否有「靈魂」。
這就是所謂的「品味」(Taste)。
因?yàn)闄C(jī)器沒(méi)有「生活」,所以它沒(méi)有「常識(shí)」,也就無(wú)從產(chǎn)生「品味」。
但冷靜下來(lái)想,Mark Chen自己比誰(shuí)都清楚,這條路遠(yuǎn)沒(méi)有鋪平。
第一個(gè)坑:評(píng)測(cè),崩了。
他用了一個(gè)內(nèi)部詞,叫「Benchmaxxing」(刷榜)——找一堆和測(cè)試集長(zhǎng)得幾乎一模一樣的題,往死里訓(xùn),分?jǐn)?shù)好看得不得了,泛化能力半點(diǎn)沒(méi)漲。
更糟的是,公認(rèn)的金標(biāo)準(zhǔn)benchmark數(shù)量太少。
「我們真的處在一場(chǎng)評(píng)測(cè)危機(jī)里。」他說(shuō),SAT那種經(jīng)典測(cè)試,對(duì)今天的模型全都飽和了。
甚至,一個(gè)評(píng)測(cè)一旦被公開(kāi)到世界上,它就已經(jīng)不是好評(píng)測(cè)了,就像一張印出來(lái)就立刻作廢的考卷。
![]()
應(yīng)對(duì)這一問(wèn)題的兩種策略:
1、將評(píng)估創(chuàng)建團(tuán)隊(duì)與模型優(yōu)化團(tuán)隊(duì)分離,形成一種對(duì)抗性激勵(lì)。
2、大規(guī)模部署模型并觀察實(shí)際應(yīng)用中的失敗模式。
![]()
他還指出,每一項(xiàng)新能力的出現(xiàn)都會(huì)伴隨著對(duì)應(yīng)的評(píng)估需求,而引導(dǎo)評(píng)估方向是他工作中相當(dāng)重要的一部分。
第二個(gè)坑:參差的前沿(jagged frontier)。
模型能拿下奧數(shù)、信奧級(jí)別的難題,卻可能搞不定人類(lèi)隨手就能做的瑣事,就一個(gè)能心算微積分、卻不會(huì)自己系鞋帶的天才。
![]()
差在哪?差在「上下文」,差在持續(xù)學(xué)習(xí)(continual learning)——把一個(gè)任務(wù)里學(xué)到的教訓(xùn),用到下一個(gè)任務(wù)上。
這對(duì)人太自然了,對(duì)模型,卻是全行業(yè)正在死磕的硬骨頭。
被問(wèn)到通往AGI是不是還需要兩三個(gè)根本性的突破,Mark沒(méi)接。
他說(shuō),持續(xù)學(xué)習(xí)這種東西是「必須解鎖的基礎(chǔ)能力」,至于算不算"突破"他說(shuō)不好,但「很多發(fā)都已經(jīng)瞄準(zhǔn)了球門(mén),我相當(dāng)確定它們會(huì)進(jìn)。」
這就是他的態(tài)度:坑是真的,每一個(gè)坑都已經(jīng)有人在填,而且他賭填得上。
湯的隱喻:在AGI之后去開(kāi)個(gè)面館
訪談中最溫馨的一幕,是關(guān)于「湯」的故事。
據(jù)說(shuō)Mark Zuckerberg曾試圖用自制的湯去挖走OpenAI的研究員,而Mark Chen的回應(yīng)則是:直接把湯帶到辦公室分給大家。
![]()
當(dāng)被問(wèn)到AGI實(shí)現(xiàn)后的終極愿望時(shí),這位掌管著全球最強(qiáng)大AI大腦的人,回答:
「我想去開(kāi)個(gè)面館。這可能是我的AGI后愛(ài)好。」
這個(gè)回答里藏著深意。
當(dāng)AI能夠完成所有「自我維持的科研」,當(dāng)所有的知識(shí)和創(chuàng)新都能以光速產(chǎn)生,人類(lèi)最稀缺的資源將不再是智力,而是「體驗(yàn)」。
機(jī)器可以算出一碗湯的最佳咸度,但它永遠(yuǎn)無(wú)法賦予這碗湯以「溫度」和「故事」。
參考資料:
https://www.youtube.com/watch?v=fpAthTtha8c
https://finance.biggo.com/podcast/1241bc21164ccc75
編輯:大衛(wèi)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.