![]()
機(jī)器之心編譯
他是教出 Andrew Ng、Yoshua Bengio 的那個(gè)人,他親歷了機(jī)器學(xué)習(xí)從無(wú)名到主宰世界的全過(guò)程。而現(xiàn)在,他說(shuō) —— 這場(chǎng)對(duì)話(huà)讓他最擔(dān)心的,是「思想領(lǐng)袖們」正在傷害年輕一代。
如果要評(píng)選過(guò)去半個(gè)世紀(jì)對(duì)人工智能影響最深的學(xué)者,Michael I. Jordan 幾乎無(wú)法被繞開(kāi)。
2016 年,《科學(xué)》雜志將他列為「全球最具影響力的計(jì)算機(jī)科學(xué)家」。他是統(tǒng)計(jì)機(jī)器學(xué)習(xí)領(lǐng)域的奠基人之一,在圖模型、變分推斷、貝葉斯非參數(shù)方法等核心方向上留下了大量引用極高的基礎(chǔ)性工作。他目前是加州大學(xué)伯克利分校電氣工程與計(jì)算機(jī)科學(xué)系、統(tǒng)計(jì)系雙聘的杰出教授,同時(shí)在法國(guó) Inria 巴黎分部任職研究員。
更廣為人知的,是他的學(xué)生名單。Andrew Ng(吳恩達(dá)),深度學(xué)習(xí)教育的全球推廣者;Yoshua Bengio,深度學(xué)習(xí)三巨頭之一、圖靈獎(jiǎng)得主;Zoubin Ghahramani,貝葉斯機(jī)器學(xué)習(xí)領(lǐng)軍人物;Eric Xing,MBZUAI 校長(zhǎng)、知名 AI 研究者;David Blei,主題模型 LDA 的核心發(fā)明人……Jordan 的門(mén)下,走出了一整代機(jī)器學(xué)習(xí)領(lǐng)域的重要建設(shè)者
這次接受采訪的節(jié)目是 MLST(Machine Learning Street Talk),主持人 Tim Scarfe 是一位長(zhǎng)期關(guān)注 AI 前沿的播客人。
視頻鏈接:https://www.youtube.com/watch?v=AREWYbVtX64&t=16s
訪談圍繞 Jordan 去年發(fā)布在 arXiv 上的論文《AI 的集體主義經(jīng)濟(jì)學(xué)視角》(A Collectivist, Economic Perspective on AI)展開(kāi),但談話(huà)的射程遠(yuǎn)不止于此 ——涉及 AGI 炒作、硅谷思維的缺陷、數(shù)據(jù)市場(chǎng)的經(jīng)濟(jì)設(shè)計(jì)、不確定性量化,以及他對(duì) Hinton 等「舊友們」轉(zhuǎn)型為末日預(yù)言家的真實(shí)看法
![]()
論文鏈接:https://arxiv.org/pdf/2507.06268
強(qiáng)化學(xué)習(xí)領(lǐng)域的奠基人 Richard Sutton 推薦了這個(gè)訪談,認(rèn)為 Jordan 帶來(lái)了一個(gè)有力而深思熟慮的視角。
![]()
以下是這場(chǎng)對(duì)話(huà)的主要內(nèi)容。
「AGI 只是個(gè)公關(guān)詞」:
我從來(lái)不認(rèn)為自己是 AI 研究者
訪談一開(kāi)場(chǎng),Jordan 便亮明了立場(chǎng),毫不拖泥帶水。
「AGI 對(duì)我來(lái)說(shuō)只是個(gè)公關(guān)詞。它是一種扭曲。它讓人困惑,尤其讓年輕人困惑。」
他解釋?zhuān)溉斯ぶ悄堋惯@個(gè)詞本身就有歷史包袱。1950 年代 John McCarthy 等人提出這個(gè)概念時(shí),背后有一套特定的方法論預(yù)設(shè) —— 邏輯推理、符號(hào)系統(tǒng)。那套路徑后來(lái)并沒(méi)有真正走通。真正在工業(yè)界產(chǎn)生巨大影響的,是在那之后幾十年里,從統(tǒng)計(jì)學(xué)、運(yùn)籌學(xué)等領(lǐng)域慢慢生長(zhǎng)出來(lái)的機(jī)器學(xué)習(xí)方法:決策樹(shù)、最近鄰、邏輯回歸、隱馬爾可夫模型…… 這些方法大多數(shù)壓根不是從「AI」這個(gè)圈子里發(fā)展出來(lái)的。
「亞馬遜的云計(jì)算,最初就是為了處理機(jī)器學(xué)習(xí)的工作負(fù)載而建的。供應(yīng)鏈、金融、交通運(yùn)輸系統(tǒng),都在大規(guī)模使用機(jī)器學(xué)習(xí),直到今天也是。這才是我成長(zhǎng)于其中的傳統(tǒng)。」
然后大約五年前,「AI」這個(gè)詞隨著大語(yǔ)言模型的興起卷土重來(lái)。原因很簡(jiǎn)單:這次模型的輸出是人類(lèi)讀得懂的流暢語(yǔ)言,而不再只是預(yù)測(cè)供應(yīng)鏈、商業(yè)、價(jià)格之類(lèi)的東西。人們看到這個(gè)就覺(jué)得:「天哪,我們解決了那個(gè)古老的 AI 問(wèn)題!」Jordan 說(shuō),如果把「AI 問(wèn)題」的定義窄化到圖靈測(cè)試,那勉強(qiáng)算是。但這不過(guò)是換了個(gè)輸出格式,背后的機(jī)器學(xué)習(xí)傳統(tǒng)一直都在。
「這種 AI 術(shù)語(yǔ)回歸,對(duì)研究路徑產(chǎn)生了扭曲效應(yīng),對(duì)我們?nèi)绾嗡伎忌虡I(yè)模式也產(chǎn)生了扭曲效應(yīng)。還不夠,他們還得再造一個(gè)更宏大的流行詞 ——AGI。」
他真正想批評(píng)的,不只是詞本身,而是這套詞背后的思維定勢(shì)。他說(shuō),那些自稱(chēng) AI 研究者的人,往往其實(shí)沒(méi)有一個(gè)清晰的目標(biāo)。他們的邏輯是:人類(lèi)是智能的,大腦是一臺(tái)計(jì)算機(jī),只要我們模仿它、放大它,好事就會(huì)自然發(fā)生 —— 然后就停在這里了。沒(méi)有「我們要解決社會(huì)上的什么具體問(wèn)題」,沒(méi)有「這對(duì)誰(shuí)有價(jià)值、以什么方式產(chǎn)生價(jià)值」,只有一個(gè)隱隱約約的「它會(huì)幫我們解決問(wèn)題,然后大家就幸福了」。
「這就是硅谷的談話(huà)方式。我離開(kāi)那里,部分原因就是我厭倦了這種談話(huà)。那里沒(méi)有什么深度的長(zhǎng)期思考。它變成了一場(chǎng)內(nèi)卷賽,一場(chǎng)金錢(qián)競(jìng)賽。」
Jordan 說(shuō),他從來(lái)沒(méi)有把自己當(dāng)作 AI 研究者,他也從來(lái)沒(méi)有讀過(guò)一本 AI 的書(shū)。他的訓(xùn)練背景是統(tǒng)計(jì)學(xué)家和認(rèn)知科學(xué)家。「但我樂(lè)于接受這個(gè)稱(chēng)謂,」他笑說(shuō)。
「我們是社會(huì)動(dòng)物」:
為什么 AI 需要經(jīng)濟(jì)學(xué)?
Jordan 提出這篇新論文的核心觀點(diǎn)時(shí),先反問(wèn)了一個(gè)問(wèn)題:當(dāng)前很多 AI 研究者真正想實(shí)現(xiàn)的目標(biāo),到底是什么?
在他看來(lái),今天相當(dāng)一部分 AI 敘事背后,仍然是一個(gè)非常舊的想法:人類(lèi)是智能的,大腦像一臺(tái)計(jì)算機(jī);只要我們模仿它、放大它、并行化它,它自然就會(huì)做出偉大的事情。問(wèn)題是,話(huà)往往就停在這里了。
它沒(méi)有進(jìn)一步回答:我們究竟要解決社會(huì)中的什么問(wèn)題?這項(xiàng)技術(shù)為誰(shuí)創(chuàng)造價(jià)值?成本由誰(shuí)承擔(dān)?收益又如何分配?它只是隱含著一種期待:技術(shù)會(huì)替我們解決問(wèn)題,然后人類(lèi)就會(huì)幸福。
在 Jordan 看來(lái),這不是嚴(yán)肅的工程思維,而是在用隱喻代替系統(tǒng)設(shè)計(jì)。
主持人隨后提出了一個(gè)典型的硅谷式反駁:如果像 Ilya Sutskever 這樣的硅谷 AI 領(lǐng)袖認(rèn)為,只要把 LLM 組織成多智能體系統(tǒng),經(jīng)濟(jì)學(xué)里的那些復(fù)雜性就會(huì)自然涌現(xiàn),Jordan 會(huì)怎么看?
Jordan 的回答毫不客氣:「這就好像 1940 年代的化學(xué)工程師說(shuō),我們把一堆東西扔在一起,讓它自己工作就好了。你確實(shí)可以這么做,但你會(huì)得到很多在經(jīng)濟(jì)上根本不可行的東西,還會(huì)傷害很多人。」
他認(rèn)為,這一代 AI 建設(shè)者缺少的,不是智力,也不是代碼能力,而是概念和思想的深度。他說(shuō),每一個(gè)上一個(gè)時(shí)代的工程學(xué)科 —— 電氣、化學(xué)、機(jī)械 —— 不光有能動(dòng)手的人,背后都有一套基礎(chǔ)方程支撐:麥克斯韋方程組,牛頓定律。「現(xiàn)在這個(gè)領(lǐng)域有什么?只有非常聰明、會(huì)編程、有很多直覺(jué)的人 —— 我從沒(méi)感受到任何真正智識(shí)深度的東西。感覺(jué)就像科幻小說(shuō)。
更讓他擔(dān)心的是,已經(jīng)有人被傷害了,但沒(méi)有人在談這件事。Facebook 損害了大量青少年的心理健康,這從來(lái)沒(méi)有被計(jì)算機(jī)科學(xué)家認(rèn)真討論過(guò)。現(xiàn)在又來(lái)了新一輪的「就業(yè)崗位可能會(huì)消失,但沒(méi)關(guān)系,新的會(huì)出來(lái),一直都是這樣」——「我不喜歡這種說(shuō)話(huà)方式。」
那么,Jordan 自己的框架是什么?他用了一個(gè)他反復(fù)強(qiáng)調(diào)的詞:集體主義(collectivist)
「當(dāng)前這些技術(shù),輸入來(lái)自數(shù)十億人,也將服務(wù)數(shù)十億人。所以它本來(lái)就是一個(gè)集體性的東西 —— 有一個(gè)集體在輸入,有一個(gè)集體在接受輸出。這背后其實(shí)有一張巨大的、潛在的網(wǎng)絡(luò)。」
主流 AI 思維的根本缺陷在于,始終把智能窄化為了個(gè)體認(rèn)知。把人類(lèi)大腦當(dāng)成模板,把神經(jīng)元和梯度下降當(dāng)成核心隱喻,卻忽略了一個(gè)最基本的事實(shí):人類(lèi)是社會(huì)動(dòng)物,我們大量的智識(shí)來(lái)自聚合 —— 聚合觀點(diǎn)、思想,形成文化,文化在時(shí)間上保存它們。
更重要的是,社會(huì)為我們的智識(shí)提供了語(yǔ)境。在這個(gè)語(yǔ)境里聰明的行動(dòng),換一個(gè)語(yǔ)境可能就是蠢的。智能本身高度情境化,也高度依賴(lài)當(dāng)下
所謂語(yǔ)境,就是外面可能有人正在試圖利用我,也可能有人想和我合作,而我并不真正知道對(duì)方的意圖。所以我必須試探,必須發(fā)出信號(hào),必須設(shè)計(jì)一些機(jī)制,讓我們能夠有效互動(dòng)。經(jīng)濟(jì)學(xué)正是以一種數(shù)學(xué)化的方式研究這些問(wèn)題。
這讓他得出結(jié)論:如果不引入經(jīng)濟(jì)學(xué)和社會(huì)科學(xué),我們就根本沒(méi)有在討論「完整的智能」。
他的框架最終落在三個(gè)頂點(diǎn)組成的三角形上:計(jì)算機(jī)科學(xué)(算法、抽象與模塊化)、統(tǒng)計(jì)學(xué)(推斷與不確定性量化)、經(jīng)濟(jì)學(xué)(激勵(lì)機(jī)制與博弈均衡)。
「計(jì)算思維教會(huì)你模塊化、抽象和 API—— 這是 Jeannette Wing 幾十年前就提出的洞見(jiàn),我完全認(rèn)同。但大量算法其實(shí)不是從計(jì)算機(jī)科學(xué)原則里來(lái)的,它們來(lái)自統(tǒng)計(jì)學(xué)的推斷思維:在不確定性下如何收集數(shù)據(jù)、如何做預(yù)測(cè)。再加上經(jīng)濟(jì)思維:周?chē)衅渌黧w,如何確保激勵(lì)機(jī)制是正確的。」
他說(shuō),只有計(jì)算加優(yōu)化,你就只能得到語(yǔ)言模型。把統(tǒng)計(jì)和經(jīng)濟(jì)思維加進(jìn)來(lái),你才開(kāi)始有一個(gè)完整的系統(tǒng)性思考框架。「我把這叫做這個(gè)時(shí)代的新文科核心。我的人文學(xué)科同事可能不同意 —— 但我認(rèn)為,人文學(xué)科目前還沒(méi)有觸及這個(gè)時(shí)代真正核心的智識(shí)問(wèn)題。」
「別問(wèn)它是否理解」:
停止人類(lèi)化機(jī)器
Jordan 在整個(gè)訪談里有一個(gè)反復(fù)出現(xiàn)的動(dòng)作:每當(dāng)對(duì)話(huà)滑向「AI 是否真正理解」「模型是否擁有某種內(nèi)在認(rèn)知」這類(lèi)問(wèn)題,他都會(huì)把問(wèn)題拉回到更具體的層面。
「我們根本不需要去問(wèn)這個(gè)問(wèn)題。」
他回憶起 2000 年前后第一次去亞馬遜時(shí)看到的景象。那時(shí),亞馬遜已經(jīng)在用大規(guī)模機(jī)器學(xué)習(xí)方法 —— 當(dāng)時(shí)叫隨機(jī)森林 —— 處理供應(yīng)鏈建模。系統(tǒng)能預(yù)測(cè)哪艘船會(huì)在印度洋延誤,某些零件會(huì)不會(huì)準(zhǔn)時(shí)到達(dá),整個(gè)供應(yīng)鏈每天把數(shù)十億件商品送到一億人手里。沒(méi)有任何人類(lèi)能理解那個(gè)大盒子里在發(fā)生什么。
「但這重要嗎?不重要。你要問(wèn)的不是它是否『理解』物流,而是:它能不能降低不確定性,能不能讓工程系統(tǒng)建立在它之上,能不能讓計(jì)劃成為可能。這才是你要問(wèn)的。」
他認(rèn)為,「理解」「智能」這些詞,是給媒體用的。媒體喜歡這些詞,因?yàn)樗鼈內(nèi)菀讉鞑ィ踩菀字圃煜胂蟆6切┌?AGI、AI 術(shù)語(yǔ)推出去的人,他們心里很清楚,在自己的研究工作里根本不需要這些詞 —— 他們只是知道媒體會(huì)接住。
「我們?cè)谧约旱难芯坷锔静辉诤酢豪斫狻贿@個(gè)詞是否成立。我們想做的是建造好的系統(tǒng)。」
主持人提到,他上周剛采訪了 AlphaFold 的核心研究者 John Jumper,問(wèn)對(duì)方 AlphaFold 是否在某種意義上「理解」蛋白質(zhì)。Jumper 的回答是:對(duì)這個(gè)詞過(guò)敏。他說(shuō)得很清楚 ——AlphaFold 讓我們能預(yù)測(cè),讓我們能控制,但理解這個(gè)動(dòng)作必須由人類(lèi)自己來(lái)做,不能外包給機(jī)器。
這正中 Jordan 的觀點(diǎn)。「為什么要說(shuō)它理解?說(shuō)它預(yù)測(cè)、它降低不確定性、它讓實(shí)驗(yàn)成為可能 —— 這些已經(jīng)足夠驚人了。非得加上『理解』這個(gè)詞,只會(huì)招來(lái)錯(cuò)誤的期待,然后招來(lái)錯(cuò)誤的失望。」
他認(rèn)為,「人類(lèi)化」機(jī)器這件事之所以有害,不只是因?yàn)椴粶?zhǔn)確,更因?yàn)樗鼤?huì)系統(tǒng)性地轉(zhuǎn)移注意力。一旦你開(kāi)始問(wèn)「它是否理解」,就很容易忘記真正重要的工程問(wèn)題:它在什么條件下會(huì)失效?它在哪些問(wèn)題上最不可靠?它有沒(méi)有給出誤差范圍?它如何與真實(shí)數(shù)據(jù)結(jié)合?它應(yīng)該被嵌入什么樣的系統(tǒng)?又該由誰(shuí)來(lái)承擔(dān)它出錯(cuò)的后果?
這些問(wèn)題,才是真正決定 AI 能否進(jìn)入現(xiàn)實(shí)世界的關(guān)鍵。
「那是媒體的問(wèn)題,不是研究者的問(wèn)題,我們不需要那個(gè)詞。」
基礎(chǔ)模型最危險(xiǎn)的地方
恰恰是科學(xué)家最需要它的地方
Jordan 說(shuō)他很欽佩 AlphaFold。他明確區(qū)分:AlphaFold 不像 LLM,它是針對(duì)一組特定問(wèn)題設(shè)計(jì)的,并且在這些問(wèn)題上做得極好。但他和團(tuán)隊(duì)做過(guò)一項(xiàng)分析,發(fā)現(xiàn)了一個(gè)讓他真正擔(dān)憂(yōu)的盲點(diǎn)。
他們想研究一個(gè)假設(shè):蛋白質(zhì)中的量子漲落,是否與磷酸化存在關(guān)聯(lián)。也就是說(shuō),那些結(jié)構(gòu)上看起來(lái)「有點(diǎn)問(wèn)題」的蛋白質(zhì),是否反而在細(xì)胞里更活躍?這是一個(gè) 2×2 的統(tǒng)計(jì)檢驗(yàn):磷酸化(是 / 否)× 量子漲落(有 / 無(wú))。
用傳統(tǒng)的已知晶體結(jié)構(gòu)數(shù)據(jù)來(lái)做這個(gè)檢驗(yàn),樣本量太小,根本沒(méi)有足夠的統(tǒng)計(jì)功效去拒絕原假設(shè)。換成 AlphaFold 預(yù)測(cè)的兩億個(gè)蛋白質(zhì)結(jié)構(gòu),功效大幅提升,原假設(shè)被拒絕了 —— 看起來(lái)是好事。
「但我們發(fā)現(xiàn),那個(gè)統(tǒng)計(jì)量的置信區(qū)間極其狹窄,而且整個(gè)區(qū)間都偏離了真實(shí)值很遠(yuǎn)。不只是在這一個(gè)問(wèn)題上 —— 我們?cè)谝粋€(gè)領(lǐng)域接一個(gè)領(lǐng)域地發(fā)現(xiàn)了同樣的現(xiàn)象。」
原因并不難理解:AlphaFold 的訓(xùn)練集里,含有量子漲落特征的蛋白質(zhì)本來(lái)就很少,因?yàn)檫@個(gè)方向過(guò)去研究得不多,而且晶體化本身很難。訓(xùn)練數(shù)據(jù)稀少,就意味著 AlphaFold 在這個(gè)具體問(wèn)題上的預(yù)測(cè)可能高度偏倚 —— 但它不告訴你這一點(diǎn)。它照樣給出答案,照樣看起來(lái)很有把握,但置信區(qū)間很窄,答案并沒(méi)有真正覆蓋真實(shí)值。
這才是真正讓人不安的地方:不是模型答錯(cuò)了,而是模型答錯(cuò)了卻不說(shuō)
Jordan 的團(tuán)隊(duì)為此開(kāi)發(fā)了一種叫做「預(yù)測(cè)驅(qū)動(dòng)推斷」的方法 —— 把少量真實(shí)標(biāo)注數(shù)據(jù)和大量 AlphaFold 預(yù)測(cè)數(shù)據(jù)混合使用,讓置信區(qū)間在保持足夠窄的同時(shí)重新覆蓋真實(shí)值。技術(shù)上可行,AlphaFold 團(tuán)隊(duì)聽(tīng)到也不會(huì)覺(jué)得奇怪。
但他真正想說(shuō)的,不是這個(gè)技術(shù)修復(fù)。他想說(shuō)的是一個(gè)更根本的模式:
「科學(xué)家感興趣的永遠(yuǎn)是知識(shí)邊界上的新問(wèn)題,不是把過(guò)去已知的事情再研究一遍。而基礎(chǔ)模型恰恰在知識(shí)邊界上表現(xiàn)最差、偏倚最大 —— 因?yàn)槟抢镉?xùn)練數(shù)據(jù)最稀少。」
這個(gè)矛盾不會(huì)隨著數(shù)據(jù)增多自動(dòng)消失。數(shù)據(jù)增多只會(huì)讓模型在已知領(lǐng)域做得更好,但科學(xué)家問(wèn)的下一個(gè)問(wèn)題,依然會(huì)是在未知的邊緣。「你可以修補(bǔ),它會(huì)越來(lái)越好,但下一個(gè)新問(wèn)題來(lái)了,同樣的事情會(huì)再發(fā)生一次。」
他批評(píng)了兩種常見(jiàn)的錯(cuò)誤反應(yīng):一種是相信「偏差會(huì)隨著數(shù)據(jù)增多而消失」,另一種是只批評(píng)架構(gòu)、批評(píng)輸出,卻沒(méi)有任何可以推進(jìn)的科學(xué)方法。「那些人在說(shuō)什么?他們?cè)谂u(píng),但沒(méi)有給出出路。」
正確的方向,是在任何基礎(chǔ)模型周?chē)冀⑵鹗占倭空鎸?shí)數(shù)據(jù)、融合進(jìn)來(lái)、給出可信答案的能力。「這不是科幻小說(shuō)。這是現(xiàn)在就可以做、而且真的需要做的事。」
超級(jí)智能與人類(lèi)滅絕
不是僅有的兩個(gè)選項(xiàng)
這是訪談里 Jordan 情緒最外露的部分。
他被問(wèn)到怎么看 Geoffrey Hinton、Stuart Russell 等人描繪的圖景 ——AI 正在遞歸自我改進(jìn),它是有主體性的,它不是一種文化技術(shù),它是一個(gè)獨(dú)立存在的東西。
Jordan 停頓了一下,然后說(shuō):「那是科幻小說(shuō)。」
他補(bǔ)充:科幻對(duì)社會(huì)很重要,他不是在貶低它。但問(wèn)題在于規(guī)模和音量 —— 當(dāng)這些聲音以那樣的量級(jí)被推出去,當(dāng)它們占據(jù)了播客、論壇、公眾視野里所有關(guān)于 AI 的嚴(yán)肅討論,它真的在傷害 20 歲和 25 歲的年輕人。
他說(shuō),這些年輕人對(duì)技術(shù)充滿(mǎn)熱情。他們想用它幫助自己的家人 —— 說(shuō)實(shí)話(huà),比幫助國(guó)家更想幫助家人。他們看到了真實(shí)的機(jī)會(huì)。然后他們聽(tīng)到了什么?
「那些領(lǐng)袖們說(shuō):我們已經(jīng)玩夠了。我們搞出了一堆算法,做出了這些東西。但你們不能做這個(gè),因?yàn)樘kU(xiǎn)了 —— 它會(huì)以很高的概率消滅人類(lèi)。或者:超級(jí)智能馬上就來(lái)了,反正在你們有生之年也沒(méi)什么事情可做了。」
「這太令人沮喪了。太令人沮喪了。」
他說(shuō),讓他最不安的,不只是這種敘事本身,而是這種敘事背后經(jīng)濟(jì)思考的完全缺席。這些聲音里,有零分的經(jīng)濟(jì)學(xué)。全是認(rèn)知科學(xué)思維或神經(jīng)科學(xué)思維:我們弄清楚了大腦,梯度下降加分布式神經(jīng)元,LLM 能工作這么好本身就證明我們弄對(duì)了。
Jordan 對(duì)此的回答很干脆:你去問(wèn)神經(jīng)科學(xué)家,LLM 和大腦有沒(méi)有關(guān)系,他們會(huì)說(shuō),那是一個(gè)好用的比喻,是一個(gè)卡通圖,僅此而已。「梯度下降在大規(guī)模上有效嗎?是的,遠(yuǎn)超所有人的預(yù)期。但它在暴露自己的弱點(diǎn),而那些弱點(diǎn)是真實(shí)的。」
他更擔(dān)心的,是勞動(dòng)與資本的關(guān)系,而不是機(jī)器決定接管人類(lèi)。「我沒(méi)有看到任何跡象表明梯度下降會(huì)像病毒一樣失控。那是隱喻,不是預(yù)測(cè)。」
然后是他最想對(duì)年輕人說(shuō)的話(huà):
「超級(jí)智能與人類(lèi)滅絕,那不是僅有的兩個(gè)選項(xiàng)。在那兩個(gè)極端之間,有無(wú)數(shù)非常積極的事情可以在人類(lèi)的尺度上完成。」
他說(shuō),現(xiàn)在的問(wèn)題是年輕人缺少榜樣 ——缺少那種「靠做出真正有用的東西賺到錢(qián)、同時(shí)讓世界變好一點(diǎn)點(diǎn)」的人。上一代有疫苗,有那些看得見(jiàn)摸得著的東西。「現(xiàn)在呢?不太好。」
他最后對(duì)整個(gè)公共對(duì)話(huà)的判斷是:「這種思想領(lǐng)袖分成兩隊(duì),一隊(duì)沖向?yàn)跬邪睿魂?duì)沖向末日 —— 在人類(lèi)歷史上,這種程度的現(xiàn)實(shí)脫節(jié)是非常罕見(jiàn)的。
當(dāng)你問(wèn) LLM「你確定嗎」
它其實(shí)不知道
Jordan 認(rèn)為,LLM 最根本的問(wèn)題之一,是它對(duì)自身的不確定性一無(wú)所知
問(wèn)一個(gè)語(yǔ)言模型「你有多確定這個(gè)答案」,你得到的回答往往極端,要么極度自信,要么極度不確定,中間幾乎沒(méi)有梯度。Jordan 說(shuō),這不是在不確定性下推斷,這是在模仿關(guān)于不確定性的語(yǔ)氣。模型在訓(xùn)練數(shù)據(jù)里找到了人類(lèi)在互聯(lián)網(wǎng)上回答「你確定嗎」的模式,然后復(fù)現(xiàn)那個(gè)模式。
他認(rèn)為,「不確定性」本身被大多數(shù)人理解得太窄了。他把它分成三種完全不同的東西,需要完全不同的處理方式。
第一種是采樣不確定性。這是經(jīng)典統(tǒng)計(jì)學(xué)的領(lǐng)地:我觀察到的數(shù)據(jù),是不是足以支撐這個(gè)結(jié)論?但他用一個(gè)鴨子的比喻說(shuō)明,即使是這種最基礎(chǔ)的不確定性,一旦放進(jìn)社會(huì)語(yǔ)境就會(huì)變形。
假設(shè)有一只統(tǒng)計(jì)學(xué)家鴨子,它發(fā)現(xiàn)湖的左邊比右邊有兩倍的谷粒,也就是 2:1。一個(gè)純粹做最大期望效用計(jì)算的貝葉斯鴨子,會(huì)每次都去左邊。但真實(shí)的鴨子不是這樣。它們大概會(huì)有 2/3 去左邊,1/3 去右邊,恰好對(duì)應(yīng)那個(gè)比例本身。
這不只是對(duì)沖。Jordan 說(shuō),這是一個(gè)納什均衡:如果所有鴨子都去同一側(cè),另一側(cè)的資源就浪費(fèi)了。鴨子是在種群語(yǔ)境下進(jìn)化出來(lái)的,它的「不確定性處理策略」本來(lái)就是為整個(gè)種群優(yōu)化的,不只是為個(gè)體。「正確地使用不確定性,意味著把它放在種群的語(yǔ)境里。」
第二種是信息不對(duì)稱(chēng)。你雇了一個(gè)專(zhuān)家,他知道你不知道的事,而且他知道的那些,他不會(huì)全部告訴你。這不是采樣誤差,這是一種結(jié)構(gòu)性的、永遠(yuǎn)不會(huì)消失的不透明。經(jīng)濟(jì)學(xué)長(zhǎng)期研究這個(gè)問(wèn)題,比如合同理論、激勵(lì)相容設(shè)計(jì)都是在問(wèn):如何在信息永遠(yuǎn)不對(duì)稱(chēng)的情況下,讓系統(tǒng)還是能運(yùn)轉(zhuǎn)起來(lái)。
第三種他叫做「數(shù)據(jù)的時(shí)效性」(providence)。你在做手術(shù)決策,醫(yī)生給你看統(tǒng)計(jì)數(shù)據(jù),某種手術(shù)方案的存活率是多少。然后醫(yī)生補(bǔ)了一句:那些數(shù)據(jù)是十年前收集的。你的不確定性應(yīng)該立刻增加。但經(jīng)典統(tǒng)計(jì)學(xué)不處理這個(gè) —— 數(shù)據(jù)就是數(shù)據(jù),它不會(huì)自動(dòng)因?yàn)槔吓f而打折扣。「在一個(gè)真正的系統(tǒng)里,所有流動(dòng)的數(shù)據(jù)都應(yīng)該帶著元數(shù)據(jù) —— 它是什么時(shí)候的,這個(gè)元數(shù)據(jù)應(yīng)該被定量地納入不確定性計(jì)算。我們現(xiàn)在完全沒(méi)有做這件事。」
人類(lèi)其實(shí)很擅長(zhǎng)把這三種不確定性混在一起處理,幾乎是無(wú)縫的。你會(huì)說(shuō)「那是老數(shù)據(jù),我打折」,你會(huì)說(shuō)「周?chē)衅渌耍也荒苤粌?yōu)化自己」,你會(huì)說(shuō)「他的動(dòng)機(jī)我摸不準(zhǔn),我留一手」。而且你會(huì)在社會(huì)語(yǔ)境里主動(dòng)尋找信息:如果不認(rèn)識(shí)路,就去找一個(gè)看起來(lái)是本地人的人問(wèn)。
「可憐的 LLM,上面這三件事一件都不會(huì)做。它說(shuō)自己很確定,是因?yàn)榛ヂ?lián)網(wǎng)上有人在回答相似問(wèn)題時(shí)說(shuō)『我很確定』,然后它學(xué)了那個(gè)語(yǔ)氣。」
他最后用了一個(gè)他很喜歡的類(lèi)比來(lái)說(shuō)明市場(chǎng)如何處理更大尺度的不確定性。
「如果我想開(kāi)一家比薩店,我需要番茄。如果我每天都要自己去尋覓番茄,那今晚有沒(méi)有比薩是高度不確定的。但因?yàn)榇嬖谝粋€(gè)市場(chǎng),有人替我做了尋覓這件事,每天都有穩(wěn)定的番茄供應(yīng),我的不確定性就消失了,我就可以在這個(gè)基礎(chǔ)上建立更復(fù)雜的東西。」
市場(chǎng)不是因?yàn)橛腥嗽O(shè)計(jì)了最優(yōu)實(shí)驗(yàn)、做了多臂老虎機(jī),它只是因?yàn)橛屑?lì)讓人去探索和利用,不確定性就在整個(gè)系統(tǒng)的層面上被消化了。「這才是真正大尺度的不確定性消解,不是誤差棒。」
結(jié)語(yǔ):
AI 是為了讓人類(lèi)做到本來(lái)想做的正確事情
訪談快結(jié)束時(shí),Jordan 給出了他對(duì) AI 本質(zhì)最清晰的一次表述。
主持人問(wèn):現(xiàn)在那些擔(dān)憂(yōu)派和樂(lè)觀派之間,有沒(méi)有什么東西能讓雙方更新看法?
Jordan 沒(méi)有直接回答這個(gè)問(wèn)題。他說(shuō),他對(duì) AI 本身是正面的,是樂(lè)觀的,只是不是那種烏托邦式的樂(lè)觀。
他用飛機(jī)做了類(lèi)比。他小時(shí)候,空難很常見(jiàn)。今天,在如此大的規(guī)模下,商業(yè)航空的事故率極低,這是因?yàn)樽詣?dòng)駕駛儀。飛機(jī)大部分時(shí)間由自動(dòng)化系統(tǒng)控制,人類(lèi)飛行員在需要時(shí)介入。這種人機(jī)協(xié)同,是目前已知最有效的方式。
「人類(lèi)不是進(jìn)化來(lái)駕駛這個(gè)大鐵鳥(niǎo)的,所以你可以在這里改進(jìn)人類(lèi)的能力。把兩者合在一起,你就得到了對(duì)所有人都有益的東西。」
他對(duì)比了自動(dòng)駕駛汽車(chē)的思路。三維空間里有很多余地,但二維平面上你有幾萬(wàn)輛車(chē),每年每個(gè)國(guó)家?guī)兹f(wàn)人死亡。解決方案不是把超級(jí)智能放進(jìn)駕駛座。「那是一種非常愚蠢的思考技術(shù)的方式。你必須從系統(tǒng)層面來(lái)想這個(gè)問(wèn)題。」
然后他給出了他對(duì) AI 真正功能的定義:
「AI 是關(guān)于幫助那些對(duì)人類(lèi)來(lái)說(shuō)太難的事情,幫助信息流動(dòng),讓人類(lèi)在當(dāng)下能夠做出大多數(shù)人真正想做出的正確決策,而不是因?yàn)樾畔⒉蛔悖黄茸龀鏊麄兒ε虏坏貌蛔龅腻e(cuò)誤決策。」
他說(shuō),人類(lèi)是美好的,但也是不完美的。我們傷害彼此,往往不是因?yàn)閻阂猓且驗(yàn)檎`解對(duì)方的意圖。有多少戰(zhàn)爭(zhēng),是因?yàn)橐环讲涣私饬硪环秸嬲胍裁矗拖葎?dòng)手了?「博弈論的出現(xiàn),是為了幫助人類(lèi)更清晰地處理這種情況,但我們還非常粗糙,非常初步。」
AI 真正的機(jī)會(huì),他認(rèn)為,是在 70 億人的尺度上,幫人類(lèi)修補(bǔ)那些進(jìn)化沒(méi)有完成的部分。「進(jìn)化也許沒(méi)有為 70 億人的規(guī)模做好準(zhǔn)備。」
所以,他真正擔(dān)心的不是 AI 本身,而是今天那場(chǎng)被兩極化帶偏的公共討論。一邊是有錢(qián)、只想著建造的人,另一邊是高喊「這會(huì)毀滅人類(lèi)」卻沒(méi)有任何建設(shè)性的人。
「這兩邊都不是在認(rèn)真思考,而在它們之間,有那么多真實(shí)的、美好的、可以做的事情。」
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.