網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

「機(jī)器學(xué)習(xí)之父」Jordan：Hinton等思想領(lǐng)袖們正在傷害年輕一代

2026-06-22 09:46:00　來(lái)源: 機(jī)器之心Pro

河北舉報(bào)

分享至

機(jī)器之心編譯

他是教出 Andrew Ng、Yoshua Bengio 的那個(gè)人，他親歷了機(jī)器學(xué)習(xí)從無(wú)名到主宰世界的全過(guò)程。而現(xiàn)在，他說(shuō) —— 這場(chǎng)對(duì)話(huà)讓他最擔(dān)心的，是「思想領(lǐng)袖們」正在傷害年輕一代。

如果要評(píng)選過(guò)去半個(gè)世紀(jì)對(duì)人工智能影響最深的學(xué)者，Michael I. Jordan 幾乎無(wú)法被繞開(kāi)。

2016 年，《科學(xué)》雜志將他列為「全球最具影響力的計(jì)算機(jī)科學(xué)家」。他是統(tǒng)計(jì)機(jī)器學(xué)習(xí)領(lǐng)域的奠基人之一，在圖模型、變分推斷、貝葉斯非參數(shù)方法等核心方向上留下了大量引用極高的基礎(chǔ)性工作。他目前是加州大學(xué)伯克利分校電氣工程與計(jì)算機(jī)科學(xué)系、統(tǒng)計(jì)系雙聘的杰出教授，同時(shí)在法國(guó) Inria 巴黎分部任職研究員。

更廣為人知的，是他的學(xué)生名單。Andrew Ng（吳恩達(dá)），深度學(xué)習(xí)教育的全球推廣者；Yoshua Bengio，深度學(xué)習(xí)三巨頭之一、圖靈獎(jiǎng)得主；Zoubin Ghahramani，貝葉斯機(jī)器學(xué)習(xí)領(lǐng)軍人物；Eric Xing，MBZUAI 校長(zhǎng)、知名 AI 研究者；David Blei，主題模型 LDA 的核心發(fā)明人……Jordan 的門(mén)下，走出了一整代機(jī)器學(xué)習(xí)領(lǐng)域的重要建設(shè)者

這次接受采訪的節(jié)目是 MLST（Machine Learning Street Talk），主持人 Tim Scarfe 是一位長(zhǎng)期關(guān)注 AI 前沿的播客人。

視頻鏈接：https://www.youtube.com/watch?v=AREWYbVtX64&t=16s

訪談圍繞 Jordan 去年發(fā)布在 arXiv 上的論文《AI 的集體主義經(jīng)濟(jì)學(xué)視角》（A Collectivist, Economic Perspective on AI）展開(kāi)，但談話(huà)的射程遠(yuǎn)不止于此 ——涉及 AGI 炒作、硅谷思維的缺陷、數(shù)據(jù)市場(chǎng)的經(jīng)濟(jì)設(shè)計(jì)、不確定性量化，以及他對(duì) Hinton 等「舊友們」轉(zhuǎn)型為末日預(yù)言家的真實(shí)看法

論文鏈接：https://arxiv.org/pdf/2507.06268

強(qiáng)化學(xué)習(xí)領(lǐng)域的奠基人 Richard Sutton 推薦了這個(gè)訪談，認(rèn)為 Jordan 帶來(lái)了一個(gè)有力而深思熟慮的視角。

以下是這場(chǎng)對(duì)話(huà)的主要內(nèi)容。

「AGI 只是個(gè)公關(guān)詞」：

我從來(lái)不認(rèn)為自己是 AI 研究者

訪談一開(kāi)場(chǎng)，Jordan 便亮明了立場(chǎng)，毫不拖泥帶水。

「AGI 對(duì)我來(lái)說(shuō)只是個(gè)公關(guān)詞。它是一種扭曲。它讓人困惑，尤其讓年輕人困惑。」

他解釋?zhuān)溉斯ぶ悄堋惯@個(gè)詞本身就有歷史包袱。1950 年代 John McCarthy 等人提出這個(gè)概念時(shí)，背后有一套特定的方法論預(yù)設(shè) —— 邏輯推理、符號(hào)系統(tǒng)。那套路徑后來(lái)并沒(méi)有真正走通。真正在工業(yè)界產(chǎn)生巨大影響的，是在那之后幾十年里，從統(tǒng)計(jì)學(xué)、運(yùn)籌學(xué)等領(lǐng)域慢慢生長(zhǎng)出來(lái)的機(jī)器學(xué)習(xí)方法：決策樹(shù)、最近鄰、邏輯回歸、隱馬爾可夫模型…… 這些方法大多數(shù)壓根不是從「AI」這個(gè)圈子里發(fā)展出來(lái)的。

「亞馬遜的云計(jì)算，最初就是為了處理機(jī)器學(xué)習(xí)的工作負(fù)載而建的。供應(yīng)鏈、金融、交通運(yùn)輸系統(tǒng)，都在大規(guī)模使用機(jī)器學(xué)習(xí)，直到今天也是。這才是我成長(zhǎng)于其中的傳統(tǒng)。」

然后大約五年前，「AI」這個(gè)詞隨著大語(yǔ)言模型的興起卷土重來(lái)。原因很簡(jiǎn)單：這次模型的輸出是人類(lèi)讀得懂的流暢語(yǔ)言，而不再只是預(yù)測(cè)供應(yīng)鏈、商業(yè)、價(jià)格之類(lèi)的東西。人們看到這個(gè)就覺(jué)得：「天哪，我們解決了那個(gè)古老的 AI 問(wèn)題！」Jordan 說(shuō)，如果把「AI 問(wèn)題」的定義窄化到圖靈測(cè)試，那勉強(qiáng)算是。但這不過(guò)是換了個(gè)輸出格式，背后的機(jī)器學(xué)習(xí)傳統(tǒng)一直都在。

「這種 AI 術(shù)語(yǔ)回歸，對(duì)研究路徑產(chǎn)生了扭曲效應(yīng)，對(duì)我們?nèi)绾嗡伎忌虡I(yè)模式也產(chǎn)生了扭曲效應(yīng)。還不夠，他們還得再造一個(gè)更宏大的流行詞 ——AGI。」

他真正想批評(píng)的，不只是詞本身，而是這套詞背后的思維定勢(shì)。他說(shuō)，那些自稱(chēng) AI 研究者的人，往往其實(shí)沒(méi)有一個(gè)清晰的目標(biāo)。他們的邏輯是：人類(lèi)是智能的，大腦是一臺(tái)計(jì)算機(jī)，只要我們模仿它、放大它，好事就會(huì)自然發(fā)生 —— 然后就停在這里了。沒(méi)有「我們要解決社會(huì)上的什么具體問(wèn)題」，沒(méi)有「這對(duì)誰(shuí)有價(jià)值、以什么方式產(chǎn)生價(jià)值」，只有一個(gè)隱隱約約的「它會(huì)幫我們解決問(wèn)題，然后大家就幸福了」。

「這就是硅谷的談話(huà)方式。我離開(kāi)那里，部分原因就是我厭倦了這種談話(huà)。那里沒(méi)有什么深度的長(zhǎng)期思考。它變成了一場(chǎng)內(nèi)卷賽，一場(chǎng)金錢(qián)競(jìng)賽。」

Jordan 說(shuō)，他從來(lái)沒(méi)有把自己當(dāng)作 AI 研究者，他也從來(lái)沒(méi)有讀過(guò)一本 AI 的書(shū)。他的訓(xùn)練背景是統(tǒng)計(jì)學(xué)家和認(rèn)知科學(xué)家。「但我樂(lè)于接受這個(gè)稱(chēng)謂，」他笑說(shuō)。

「我們是社會(huì)動(dòng)物」：

為什么 AI 需要經(jīng)濟(jì)學(xué)？

Jordan 提出這篇新論文的核心觀點(diǎn)時(shí)，先反問(wèn)了一個(gè)問(wèn)題：當(dāng)前很多 AI 研究者真正想實(shí)現(xiàn)的目標(biāo)，到底是什么？

在他看來(lái)，今天相當(dāng)一部分 AI 敘事背后，仍然是一個(gè)非常舊的想法：人類(lèi)是智能的，大腦像一臺(tái)計(jì)算機(jī)；只要我們模仿它、放大它、并行化它，它自然就會(huì)做出偉大的事情。問(wèn)題是，話(huà)往往就停在這里了。

它沒(méi)有進(jìn)一步回答：我們究竟要解決社會(huì)中的什么問(wèn)題？這項(xiàng)技術(shù)為誰(shuí)創(chuàng)造價(jià)值？成本由誰(shuí)承擔(dān)？收益又如何分配？它只是隱含著一種期待：技術(shù)會(huì)替我們解決問(wèn)題，然后人類(lèi)就會(huì)幸福。

在 Jordan 看來(lái)，這不是嚴(yán)肅的工程思維，而是在用隱喻代替系統(tǒng)設(shè)計(jì)。

主持人隨后提出了一個(gè)典型的硅谷式反駁：如果像 Ilya Sutskever 這樣的硅谷 AI 領(lǐng)袖認(rèn)為，只要把 LLM 組織成多智能體系統(tǒng)，經(jīng)濟(jì)學(xué)里的那些復(fù)雜性就會(huì)自然涌現(xiàn)，Jordan 會(huì)怎么看？

Jordan 的回答毫不客氣：「這就好像 1940 年代的化學(xué)工程師說(shuō)，我們把一堆東西扔在一起，讓它自己工作就好了。你確實(shí)可以這么做，但你會(huì)得到很多在經(jīng)濟(jì)上根本不可行的東西，還會(huì)傷害很多人。」

他認(rèn)為，這一代 AI 建設(shè)者缺少的，不是智力，也不是代碼能力，而是概念和思想的深度。他說(shuō)，每一個(gè)上一個(gè)時(shí)代的工程學(xué)科 —— 電氣、化學(xué)、機(jī)械 —— 不光有能動(dòng)手的人，背后都有一套基礎(chǔ)方程支撐：麥克斯韋方程組，牛頓定律。「現(xiàn)在這個(gè)領(lǐng)域有什么？只有非常聰明、會(huì)編程、有很多直覺(jué)的人 —— 我從沒(méi)感受到任何真正智識(shí)深度的東西。感覺(jué)就像科幻小說(shuō)。

更讓他擔(dān)心的是，已經(jīng)有人被傷害了，但沒(méi)有人在談這件事。Facebook 損害了大量青少年的心理健康，這從來(lái)沒(méi)有被計(jì)算機(jī)科學(xué)家認(rèn)真討論過(guò)。現(xiàn)在又來(lái)了新一輪的「就業(yè)崗位可能會(huì)消失，但沒(méi)關(guān)系，新的會(huì)出來(lái)，一直都是這樣」——「我不喜歡這種說(shuō)話(huà)方式。」

那么，Jordan 自己的框架是什么？他用了一個(gè)他反復(fù)強(qiáng)調(diào)的詞：集體主義（collectivist）

「當(dāng)前這些技術(shù)，輸入來(lái)自數(shù)十億人，也將服務(wù)數(shù)十億人。所以它本來(lái)就是一個(gè)集體性的東西 —— 有一個(gè)集體在輸入，有一個(gè)集體在接受輸出。這背后其實(shí)有一張巨大的、潛在的網(wǎng)絡(luò)。」

主流 AI 思維的根本缺陷在于，始終把智能窄化為了個(gè)體認(rèn)知。把人類(lèi)大腦當(dāng)成模板，把神經(jīng)元和梯度下降當(dāng)成核心隱喻，卻忽略了一個(gè)最基本的事實(shí)：人類(lèi)是社會(huì)動(dòng)物，我們大量的智識(shí)來(lái)自聚合 —— 聚合觀點(diǎn)、思想，形成文化，文化在時(shí)間上保存它們。

更重要的是，社會(huì)為我們的智識(shí)提供了語(yǔ)境。在這個(gè)語(yǔ)境里聰明的行動(dòng)，換一個(gè)語(yǔ)境可能就是蠢的。智能本身高度情境化，也高度依賴(lài)當(dāng)下

所謂語(yǔ)境，就是外面可能有人正在試圖利用我，也可能有人想和我合作，而我并不真正知道對(duì)方的意圖。所以我必須試探，必須發(fā)出信號(hào)，必須設(shè)計(jì)一些機(jī)制，讓我們能夠有效互動(dòng)。經(jīng)濟(jì)學(xué)正是以一種數(shù)學(xué)化的方式研究這些問(wèn)題。

這讓他得出結(jié)論：如果不引入經(jīng)濟(jì)學(xué)和社會(huì)科學(xué)，我們就根本沒(méi)有在討論「完整的智能」。

他的框架最終落在三個(gè)頂點(diǎn)組成的三角形上：計(jì)算機(jī)科學(xué)（算法、抽象與模塊化）、統(tǒng)計(jì)學(xué)（推斷與不確定性量化）、經(jīng)濟(jì)學(xué)（激勵(lì)機(jī)制與博弈均衡）。

「計(jì)算思維教會(huì)你模塊化、抽象和 API—— 這是 Jeannette Wing 幾十年前就提出的洞見(jiàn)，我完全認(rèn)同。但大量算法其實(shí)不是從計(jì)算機(jī)科學(xué)原則里來(lái)的，它們來(lái)自統(tǒng)計(jì)學(xué)的推斷思維：在不確定性下如何收集數(shù)據(jù)、如何做預(yù)測(cè)。再加上經(jīng)濟(jì)思維：周?chē)衅渌黧w，如何確保激勵(lì)機(jī)制是正確的。」

他說(shuō)，只有計(jì)算加優(yōu)化，你就只能得到語(yǔ)言模型。把統(tǒng)計(jì)和經(jīng)濟(jì)思維加進(jìn)來(lái)，你才開(kāi)始有一個(gè)完整的系統(tǒng)性思考框架。「我把這叫做這個(gè)時(shí)代的新文科核心。我的人文學(xué)科同事可能不同意 —— 但我認(rèn)為，人文學(xué)科目前還沒(méi)有觸及這個(gè)時(shí)代真正核心的智識(shí)問(wèn)題。」

「別問(wèn)它是否理解」：

停止人類(lèi)化機(jī)器

Jordan 在整個(gè)訪談里有一個(gè)反復(fù)出現(xiàn)的動(dòng)作：每當(dāng)對(duì)話(huà)滑向「AI 是否真正理解」「模型是否擁有某種內(nèi)在認(rèn)知」這類(lèi)問(wèn)題，他都會(huì)把問(wèn)題拉回到更具體的層面。

「我們根本不需要去問(wèn)這個(gè)問(wèn)題。」

他回憶起 2000 年前后第一次去亞馬遜時(shí)看到的景象。那時(shí)，亞馬遜已經(jīng)在用大規(guī)模機(jī)器學(xué)習(xí)方法 —— 當(dāng)時(shí)叫隨機(jī)森林 —— 處理供應(yīng)鏈建模。系統(tǒng)能預(yù)測(cè)哪艘船會(huì)在印度洋延誤，某些零件會(huì)不會(huì)準(zhǔn)時(shí)到達(dá)，整個(gè)供應(yīng)鏈每天把數(shù)十億件商品送到一億人手里。沒(méi)有任何人類(lèi)能理解那個(gè)大盒子里在發(fā)生什么。

「但這重要嗎？不重要。你要問(wèn)的不是它是否『理解』物流，而是：它能不能降低不確定性，能不能讓工程系統(tǒng)建立在它之上，能不能讓計(jì)劃成為可能。這才是你要問(wèn)的。」

他認(rèn)為，「理解」「智能」這些詞，是給媒體用的。媒體喜歡這些詞，因?yàn)樗鼈內(nèi)菀讉鞑ィ踩菀字圃煜胂蟆６切┌?AGI、AI 術(shù)語(yǔ)推出去的人，他們心里很清楚，在自己的研究工作里根本不需要這些詞 —— 他們只是知道媒體會(huì)接住。

「我們?cè)谧约旱难芯坷锔静辉诤酢豪斫狻贿@個(gè)詞是否成立。我們想做的是建造好的系統(tǒng)。」

主持人提到，他上周剛采訪了 AlphaFold 的核心研究者 John Jumper，問(wèn)對(duì)方 AlphaFold 是否在某種意義上「理解」蛋白質(zhì)。Jumper 的回答是：對(duì)這個(gè)詞過(guò)敏。他說(shuō)得很清楚 ——AlphaFold 讓我們能預(yù)測(cè)，讓我們能控制，但理解這個(gè)動(dòng)作必須由人類(lèi)自己來(lái)做，不能外包給機(jī)器。

這正中 Jordan 的觀點(diǎn)。「為什么要說(shuō)它理解？說(shuō)它預(yù)測(cè)、它降低不確定性、它讓實(shí)驗(yàn)成為可能 —— 這些已經(jīng)足夠驚人了。非得加上『理解』這個(gè)詞，只會(huì)招來(lái)錯(cuò)誤的期待，然后招來(lái)錯(cuò)誤的失望。」

他認(rèn)為，「人類(lèi)化」機(jī)器這件事之所以有害，不只是因?yàn)椴粶?zhǔn)確，更因?yàn)樗鼤?huì)系統(tǒng)性地轉(zhuǎn)移注意力。一旦你開(kāi)始問(wèn)「它是否理解」，就很容易忘記真正重要的工程問(wèn)題：它在什么條件下會(huì)失效？它在哪些問(wèn)題上最不可靠？它有沒(méi)有給出誤差范圍？它如何與真實(shí)數(shù)據(jù)結(jié)合？它應(yīng)該被嵌入什么樣的系統(tǒng)？又該由誰(shuí)來(lái)承擔(dān)它出錯(cuò)的后果？

這些問(wèn)題，才是真正決定 AI 能否進(jìn)入現(xiàn)實(shí)世界的關(guān)鍵。

「那是媒體的問(wèn)題，不是研究者的問(wèn)題，我們不需要那個(gè)詞。」

基礎(chǔ)模型最危險(xiǎn)的地方

恰恰是科學(xué)家最需要它的地方

Jordan 說(shuō)他很欽佩 AlphaFold。他明確區(qū)分：AlphaFold 不像 LLM，它是針對(duì)一組特定問(wèn)題設(shè)計(jì)的，并且在這些問(wèn)題上做得極好。但他和團(tuán)隊(duì)做過(guò)一項(xiàng)分析，發(fā)現(xiàn)了一個(gè)讓他真正擔(dān)憂(yōu)的盲點(diǎn)。

他們想研究一個(gè)假設(shè)：蛋白質(zhì)中的量子漲落，是否與磷酸化存在關(guān)聯(lián)。也就是說(shuō)，那些結(jié)構(gòu)上看起來(lái)「有點(diǎn)問(wèn)題」的蛋白質(zhì)，是否反而在細(xì)胞里更活躍？這是一個(gè) 2×2 的統(tǒng)計(jì)檢驗(yàn)：磷酸化（是 / 否）× 量子漲落（有 / 無(wú)）。

用傳統(tǒng)的已知晶體結(jié)構(gòu)數(shù)據(jù)來(lái)做這個(gè)檢驗(yàn)，樣本量太小，根本沒(méi)有足夠的統(tǒng)計(jì)功效去拒絕原假設(shè)。換成 AlphaFold 預(yù)測(cè)的兩億個(gè)蛋白質(zhì)結(jié)構(gòu)，功效大幅提升，原假設(shè)被拒絕了 —— 看起來(lái)是好事。

「但我們發(fā)現(xiàn)，那個(gè)統(tǒng)計(jì)量的置信區(qū)間極其狹窄，而且整個(gè)區(qū)間都偏離了真實(shí)值很遠(yuǎn)。不只是在這一個(gè)問(wèn)題上 —— 我們?cè)谝粋€(gè)領(lǐng)域接一個(gè)領(lǐng)域地發(fā)現(xiàn)了同樣的現(xiàn)象。」

原因并不難理解：AlphaFold 的訓(xùn)練集里，含有量子漲落特征的蛋白質(zhì)本來(lái)就很少，因?yàn)檫@個(gè)方向過(guò)去研究得不多，而且晶體化本身很難。訓(xùn)練數(shù)據(jù)稀少，就意味著 AlphaFold 在這個(gè)具體問(wèn)題上的預(yù)測(cè)可能高度偏倚 —— 但它不告訴你這一點(diǎn)。它照樣給出答案，照樣看起來(lái)很有把握，但置信區(qū)間很窄，答案并沒(méi)有真正覆蓋真實(shí)值。

這才是真正讓人不安的地方：不是模型答錯(cuò)了，而是模型答錯(cuò)了卻不說(shuō)

Jordan 的團(tuán)隊(duì)為此開(kāi)發(fā)了一種叫做「預(yù)測(cè)驅(qū)動(dòng)推斷」的方法 —— 把少量真實(shí)標(biāo)注數(shù)據(jù)和大量 AlphaFold 預(yù)測(cè)數(shù)據(jù)混合使用，讓置信區(qū)間在保持足夠窄的同時(shí)重新覆蓋真實(shí)值。技術(shù)上可行，AlphaFold 團(tuán)隊(duì)聽(tīng)到也不會(huì)覺(jué)得奇怪。

但他真正想說(shuō)的，不是這個(gè)技術(shù)修復(fù)。他想說(shuō)的是一個(gè)更根本的模式：

「科學(xué)家感興趣的永遠(yuǎn)是知識(shí)邊界上的新問(wèn)題，不是把過(guò)去已知的事情再研究一遍。而基礎(chǔ)模型恰恰在知識(shí)邊界上表現(xiàn)最差、偏倚最大 —— 因?yàn)槟抢镉?xùn)練數(shù)據(jù)最稀少。」

這個(gè)矛盾不會(huì)隨著數(shù)據(jù)增多自動(dòng)消失。數(shù)據(jù)增多只會(huì)讓模型在已知領(lǐng)域做得更好，但科學(xué)家問(wèn)的下一個(gè)問(wèn)題，依然會(huì)是在未知的邊緣。「你可以修補(bǔ)，它會(huì)越來(lái)越好，但下一個(gè)新問(wèn)題來(lái)了，同樣的事情會(huì)再發(fā)生一次。」

他批評(píng)了兩種常見(jiàn)的錯(cuò)誤反應(yīng)：一種是相信「偏差會(huì)隨著數(shù)據(jù)增多而消失」，另一種是只批評(píng)架構(gòu)、批評(píng)輸出，卻沒(méi)有任何可以推進(jìn)的科學(xué)方法。「那些人在說(shuō)什么？他們?cè)谂u(píng)，但沒(méi)有給出出路。」

正確的方向，是在任何基礎(chǔ)模型周?chē)冀⑵鹗占倭空鎸?shí)數(shù)據(jù)、融合進(jìn)來(lái)、給出可信答案的能力。「這不是科幻小說(shuō)。這是現(xiàn)在就可以做、而且真的需要做的事。」

超級(jí)智能與人類(lèi)滅絕

不是僅有的兩個(gè)選項(xiàng)

這是訪談里 Jordan 情緒最外露的部分。

他被問(wèn)到怎么看 Geoffrey Hinton、Stuart Russell 等人描繪的圖景 ——AI 正在遞歸自我改進(jìn)，它是有主體性的，它不是一種文化技術(shù)，它是一個(gè)獨(dú)立存在的東西。

Jordan 停頓了一下，然后說(shuō)：「那是科幻小說(shuō)。」

他補(bǔ)充：科幻對(duì)社會(huì)很重要，他不是在貶低它。但問(wèn)題在于規(guī)模和音量 —— 當(dāng)這些聲音以那樣的量級(jí)被推出去，當(dāng)它們占據(jù)了播客、論壇、公眾視野里所有關(guān)于 AI 的嚴(yán)肅討論，它真的在傷害 20 歲和 25 歲的年輕人。

他說(shuō)，這些年輕人對(duì)技術(shù)充滿(mǎn)熱情。他們想用它幫助自己的家人 —— 說(shuō)實(shí)話(huà)，比幫助國(guó)家更想幫助家人。他們看到了真實(shí)的機(jī)會(huì)。然后他們聽(tīng)到了什么？

「那些領(lǐng)袖們說(shuō)：我們已經(jīng)玩夠了。我們搞出了一堆算法，做出了這些東西。但你們不能做這個(gè)，因?yàn)樘ｋU(xiǎn)了 —— 它會(huì)以很高的概率消滅人類(lèi)。或者：超級(jí)智能馬上就來(lái)了，反正在你們有生之年也沒(méi)什么事情可做了。」

「這太令人沮喪了。太令人沮喪了。」

他說(shuō)，讓他最不安的，不只是這種敘事本身，而是這種敘事背后經(jīng)濟(jì)思考的完全缺席。這些聲音里，有零分的經(jīng)濟(jì)學(xué)。全是認(rèn)知科學(xué)思維或神經(jīng)科學(xué)思維：我們弄清楚了大腦，梯度下降加分布式神經(jīng)元，LLM 能工作這么好本身就證明我們弄對(duì)了。

Jordan 對(duì)此的回答很干脆：你去問(wèn)神經(jīng)科學(xué)家，LLM 和大腦有沒(méi)有關(guān)系，他們會(huì)說(shuō)，那是一個(gè)好用的比喻，是一個(gè)卡通圖，僅此而已。「梯度下降在大規(guī)模上有效嗎？是的，遠(yuǎn)超所有人的預(yù)期。但它在暴露自己的弱點(diǎn)，而那些弱點(diǎn)是真實(shí)的。」

他更擔(dān)心的，是勞動(dòng)與資本的關(guān)系，而不是機(jī)器決定接管人類(lèi)。「我沒(méi)有看到任何跡象表明梯度下降會(huì)像病毒一樣失控。那是隱喻，不是預(yù)測(cè)。」

然后是他最想對(duì)年輕人說(shuō)的話(huà)：

「超級(jí)智能與人類(lèi)滅絕，那不是僅有的兩個(gè)選項(xiàng)。在那兩個(gè)極端之間，有無(wú)數(shù)非常積極的事情可以在人類(lèi)的尺度上完成。」

他說(shuō)，現(xiàn)在的問(wèn)題是年輕人缺少榜樣 ——缺少那種「靠做出真正有用的東西賺到錢(qián)、同時(shí)讓世界變好一點(diǎn)點(diǎn)」的人。上一代有疫苗，有那些看得見(jiàn)摸得著的東西。「現(xiàn)在呢？不太好。」

他最后對(duì)整個(gè)公共對(duì)話(huà)的判斷是：「這種思想領(lǐng)袖分成兩隊(duì)，一隊(duì)沖向?yàn)跬邪睿魂?duì)沖向末日 —— 在人類(lèi)歷史上，這種程度的現(xiàn)實(shí)脫節(jié)是非常罕見(jiàn)的。

當(dāng)你問(wèn) LLM「你確定嗎」

它其實(shí)不知道

Jordan 認(rèn)為，LLM 最根本的問(wèn)題之一，是它對(duì)自身的不確定性一無(wú)所知

問(wèn)一個(gè)語(yǔ)言模型「你有多確定這個(gè)答案」，你得到的回答往往極端，要么極度自信，要么極度不確定，中間幾乎沒(méi)有梯度。Jordan 說(shuō)，這不是在不確定性下推斷，這是在模仿關(guān)于不確定性的語(yǔ)氣。模型在訓(xùn)練數(shù)據(jù)里找到了人類(lèi)在互聯(lián)網(wǎng)上回答「你確定嗎」的模式，然后復(fù)現(xiàn)那個(gè)模式。

他認(rèn)為，「不確定性」本身被大多數(shù)人理解得太窄了。他把它分成三種完全不同的東西，需要完全不同的處理方式。

第一種是采樣不確定性。這是經(jīng)典統(tǒng)計(jì)學(xué)的領(lǐng)地：我觀察到的數(shù)據(jù)，是不是足以支撐這個(gè)結(jié)論？但他用一個(gè)鴨子的比喻說(shuō)明，即使是這種最基礎(chǔ)的不確定性，一旦放進(jìn)社會(huì)語(yǔ)境就會(huì)變形。

假設(shè)有一只統(tǒng)計(jì)學(xué)家鴨子，它發(fā)現(xiàn)湖的左邊比右邊有兩倍的谷粒，也就是 2:1。一個(gè)純粹做最大期望效用計(jì)算的貝葉斯鴨子，會(huì)每次都去左邊。但真實(shí)的鴨子不是這樣。它們大概會(huì)有 2/3 去左邊，1/3 去右邊，恰好對(duì)應(yīng)那個(gè)比例本身。

這不只是對(duì)沖。Jordan 說(shuō)，這是一個(gè)納什均衡：如果所有鴨子都去同一側(cè)，另一側(cè)的資源就浪費(fèi)了。鴨子是在種群語(yǔ)境下進(jìn)化出來(lái)的，它的「不確定性處理策略」本來(lái)就是為整個(gè)種群優(yōu)化的，不只是為個(gè)體。「正確地使用不確定性，意味著把它放在種群的語(yǔ)境里。」

第二種是信息不對(duì)稱(chēng)。你雇了一個(gè)專(zhuān)家，他知道你不知道的事，而且他知道的那些，他不會(huì)全部告訴你。這不是采樣誤差，這是一種結(jié)構(gòu)性的、永遠(yuǎn)不會(huì)消失的不透明。經(jīng)濟(jì)學(xué)長(zhǎng)期研究這個(gè)問(wèn)題，比如合同理論、激勵(lì)相容設(shè)計(jì)都是在問(wèn)：如何在信息永遠(yuǎn)不對(duì)稱(chēng)的情況下，讓系統(tǒng)還是能運(yùn)轉(zhuǎn)起來(lái)。

第三種他叫做「數(shù)據(jù)的時(shí)效性」（providence）。你在做手術(shù)決策，醫(yī)生給你看統(tǒng)計(jì)數(shù)據(jù)，某種手術(shù)方案的存活率是多少。然后醫(yī)生補(bǔ)了一句：那些數(shù)據(jù)是十年前收集的。你的不確定性應(yīng)該立刻增加。但經(jīng)典統(tǒng)計(jì)學(xué)不處理這個(gè) —— 數(shù)據(jù)就是數(shù)據(jù)，它不會(huì)自動(dòng)因?yàn)槔吓f而打折扣。「在一個(gè)真正的系統(tǒng)里，所有流動(dòng)的數(shù)據(jù)都應(yīng)該帶著元數(shù)據(jù) —— 它是什么時(shí)候的，這個(gè)元數(shù)據(jù)應(yīng)該被定量地納入不確定性計(jì)算。我們現(xiàn)在完全沒(méi)有做這件事。」

人類(lèi)其實(shí)很擅長(zhǎng)把這三種不確定性混在一起處理，幾乎是無(wú)縫的。你會(huì)說(shuō)「那是老數(shù)據(jù)，我打折」，你會(huì)說(shuō)「周?chē)衅渌耍也荒苤粌?yōu)化自己」，你會(huì)說(shuō)「他的動(dòng)機(jī)我摸不準(zhǔn)，我留一手」。而且你會(huì)在社會(huì)語(yǔ)境里主動(dòng)尋找信息：如果不認(rèn)識(shí)路，就去找一個(gè)看起來(lái)是本地人的人問(wèn)。

「可憐的 LLM，上面這三件事一件都不會(huì)做。它說(shuō)自己很確定，是因?yàn)榛ヂ?lián)網(wǎng)上有人在回答相似問(wèn)題時(shí)說(shuō)『我很確定』，然后它學(xué)了那個(gè)語(yǔ)氣。」

他最后用了一個(gè)他很喜歡的類(lèi)比來(lái)說(shuō)明市場(chǎng)如何處理更大尺度的不確定性。

「如果我想開(kāi)一家比薩店，我需要番茄。如果我每天都要自己去尋覓番茄，那今晚有沒(méi)有比薩是高度不確定的。但因?yàn)榇嬖谝粋€(gè)市場(chǎng)，有人替我做了尋覓這件事，每天都有穩(wěn)定的番茄供應(yīng)，我的不確定性就消失了，我就可以在這個(gè)基礎(chǔ)上建立更復(fù)雜的東西。」

市場(chǎng)不是因?yàn)橛腥嗽O(shè)計(jì)了最優(yōu)實(shí)驗(yàn)、做了多臂老虎機(jī)，它只是因?yàn)橛屑?lì)讓人去探索和利用，不確定性就在整個(gè)系統(tǒng)的層面上被消化了。「這才是真正大尺度的不確定性消解，不是誤差棒。」

結(jié)語(yǔ)：

AI 是為了讓人類(lèi)做到本來(lái)想做的正確事情

訪談快結(jié)束時(shí)，Jordan 給出了他對(duì) AI 本質(zhì)最清晰的一次表述。

主持人問(wèn)：現(xiàn)在那些擔(dān)憂(yōu)派和樂(lè)觀派之間，有沒(méi)有什么東西能讓雙方更新看法？

Jordan 沒(méi)有直接回答這個(gè)問(wèn)題。他說(shuō)，他對(duì) AI 本身是正面的，是樂(lè)觀的，只是不是那種烏托邦式的樂(lè)觀。

他用飛機(jī)做了類(lèi)比。他小時(shí)候，空難很常見(jiàn)。今天，在如此大的規(guī)模下，商業(yè)航空的事故率極低，這是因?yàn)樽詣?dòng)駕駛儀。飛機(jī)大部分時(shí)間由自動(dòng)化系統(tǒng)控制，人類(lèi)飛行員在需要時(shí)介入。這種人機(jī)協(xié)同，是目前已知最有效的方式。

「人類(lèi)不是進(jìn)化來(lái)駕駛這個(gè)大鐵鳥(niǎo)的，所以你可以在這里改進(jìn)人類(lèi)的能力。把兩者合在一起，你就得到了對(duì)所有人都有益的東西。」

他對(duì)比了自動(dòng)駕駛汽車(chē)的思路。三維空間里有很多余地，但二維平面上你有幾萬(wàn)輛車(chē)，每年每個(gè)國(guó)家?guī)兹f(wàn)人死亡。解決方案不是把超級(jí)智能放進(jìn)駕駛座。「那是一種非常愚蠢的思考技術(shù)的方式。你必須從系統(tǒng)層面來(lái)想這個(gè)問(wèn)題。」

然后他給出了他對(duì) AI 真正功能的定義：

「AI 是關(guān)于幫助那些對(duì)人類(lèi)來(lái)說(shuō)太難的事情，幫助信息流動(dòng)，讓人類(lèi)在當(dāng)下能夠做出大多數(shù)人真正想做出的正確決策，而不是因?yàn)樾畔⒉蛔悖黄茸龀鏊麄兒ε虏坏貌蛔龅腻e(cuò)誤決策。」

他說(shuō)，人類(lèi)是美好的，但也是不完美的。我們傷害彼此，往往不是因?yàn)閻阂猓且驗(yàn)檎`解對(duì)方的意圖。有多少戰(zhàn)爭(zhēng)，是因?yàn)橐环讲涣私饬硪环秸嬲胍裁矗拖葎?dòng)手了？「博弈論的出現(xiàn)，是為了幫助人類(lèi)更清晰地處理這種情況，但我們還非常粗糙，非常初步。」

AI 真正的機(jī)會(huì)，他認(rèn)為，是在 70 億人的尺度上，幫人類(lèi)修補(bǔ)那些進(jìn)化沒(méi)有完成的部分。「進(jìn)化也許沒(méi)有為 70 億人的規(guī)模做好準(zhǔn)備。」

所以，他真正擔(dān)心的不是 AI 本身，而是今天那場(chǎng)被兩極化帶偏的公共討論。一邊是有錢(qián)、只想著建造的人，另一邊是高喊「這會(huì)毀滅人類(lèi)」卻沒(méi)有任何建設(shè)性的人。

「這兩邊都不是在認(rèn)真思考，而在它們之間，有那么多真實(shí)的、美好的、可以做的事情。」

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.