網易首頁 > 網易號 > 正文申請入駐

「機器學習之父」Jordan：Hinton等「思想領袖們」正在傷害年輕一代

2026-06-25 13:32:04　來源: 人工智能學家

北京舉報

分享至

來源：機器之心

他是教出 Andrew Ng、Yoshua Bengio 的那個人，他親歷了機器學習從無名到主宰世界的全過程。而現在，他說 —— 這場對話讓他最擔心的，是「思想領袖們」正在傷害年輕一代。

如果要評選過去半個世紀對人工智能影響最深的學者，Michael I. Jordan 幾乎無法被繞開。

2016 年，《科學》雜志將他列為「全球最具影響力的計算機科學家」。他是統計機器學習領域的奠基人之一，在圖模型、變分推斷、貝葉斯非參數方法等核心方向上留下了大量引用極高的基礎性工作。他目前是加州大學伯克利分校電氣工程與計算機科學系、統計系雙聘的杰出教授，同時在法國 Inria 巴黎分部任職研究員。

更廣為人知的，是他的學生名單。Andrew Ng（吳恩達），深度學習教育的全球推廣者；Yoshua Bengio，深度學習三巨頭之一、圖靈獎得主；Zoubin Ghahramani，貝葉斯機器學習領軍人物；Eric Xing，MBZUAI 校長、知名 AI 研究者；David Blei，主題模型 LDA 的核心發明人……Jordan 的門下，走出了一整代機器學習領域的重要建設者。

這次接受采訪的節目是 MLST（Machine Learning Street Talk），主持人 Tim Scarfe 是一位長期關注 AI 前沿的播客人。

視頻鏈接：https://www.youtube.com/watch?v=AREWYbVtX64&t=16s

訪談圍繞 Jordan 去年發布在 arXiv 上的論文《AI 的集體主義經濟學視角》（A Collectivist, Economic Perspective on AI）展開，但談話的射程遠不止于此 ——涉及 AGI 炒作、硅谷思維的缺陷、數據市場的經濟設計、不確定性量化，以及他對 Hinton 等「舊友們」轉型為末日預言家的真實看法。

論文鏈接：https://arxiv.org/pdf/2507.06268

強化學習領域的奠基人 Richard Sutton 推薦了這個訪談，認為 Jordan 帶來了一個有力而深思熟慮的視角。

以下是這場對話的主要內容。

「AGI 只是個公關詞」：

我從來不認為自己是 AI 研究者

訪談一開場，Jordan 便亮明了立場，毫不拖泥帶水。

「AGI 對我來說只是個公關詞。它是一種扭曲。它讓人困惑，尤其讓年輕人困惑。」

他解釋，「人工智能」這個詞本身就有歷史包袱。1950 年代 John McCarthy 等人提出這個概念時，背后有一套特定的方法論預設 —— 邏輯推理、符號系統。那套路徑后來并沒有真正走通。真正在工業界產生巨大影響的，是在那之后幾十年里，從統計學、運籌學等領域慢慢生長出來的機器學習方法：決策樹、最近鄰、邏輯回歸、隱馬爾可夫模型…… 這些方法大多數壓根不是從「AI」這個圈子里發展出來的

「亞馬遜的云計算，最初就是為了處理機器學習的工作負載而建的。供應鏈、金融、交通運輸系統，都在大規模使用機器學習，直到今天也是。這才是我成長于其中的傳統。」

然后大約五年前，「AI」這個詞隨著大語言模型的興起卷土重來。原因很簡單：這次模型的輸出是人類讀得懂的流暢語言，而不再只是預測供應鏈、商業、價格之類的東西。人們看到這個就覺得：「天哪，我們解決了那個古老的 AI 問題！」Jordan 說，如果把「AI 問題」的定義窄化到圖靈測試，那勉強算是。但這不過是換了個輸出格式，背后的機器學習傳統一直都在。

「這種 AI 術語回歸，對研究路徑產生了扭曲效應，對我們如何思考商業模式也產生了扭曲效應。還不夠，他們還得再造一個更宏大的流行詞 ——AGI。」

但他真正想批評的，不只是詞本身，而是這套詞背后的思維定勢。他說，那些自稱 AI 研究者的人，往往其實沒有一個清晰的目標。他們的邏輯是：人類是智能的，大腦是一臺計算機，只要我們模仿它、放大它，好事就會自然發生 —— 然后就停在這里了。沒有「我們要解決社會上的什么具體問題」，沒有「這對誰有價值、以什么方式產生價值」，只有一個隱隱約約的「它會幫我們解決問題，然后大家就幸福了」。

「這就是硅谷的談話方式。我離開那里，部分原因就是我厭倦了這種談話。那里沒有什么深度的長期思考。它變成了一場內卷賽，一場金錢競賽。」

Jordan 說，他從來沒有把自己當作 AI 研究者，他也從來沒有讀過一本 AI 的書。他的訓練背景是統計學家和認知科學家。「但我樂于接受這個稱謂，」他笑說。

「我們是社會動物」：

為什么 AI 需要經濟學？

Jordan 提出這篇新論文的核心觀點時，先反問了一個問題：當前很多 AI 研究者真正想實現的目標，到底是什么？

在他看來，今天相當一部分 AI 敘事背后，仍然是一個非常舊的想法：人類是智能的，大腦像一臺計算機；只要我們模仿它、放大它、并行化它，它自然就會做出偉大的事情。問題是，話往往就停在這里了。

它沒有進一步回答：我們究竟要解決社會中的什么問題？這項技術為誰創造價值？成本由誰承擔？收益又如何分配？它只是隱含著一種期待：技術會替我們解決問題，然后人類就會幸福。

在 Jordan 看來，這不是嚴肅的工程思維，而是在用隱喻代替系統設計。

主持人隨后提出了一個典型的硅谷式反駁：如果像 Ilya Sutskever 這樣的硅谷 AI 領袖認為，只要把 LLM 組織成多智能體系統，經濟學里的那些復雜性就會自然涌現，Jordan 會怎么看？

Jordan 的回答毫不客氣：「這就好像 1940 年代的化學工程師說，我們把一堆東西扔在一起，讓它自己工作就好了。你確實可以這么做，但你會得到很多在經濟上根本不可行的東西，還會傷害很多人。」

他認為，這一代 AI 建設者缺少的，不是智力，也不是代碼能力，而是概念和思想的深度。他說，每一個上一個時代的工程學科 —— 電氣、化學、機械 —— 不光有能動手的人，背后都有一套基礎方程支撐：麥克斯韋方程組，牛頓定律。「現在這個領域有什么？只有非常聰明、會編程、有很多直覺的人 —— 我從沒感受到任何真正智識深度的東西。感覺就像科幻小說。」

更讓他擔心的是，已經有人被傷害了，但沒有人在談這件事。Facebook 損害了大量青少年的心理健康，這從來沒有被計算機科學家認真討論過。現在又來了新一輪的「就業崗位可能會消失，但沒關系，新的會出來，一直都是這樣」——「我不喜歡這種說話方式。」

那么，Jordan 自己的框架是什么？他用了一個他反復強調的詞：集體主義（collectivist）。

「當前這些技術，輸入來自數十億人，也將服務數十億人。所以它本來就是一個集體性的東西 —— 有一個集體在輸入，有一個集體在接受輸出。這背后其實有一張巨大的、潛在的網絡。」

但主流 AI 思維的根本缺陷在于，始終把智能窄化為了個體認知。把人類大腦當成模板，把神經元和梯度下降當成核心隱喻，卻忽略了一個最基本的事實：人類是社會動物，我們大量的智識來自聚合 —— 聚合觀點、思想，形成文化，文化在時間上保存它們。

更重要的是，社會為我們的智識提供了語境。在這個語境里聰明的行動，換一個語境可能就是蠢的。智能本身高度情境化，也高度依賴當下。

所謂語境，就是外面可能有人正在試圖利用我，也可能有人想和我合作，而我并不真正知道對方的意圖。所以我必須試探，必須發出信號，必須設計一些機制，讓我們能夠有效互動。經濟學正是以一種數學化的方式研究這些問題。

這讓他得出結論：如果不引入經濟學和社會科學，我們就根本沒有在討論「完整的智能」。

他的框架最終落在三個頂點組成的三角形上：計算機科學（算法、抽象與模塊化）、統計學（推斷與不確定性量化）、經濟學（激勵機制與博弈均衡）。

「計算思維教會你模塊化、抽象和 API—— 這是 Jeannette Wing 幾十年前就提出的洞見，我完全認同。但大量算法其實不是從計算機科學原則里來的，它們來自統計學的推斷思維：在不確定性下如何收集數據、如何做預測。再加上經濟思維：周圍有其他主體，如何確保激勵機制是正確的。」

他說，只有計算加優化，你就只能得到語言模型。把統計和經濟思維加進來，你才開始有一個完整的系統性思考框架。「我把這叫做這個時代的新文科核心。我的人文學科同事可能不同意 —— 但我認為，人文學科目前還沒有觸及這個時代真正核心的智識問題。」

「別問它是否理解」：

停止人類化機器

Jordan 在整個訪談里有一個反復出現的動作：每當對話滑向「AI 是否真正理解」「模型是否擁有某種內在認知」這類問題，他都會把問題拉回到更具體的層面。

「我們根本不需要去問這個問題。」

他回憶起 2000 年前后第一次去亞馬遜時看到的景象。那時，亞馬遜已經在用大規模機器學習方法 —— 當時叫隨機森林 —— 處理供應鏈建模。系統能預測哪艘船會在印度洋延誤，某些零件會不會準時到達，整個供應鏈每天把數十億件商品送到一億人手里。沒有任何人類能理解那個大盒子里在發生什么。

「但這重要嗎？不重要。你要問的不是它是否『理解』物流，而是：它能不能降低不確定性，能不能讓工程系統建立在它之上，能不能讓計劃成為可能。這才是你要問的。」

他認為，「理解」「智能」這些詞，是給媒體用的。媒體喜歡這些詞，因為它們容易傳播，也容易制造想象。而那些把 AGI、AI 術語推出去的人，他們心里很清楚，在自己的研究工作里根本不需要這些詞 —— 他們只是知道媒體會接住。

「我們在自己的研究里根本不在乎『理解』這個詞是否成立。我們想做的是建造好的系統。」

主持人提到，他上周剛采訪了 AlphaFold 的核心研究者 John Jumper，問對方 AlphaFold 是否在某種意義上「理解」蛋白質。Jumper 的回答是：對這個詞過敏。他說得很清楚 ——AlphaFold 讓我們能預測，讓我們能控制，但理解這個動作必須由人類自己來做，不能外包給機器。

這正中 Jordan 的觀點。「為什么要說它理解？說它預測、它降低不確定性、它讓實驗成為可能 —— 這些已經足夠驚人了。非得加上『理解』這個詞，只會招來錯誤的期待，然后招來錯誤的失望。」

他認為，「人類化」機器這件事之所以有害，不只是因為不準確，更因為它會系統性地轉移注意力。一旦你開始問「它是否理解」，就很容易忘記真正重要的工程問題：它在什么條件下會失效？它在哪些問題上最不可靠？它有沒有給出誤差范圍？它如何與真實數據結合？它應該被嵌入什么樣的系統？又該由誰來承擔它出錯的后果？

這些問題，才是真正決定 AI 能否進入現實世界的關鍵。

「那是媒體的問題，不是研究者的問題，我們不需要那個詞。」

基礎模型最危險的地方

恰恰是科學家最需要它的地方

Jordan 說他很欽佩 AlphaFold。他明確區分：AlphaFold 不像 LLM，它是針對一組特定問題設計的，并且在這些問題上做得極好。但他和團隊做過一項分析，發現了一個讓他真正擔憂的盲點。

他們想研究一個假設：蛋白質中的量子漲落，是否與磷酸化存在關聯。也就是說，那些結構上看起來「有點問題」的蛋白質，是否反而在細胞里更活躍？這是一個 2×2 的統計檢驗：磷酸化（是 / 否）× 量子漲落（有 / 無）。

用傳統的已知晶體結構數據來做這個檢驗，樣本量太小，根本沒有足夠的統計功效去拒絕原假設。換成 AlphaFold 預測的兩億個蛋白質結構，功效大幅提升，原假設被拒絕了 —— 看起來是好事。

「但我們發現，那個統計量的置信區間極其狹窄，而且整個區間都偏離了真實值很遠。不只是在這一個問題上 —— 我們在一個領域接一個領域地發現了同樣的現象。」

原因并不難理解：AlphaFold 的訓練集里，含有量子漲落特征的蛋白質本來就很少，因為這個方向過去研究得不多，而且晶體化本身很難。訓練數據稀少，就意味著 AlphaFold 在這個具體問題上的預測可能高度偏倚 —— 但它不告訴你這一點。它照樣給出答案，照樣看起來很有把握，但置信區間很窄，答案并沒有真正覆蓋真實值。

這才是真正讓人不安的地方：不是模型答錯了，而是模型答錯了卻不說。

Jordan 的團隊為此開發了一種叫做「預測驅動推斷」的方法 —— 把少量真實標注數據和大量 AlphaFold 預測數據混合使用，讓置信區間在保持足夠窄的同時重新覆蓋真實值。技術上可行，AlphaFold 團隊聽到也不會覺得奇怪。

但他真正想說的，不是這個技術修復。他想說的是一個更根本的模式：

「科學家感興趣的永遠是知識邊界上的新問題，不是把過去已知的事情再研究一遍。而基礎模型恰恰在知識邊界上表現最差、偏倚最大 —— 因為那里訓練數據最稀少。」

這個矛盾不會隨著數據增多自動消失。數據增多只會讓模型在已知領域做得更好，但科學家問的下一個問題，依然會是在未知的邊緣。「你可以修補，它會越來越好，但下一個新問題來了，同樣的事情會再發生一次。」

他批評了兩種常見的錯誤反應：一種是相信「偏差會隨著數據增多而消失」，另一種是只批評架構、批評輸出，卻沒有任何可以推進的科學方法。「那些人在說什么？他們在批評，但沒有給出出路。」

正確的方向，是在任何基礎模型周圍，都建立起收集少量真實數據、融合進來、給出可信答案的能力。「這不是科幻小說。這是現在就可以做、而且真的需要做的事。」

超級智能與人類滅絕

不是僅有的兩個選項

這是訪談里 Jordan 情緒最外露的部分。

他被問到怎么看 Geoffrey Hinton、Stuart Russell 等人描繪的圖景 ——AI 正在遞歸自我改進，它是有主體性的，它不是一種文化技術，它是一個獨立存在的東西。

Jordan 停頓了一下，然后說：「那是科幻小說。」

他補充：科幻對社會很重要，他不是在貶低它。但問題在于規模和音量 —— 當這些聲音以那樣的量級被推出去，當它們占據了播客、論壇、公眾視野里所有關于 AI 的嚴肅討論，它真的在傷害 20 歲和 25 歲的年輕人。

他說，這些年輕人對技術充滿熱情。他們想用它幫助自己的家人 —— 說實話，比幫助國家更想幫助家人。他們看到了真實的機會。然后他們聽到了什么？

「那些領袖們說：我們已經玩夠了。我們搞出了一堆算法，做出了這些東西。但你們不能做這個，因為太危險了 —— 它會以很高的概率消滅人類。或者：超級智能馬上就來了，反正在你們有生之年也沒什么事情可做了。」

「這太令人沮喪了。太令人沮喪了。」

他說，讓他最不安的，不只是這種敘事本身，而是這種敘事背后經濟思考的完全缺席。這些聲音里，有零分的經濟學。全是認知科學思維或神經科學思維：我們弄清楚了大腦，梯度下降加分布式神經元，LLM 能工作這么好本身就證明我們弄對了。

Jordan 對此的回答很干脆：你去問神經科學家，LLM 和大腦有沒有關系，他們會說，那是一個好用的比喻，是一個卡通圖，僅此而已。「梯度下降在大規模上有效嗎？是的，遠超所有人的預期。但它在暴露自己的弱點，而那些弱點是真實的。」

他更擔心的，是勞動與資本的關系，而不是機器決定接管人類。「我沒有看到任何跡象表明梯度下降會像病毒一樣失控。那是隱喻，不是預測。」

然后是他最想對年輕人說的話：

「超級智能與人類滅絕，那不是僅有的兩個選項。在那兩個極端之間，有無數非常積極的事情可以在人類的尺度上完成。」

他說，現在的問題是年輕人缺少榜樣 ——缺少那種「靠做出真正有用的東西賺到錢、同時讓世界變好一點點」的人。上一代有疫苗，有那些看得見摸得著的東西。「現在呢？不太好。」

他最后對整個公共對話的判斷是：「這種思想領袖分成兩隊，一隊沖向烏托邦，一隊沖向末日 —— 在人類歷史上，這種程度的現實脫節是非常罕見的。」

當你問 LLM「你確定嗎」

它其實不知道

Jordan 認為，LLM 最根本的問題之一，是它對自身的不確定性一無所知。

問一個語言模型「你有多確定這個答案」，你得到的回答往往極端，要么極度自信，要么極度不確定，中間幾乎沒有梯度。Jordan 說，這不是在不確定性下推斷，這是在模仿關于不確定性的語氣。模型在訓練數據里找到了人類在互聯網上回答「你確定嗎」的模式，然后復現那個模式。

他認為，「不確定性」本身被大多數人理解得太窄了。他把它分成三種完全不同的東西，需要完全不同的處理方式。

第一種是采樣不確定性。這是經典統計學的領地：我觀察到的數據，是不是足以支撐這個結論？但他用一個鴨子的比喻說明，即使是這種最基礎的不確定性，一旦放進社會語境就會變形。

假設有一只統計學家鴨子，它發現湖的左邊比右邊有兩倍的谷粒，也就是 2:1。一個純粹做最大期望效用計算的貝葉斯鴨子，會每次都去左邊。但真實的鴨子不是這樣。它們大概會有 2/3 去左邊，1/3 去右邊，恰好對應那個比例本身。

這不只是對沖。Jordan 說，這是一個納什均衡：如果所有鴨子都去同一側，另一側的資源就浪費了。鴨子是在種群語境下進化出來的，它的「不確定性處理策略」本來就是為整個種群優化的，不只是為個體。「正確地使用不確定性，意味著把它放在種群的語境里。」

第二種是信息不對稱。你雇了一個專家，他知道你不知道的事，而且他知道的那些，他不會全部告訴你。這不是采樣誤差，這是一種結構性的、永遠不會消失的不透明。經濟學長期研究這個問題，比如合同理論、激勵相容設計都是在問：如何在信息永遠不對稱的情況下，讓系統還是能運轉起來。

第三種他叫做「數據的時效性」（providence）。你在做手術決策，醫生給你看統計數據，某種手術方案的存活率是多少。然后醫生補了一句：那些數據是十年前收集的。你的不確定性應該立刻增加。但經典統計學不處理這個 —— 數據就是數據，它不會自動因為老舊而打折扣。「在一個真正的系統里，所有流動的數據都應該帶著元數據 —— 它是什么時候的，這個元數據應該被定量地納入不確定性計算。我們現在完全沒有做這件事。」

人類其實很擅長把這三種不確定性混在一起處理，幾乎是無縫的。你會說「那是老數據，我打折」，你會說「周圍有其他人，我不能只優化自己」，你會說「他的動機我摸不準，我留一手」。而且你會在社會語境里主動尋找信息：如果不認識路，就去找一個看起來是本地人的人問。

「可憐的 LLM，上面這三件事一件都不會做。它說自己很確定，是因為互聯網上有人在回答相似問題時說『我很確定』，然后它學了那個語氣。」

他最后用了一個他很喜歡的類比來說明市場如何處理更大尺度的不確定性。

「如果我想開一家比薩店，我需要番茄。如果我每天都要自己去尋覓番茄，那今晚有沒有比薩是高度不確定的。但因為存在一個市場，有人替我做了尋覓這件事，每天都有穩定的番茄供應，我的不確定性就消失了，我就可以在這個基礎上建立更復雜的東西。」

市場不是因為有人設計了最優實驗、做了多臂老虎機，它只是因為有激勵讓人去探索和利用，不確定性就在整個系統的層面上被消化了。「這才是真正大尺度的不確定性消解，不是誤差棒。」

結語：

AI 是為了讓人類做到本來想做的正確事情

訪談快結束時，Jordan 給出了他對 AI 本質最清晰的一次表述。

主持人問：現在那些擔憂派和樂觀派之間，有沒有什么東西能讓雙方更新看法？

Jordan 沒有直接回答這個問題。他說，他對 AI 本身是正面的，是樂觀的，只是不是那種烏托邦式的樂觀。

他用飛機做了類比。他小時候，空難很常見。今天，在如此大的規模下，商業航空的事故率極低，這是因為自動駕駛儀。飛機大部分時間由自動化系統控制，人類飛行員在需要時介入。這種人機協同，是目前已知最有效的方式。

「人類不是進化來駕駛這個大鐵鳥的，所以你可以在這里改進人類的能力。把兩者合在一起，你就得到了對所有人都有益的東西。」

他對比了自動駕駛汽車的思路。三維空間里有很多余地，但二維平面上你有幾萬輛車，每年每個國家幾萬人死亡。解決方案不是把超級智能放進駕駛座。「那是一種非常愚蠢的思考技術的方式。你必須從系統層面來想這個問題。」

然后他給出了他對 AI 真正功能的定義：

「AI 是關于幫助那些對人類來說太難的事情，幫助信息流動，讓人類在當下能夠做出大多數人真正想做出的正確決策，而不是因為信息不足，被迫做出他們害怕不得不做的錯誤決策。」

他說，人類是美好的，但也是不完美的。我們傷害彼此，往往不是因為惡意，而是因為誤解對方的意圖。有多少戰爭，是因為一方不了解另一方真正想要什么，就先動手了？「博弈論的出現，是為了幫助人類更清晰地處理這種情況，但我們還非常粗糙，非常初步。」

AI 真正的機會，他認為，是在 70 億人的尺度上，幫人類修補那些進化沒有完成的部分。「進化也許沒有為 70 億人的規模做好準備。」

所以，他真正擔心的不是 AI 本身，而是今天那場被兩極化帶偏的公共討論。一邊是有錢、只想著建造的人，另一邊是高喊「這會毀滅人類」卻沒有任何建設性的人。

「這兩邊都不是在認真思考，而在它們之間，有那么多真實的、美好的、可以做的事情。」

「那才是 AI 對我意味著什么。」

閱讀最新前沿科技趨勢報告，請訪問21世紀關鍵技術研究院的“未來知識庫”

未來知識庫是 “21世紀關鍵技術研究院”建立的在線知識庫平臺，收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能，數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

（加入未來知識庫，全部資料免費閱讀和下載）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.