專訪智源理事長黃鐵軍：通往AGI的路已經(jīng)找到

2026-03-11 11:46:17　來源: 知識分子

北京舉報

分享至

智源研究院理事長黃鐵軍

導(dǎo)讀
今年2月，由北京智源研究院的論文"Multimodal learning with next-token prediction for large multimodal models（通過預(yù)測下一個詞元進(jìn)行多模態(tài)學(xué)習(xí)的多模態(tài)大模型）"在Nature上發(fā)表。這是繼DeepSeek登上封面后，第二個中國大模型團(tuán)隊研究成果在Nature正刊發(fā)表，同時這也是國內(nèi)科研機(jī)構(gòu)的首次上刊。

撰文｜張?zhí)炱?/strong>

當(dāng)下的多模態(tài)模型主要依賴專門化路徑，文本、視頻與圖像的處理范式各不相同。是否存在可以統(tǒng)一多模態(tài)的通用路線，此前一直缺乏定論。智源研究院在Nature發(fā)表的這項研究，基于其多模態(tài)模型 Emu3表明：只需采用自回歸路線，也就是像大模型處理文本一樣，通過預(yù)測序列中的下一個詞元（Next-token Prediction）來理解和生成數(shù)據(jù)，就可以實現(xiàn)多模態(tài)學(xué)習(xí)的邏輯統(tǒng)一。

Emu3 在感知和生成任務(wù)上均達(dá)到了成熟特定任務(wù)模型的性能，匹配旗艦系統(tǒng)的表現(xiàn)。更重要的是，在同一套統(tǒng)一架構(gòu)下，該模型展現(xiàn)了極強(qiáng)的通用性，能自然地擴(kuò)展到機(jī)器人操作以及多模態(tài)交互內(nèi)容生成等任務(wù)。

本文通訊作者之一，智源研究院理事長、北京大學(xué)計算機(jī)學(xué)院教授黃鐵軍接受了《知識分子》的訪談。他詳細(xì)介紹了Emu3 如何通過自回歸路線實現(xiàn)多模態(tài)的統(tǒng)一，并對當(dāng)前通用人工智能（AGI）發(fā)展的技術(shù)路線發(fā)表了見解。

01 通往 AGI 的路已經(jīng)找到，接下來就是把它走透

《知識分子》：近年的AI能力進(jìn)步很快。智源一直關(guān)注著AI領(lǐng)域的變化，如果回頭看近年以來的突破，您認(rèn)為真正關(guān)鍵的轉(zhuǎn)折什么？

黃鐵軍：從 2018 年到現(xiàn)在，人們找到了一條能走通的技術(shù)路線，就是自回歸路線：基于Transformer的結(jié)構(gòu)，用預(yù)測下一個詞元（Token）的方式去訓(xùn)練模型。這是最重要的從0到1的突破，這條路通向了通用人工智能（AGI）。

智源一直在堅持一個信念，既然Transformer 加上預(yù)測下一個詞元的路線，在語言模型上徹底走通了，那它能不能拓展到所有模態(tài)的數(shù)據(jù)，無論是語言、圖像、視頻，還是視覺—語言—動作（VLA）等多模態(tài)數(shù)據(jù)？這件事在方法論上，我認(rèn)為是完全可行的。

大家現(xiàn)在談?wù)Z言、圖像、視頻，其實只是我們最常見、最容易理解的數(shù)據(jù)形態(tài)，實際上這個方法可以裝得下任意的數(shù)據(jù)形態(tài)，包括這個世界不同層次的各種數(shù)據(jù)。

但這還只是我們的信念，如果要真正實現(xiàn)，就得繼續(xù)用這些數(shù)據(jù)去實踐。技術(shù)創(chuàng)新只能靠時間去淘洗，靠結(jié)果來證明。

《知識分子》：您把2018年視作一個轉(zhuǎn)折點，2018年前后發(fā)生了什么變化？

黃鐵軍：2018 年之前，人工智能主要還是由人主導(dǎo)的，也就是由人來設(shè)計智能。無論知識庫還是專家系統(tǒng)，設(shè)計師像上帝一樣掌控著系統(tǒng)背后的每一個邏輯，這是一種偏向傳統(tǒng)科學(xué)思維的模式，認(rèn)為先要把具體的原理搞清楚，再去基于原理人工設(shè)計一個系統(tǒng)。

但 2018 年之后，隨著第一代GPT的誕生，出現(xiàn)了所謂的生成式人工智能，它的方法論發(fā)生了根本變化。很多人把“生成”理解為系統(tǒng)能生成文本、圖像或視頻，但我更傾向于把生成理解為類似地球生命生成的過程，也就是一種演化生成（evolutionary generation）。

地球上從沒有生命到有生命，從簡單到復(fù)雜，背后有沒有激勵機(jī)制？當(dāng)然有。但背后的激勵機(jī)制，我們到現(xiàn)在為止還很不清楚。生命科學(xué)、腦科學(xué)搞了這么多年，總體上還是一個“黑暗森林”，我們只是在一點點地試圖發(fā)現(xiàn)背后的原理。

2018年后發(fā)生的變化也是這樣。人們找到了走向通用人工智能的一條可行技術(shù)路線，通過數(shù)據(jù)驅(qū)動的方法訓(xùn)練模型，讓智能涌現(xiàn)，但是這個技術(shù)路線下發(fā)生相互作用的過程，我們不清楚。

《知識分子》：您說自回歸路線是通向AGI的唯一路徑。但對于AGI的定義爭論很多，您對它的看法是？

黃鐵軍：我的觀點是，通用人工智能已經(jīng)在一定程度上實現(xiàn)了。

按照傳統(tǒng)思維方式，大家會覺得沒實現(xiàn)，因為還沒搞清楚它的原理，怎么就算實現(xiàn)了呢？但現(xiàn)在的大模型已經(jīng)表現(xiàn)出很強(qiáng)的通用能力。你可以測試它，如果從能力上講，它比很多人還強(qiáng)。在這種情況下，我們還要堅持說它不是一個具有通用的智能系統(tǒng)，這就有點不講道理。

大家對 AGI 的認(rèn)知變化，也和人工智能歷史上概念的變化有關(guān)系。最早的通用人工智能定義，是從行為、功能、表現(xiàn)上看的，也就是圖靈測試。如果用一個第三方測試，在互動中判斷不出哪個是人、哪個是機(jī)器，那就說明這臺機(jī)器通過了測試。現(xiàn)在大模型已經(jīng)達(dá)到了這個要求。

AGI這個詞差不多是在 90 年代末出現(xiàn)的，至今也就二十幾年的時間。大家認(rèn)為 AGI 就是通用人工智能。但按照嚴(yán)格的定義，90 年代提出的 AGI 概念其實是更難實現(xiàn)的，它認(rèn)為AI需要有自我意識。

如果AGI是指有自我意識的人工智能，我認(rèn)為今天還沒實現(xiàn)，或者這至少是一個開放性問題。但如果我們不采取這種過于嚴(yán)格的概念，說 AGI 指的一定是有自我意識，而只是說它能像人一樣完成各種不同的任務(wù)，具備這種通用性，那我認(rèn)為現(xiàn)在是已經(jīng)有了。

《知識分子》：自回歸這條路線為什么能夠帶來變革。

黃鐵軍：這種方法抓到了智能演化的關(guān)鍵。“預(yù)測下一個詞元”看起來簡單，但實際是智能的核心問題。因為所有智能系統(tǒng)本質(zhì)上都在做一件事：用歷史推測未來。

動物要根據(jù)過去的經(jīng)驗判斷是否逃跑；人類根據(jù)歷史推斷經(jīng)濟(jì)走勢；讀書是為了提升對未來判斷的能力。智能的最基本功能，就是在不確定環(huán)境中，提高做出合理預(yù)期的概率。生物智能進(jìn)化過程，也就是合理選擇的概率不斷提升的過程。

這條路包含兩個缺一不可的部分。第一個是 Transformer。如果用生命科學(xué)類比，它就是“結(jié)構(gòu)基礎(chǔ)”。生命科學(xué)里講“結(jié)構(gòu)決定功能”，有什么樣的 DNA，就決定了什么樣的生理形態(tài)。在 AGI 領(lǐng)域，Transformer 就是那個基本結(jié)構(gòu)。

但僅有基礎(chǔ)還不夠。智能是在與周圍世界互動中慢慢演化的。人類大腦也一樣，它的智能不是一次性形成的，而是在環(huán)境變化中逐漸演化。這是所謂功能塑造結(jié)構(gòu)，環(huán)境的壓力在推動結(jié)構(gòu)的改變。

在人工智能中，這種演化依賴數(shù)據(jù)驅(qū)動。大模型通過自回歸訓(xùn)練，也就是不斷預(yù)測下一個詞元來學(xué)習(xí)規(guī)律。每一次預(yù)測都是一次嘗試：如果預(yù)測錯了，模型就根據(jù)數(shù)據(jù)調(diào)整內(nèi)部參數(shù)。預(yù)測對了，就強(qiáng)化這些連接。這樣，模型在海量數(shù)據(jù)作用下逐漸掌握語言、邏輯，甚至多模態(tài)信息的規(guī)律。 Transformer加上自回歸訓(xùn)練，滿足了智能演化的基本條件。

《知識分子》：預(yù)測下一個詞元是如何發(fā)揮作用的？

黃鐵軍：詞元是自然語言處理的基本單元，可以是單詞、詞組或詞根，也可以是標(biāo)點符號或人工定義的標(biāo)記，本質(zhì)上只是符號。理解符號的意義有兩種方式，一種是直接感受，但AI 沒有身體，它只能通過符號與符號之間的關(guān)系來學(xué)習(xí)意義。

2018年之前，早期的詞向量方法通過統(tǒng)計詞與詞之間的共現(xiàn)關(guān)系，把每個詞映射到一個高維向量空間。誰經(jīng)常和誰一起出現(xiàn)，它們在空間中的距離就更近。

但這一階段的表示是“固定”的。一個詞無論出現(xiàn)在什么語境中，其向量基本不變。模型學(xué)到的是詞的平均意義，而不是語境中的動態(tài)角色。也就是說，它解決了“詞是什么意思”的問題，卻沒有解決“詞在這句話里是什么意思”的問題。

Transformer 的出現(xiàn)改變了這一點。舉個例子，《紅樓夢》書中前后幾十回的伏筆是相互關(guān)聯(lián)的，理解人物不能只看名字，而是要看他與誰互動、經(jīng)歷過什么。Transformer 能夠做的，是在給定的詞元序列中，發(fā)現(xiàn)任意兩個詞元之間的關(guān)系。放到《紅樓夢》里，就是能夠計算出書中任意兩個字的相關(guān)性。

人的智能要理解一部小說或長文章，其實也是在上下文中建立關(guān)系、反復(fù)推敲邏輯。模型本質(zhì)上就在做這件事，只不過它是在更大規(guī)模、更高維度上完成的。不僅理解了內(nèi)容，甚至比我們絕大多數(shù)人讀書理解得都要透徹。

所以，當(dāng)模型預(yù)測下一個詞元時，它并不是簡單地做詞頻統(tǒng)計。它是在調(diào)用一個高度復(fù)雜的結(jié)構(gòu)，對當(dāng)前上下文的全部關(guān)系進(jìn)行壓縮表達(dá)。預(yù)測只是它的表現(xiàn)，真正發(fā)生的是結(jié)構(gòu)對規(guī)律的內(nèi)化，并通過這種關(guān)系推演出后續(xù)的發(fā)展。

02 讓AI像預(yù)測語言一樣預(yù)測物理世界

《知識分子》：人工智能現(xiàn)在表現(xiàn)出的能力已經(jīng)相當(dāng)強(qiáng)。但很多研究者認(rèn)為，如果不能把模型內(nèi)部機(jī)理完全解釋清楚，它就不能算真正的通用人工智能。

黃鐵軍：說實話，這是一種典型的書呆子思維。DeepSeek引發(fā)全球震動后，DeepMind CEO哈薩比斯評論道，“DeepSeek可能是中國最好的人工智能模型，但沒展示任何新的科學(xué)進(jìn)展”。這種批評就是戴著科學(xué)的眼鏡來看技術(shù)創(chuàng)新問題。

如果一定要類比，人類歷史上很多偉大的技術(shù)突破都是“先有技術(shù)路徑，后有科學(xué)原理”。比如飛機(jī)的發(fā)明，萊特兄弟造出飛機(jī)時，空氣動力學(xué)還遠(yuǎn)未完善，飛機(jī)的飛行原理在當(dāng)時也未能完全被理論界解釋清楚，但這并不妨礙飛機(jī)已經(jīng)成功飛上了天，并改變了世界。

人工智能的發(fā)展目前也處于這個階段。大模型現(xiàn)在更接近一項工程創(chuàng)新，而非傳統(tǒng)意義上純粹的科學(xué)探索。通過“預(yù)測下一個token”這個方法論，人類已經(jīng)制造出了具備通用能力的智能系統(tǒng)，這種實踐上的成功是無可辯駁的。

另外，我們必須明確一點：智能本身是極其復(fù)雜的，它不能被簡化成一套幾條規(guī)則或者公式。僅僅因為它不符合特定的原理或規(guī)則，就否定當(dāng)下大模型的智能水平，這像拒絕承認(rèn)飛機(jī)會飛那樣可笑。

《知識分子》：但如果一直搞不清楚大模型背后的原理，這種技術(shù)創(chuàng)新能算是一門嚴(yán)謹(jǐn)?shù)目茖W(xué)嗎？

黃鐵軍：原理并不是必要的。我之所以強(qiáng)調(diào)“不必要”，并不是說原理沒有用、不好，而是說不要以它為前提。現(xiàn)在的問題是，一旦講“必要”，很多人就會認(rèn)為要發(fā)明一套原理才能往下走。我覺得這種認(rèn)知真的限制了一些人做出更大貢獻(xiàn)的機(jī)會，因為他們的思維太固化了。其實我以前也是這樣的，但我后來終于解放了自己。

我們發(fā)現(xiàn)了一套有效的方法論，能把海量數(shù)據(jù)轉(zhuǎn)化為智能，這套方法已經(jīng)跑通了。至于其中的機(jī)制，那是后續(xù)科學(xué)研究的任務(wù)，不能作為我們放棄技術(shù)創(chuàng)新的前提。我們不應(yīng)因為迷信已知的科學(xué)思維方式，就去否認(rèn)技術(shù)創(chuàng)新的客觀結(jié)果。

當(dāng)下的重點是工程化、規(guī)模化，把這條路走深、走透徹。至于人工智能的科學(xué)原理，自然會有后來的研究者完成。

《知識分子》：如果不能總結(jié)成一些規(guī)則或者公式，可以有一些標(biāo)準(zhǔn)判斷智能發(fā)展到什么程度了嗎？

黃鐵軍：可以設(shè)定一些測量指標(biāo)，但隨著智能的復(fù)雜化，測量它的尺子也要有變化。真正的智能的復(fù)雜性是無窮無盡的，我們不能削足適履，只拿著靜態(tài)的標(biāo)準(zhǔn)去丈量智能。有限的測量只能是一個了解它的一個窗口，遠(yuǎn)遠(yuǎn)不是全部。

《知識分子》：您此前多次提到，大模型首先是一種技術(shù)創(chuàng)新。但像Nature這樣的頂級期刊，往往更看重基礎(chǔ)科學(xué)和理論上的原創(chuàng)貢獻(xiàn)。智源這次選擇把 Emu3 這種相關(guān)的成果投給它，是出于什么考慮？

黃鐵軍：我希望能糾正傳統(tǒng)自然科學(xué)的偏見。很多自然科學(xué)背景的人，被自己的思維方式固化了。他們習(xí)慣于先有一個客觀存在的對象，然后去尋找它背后的規(guī)律。

但人工智能不是這樣。人工智能這個系統(tǒng)本身并不存在于自然界，它是需要被創(chuàng)造出來的，是一個技術(shù)創(chuàng)新。和傳統(tǒng)自然科學(xué)研究的內(nèi)容，可以說是完全相反的兩個方向，用一個方向的思維方式去套到另外一個方向，是南轅北轍的。

很多人總在問：“人工智能背后的規(guī)律是什么？”可問題是，首先得有一個已經(jīng)存在的事物，才談得上研究它的規(guī)律。生命存在，所以可以研究生命規(guī)律。但人工智能這個系統(tǒng)本身還在被建造之中，還沒做出來就追問它的終極原理，那等于把技術(shù)創(chuàng)新的過程卡死了。

如果我們等到完全搞清楚原理才開始動手，那可能 300 年都做不出來。技術(shù)史從來不是這樣走的。歷史的常態(tài)，是先有技術(shù)突破，后有科學(xué)解釋。先有飛機(jī)，后有空氣動力學(xué)的發(fā)展。先去開發(fā)人工智能，再去研究人工智能科學(xué)。所謂“事有終始，知所先后，則近道矣”，順序都沒有弄清楚，就用自然科學(xué)的尺度去判斷完全不同的方向，有什么可驕傲的呢？

03 用自回歸路線，統(tǒng)一多模態(tài)

《知識分子》：這篇發(fā)表在Nature的論文，核心發(fā)現(xiàn)是僅通過自回歸路徑即可實現(xiàn)多模態(tài)學(xué)習(xí)的統(tǒng)一。在您看來，目前主流多模態(tài)模型的技術(shù)局限在哪里？

黃鐵軍：現(xiàn)在說到多模態(tài)，大家容易想到的是“多個模態(tài)”。也就是把視覺、聽覺、文字這些模態(tài)簡單拼在一起，就成了所謂多模態(tài)。

例如，Transformer在文字任務(wù)上表現(xiàn)優(yōu)秀，但沒有覆蓋多模態(tài)。現(xiàn)在圖像和視頻生成領(lǐng)域主要使用的是Diffusion模型，它的原理是通過迭代去噪實現(xiàn)高分辨率合成。視覺-語言感知方面，主要依賴組合式方法，利用 CLIP 編碼器與大模型。

如果只是為了解決某個特定模態(tài)的問題，針對它的特點去找一些專用的架構(gòu)或算法，效果確實能做得比較好。但是，如果每一個模態(tài)都要靠特殊的補(bǔ)丁去縫合，那就不能叫做通用智能。我們關(guān)心的是，有沒有一條通用路線，可以解決各種模態(tài)、各種數(shù)據(jù)的智能問題。

這就是自回歸路線的價值所在，也是我們認(rèn)定未來構(gòu)建通用人工智能的核心思路。Emu3 就是在這一思路下誕生的。通過對 Emu3 的實驗驗證，我們發(fā)現(xiàn)即使不依賴擴(kuò)散模型或組合式架構(gòu)，純粹的自回歸模型在感知和生成上也能達(dá)到旗艦?zāi)Ｐ退健?/p>

《知識分子》：論文提到Emu3 采用純自回歸路徑生成視頻，且性能表現(xiàn)足以對標(biāo)目前主流的擴(kuò)散模型（Diffusion Model）。純自回歸與擴(kuò)散模型在本質(zhì)區(qū)別上是什么？

黃鐵軍：Diffusion的生成，是生成內(nèi)容本身，并不是我前面提到的演化生成，這兩者有根本區(qū)別。

自回歸路線適合所有類型的數(shù)據(jù)，是個通用的方法。通過預(yù)測下一個詞元，它能夠?qū)λ蓄愋偷臄?shù)據(jù)進(jìn)行建模。圖像、視頻，甚至是機(jī)器人的動作，這種方法都能處理。這也是我們堅持自回歸路線的理由，它有很大希望能夠統(tǒng)一所有的模態(tài)。

Diffusion 模型在生成圖像和視頻時表現(xiàn)很出色，它的核心是模擬物理擴(kuò)散過程：比如墨水滴在水中擴(kuò)散，從初始狀態(tài)到混合狀態(tài)，然后通過逆向過程生成圖像或視頻。這類方法擅長生成視覺效果，畫面看起來逼真，但它并不關(guān)注畫面背后事物之間的真實規(guī)律。這種方法適合圖像生成這個相對較窄的領(lǐng)域，是一個專用的方法。

當(dāng)面對語言或其他抽象數(shù)據(jù)時，情況就不同了。語言中，詞語之間存在復(fù)雜的語義和結(jié)構(gòu)關(guān)系，小說中的角色、事件和概念相互聯(lián)系，形成龐大而復(fù)雜的網(wǎng)絡(luò)。這種復(fù)雜性遠(yuǎn)超過物理世界中分子或像素的相互作用，Diffusion 方法在這種情況下無法有效建模。它無法捕捉詞語之間深層的邏輯關(guān)系，也不能推演未來的發(fā)展。

《知識分子》：后續(xù)的研究，還會進(jìn)一步擴(kuò)展到其他模態(tài)嗎？

黃鐵軍：這篇論文已經(jīng)給出了答案。我們把Emu3 轉(zhuǎn)化成視覺-語言-動作（VLA）模型，直接去跑機(jī)器人操作任務(wù)。在 CALVIN 這個長程操作的基準(zhǔn)測試?yán)铮@種通用路線做出來的效果，完全不輸給那些專門針對機(jī)器人開發(fā)的模型。

有一點很重要：我們是直接做視覺、語言和動作的離散編碼，不像有些路徑還需要專門搞視頻后訓(xùn)練。這再次證明了，自回歸就是一個普適邏輯。它不需要針對特定任務(wù)打補(bǔ)丁，只要邏輯通了，就能從感知和生成自然地延伸到具身領(lǐng)域。

Nature發(fā)表的這項工作，其實是我們在 2024 年基于 Emu3 的初始版本完成的。到了 2025 年，我們又推出了 Emu3.5。

圍繞這個新版本，我們有了更深層的發(fā)現(xiàn)：隨著模型參數(shù)、數(shù)據(jù)和算力的規(guī)模增長，模型對物理世界的動態(tài)、時空關(guān)系以及因果邏輯，表現(xiàn)出了明顯的理解和預(yù)測能力的涌現(xiàn)。這說明大模型的Scaling Law 不僅僅在語言上靈驗，把它擴(kuò)展到比語言更復(fù)雜、充滿物理規(guī)律的真實世界，這條路同樣是走得通的。

《知識分子》：雖然Emu3 證明了自回歸路線在多模態(tài)上的潛力，但目前這仍然是一種路徑嘗試。要真正實現(xiàn)“世界模型”，我們還缺什么？

黃鐵軍：最近很多人在討論Scaling Law 是不是到頭了，我認(rèn)為這個說法是不對的，不是這條規(guī)律到頭了，而是語言相關(guān)的數(shù)據(jù)挖掘到頭了。

大家現(xiàn)在談“世界模型”，但什么才叫“世界”？對機(jī)器人來說，進(jìn)房間不碰桌子、抓杯子知道力道，這就算認(rèn)識世界了嗎？遠(yuǎn)遠(yuǎn)不夠。真實的客觀世界有復(fù)雜的物理相互作用：你撞墻時，墻是水泥的還是木頭的？如果是玻璃，你能不能直接沖過去？這些關(guān)于力學(xué)、關(guān)于物質(zhì)屬性的邏輯，在今天的模型訓(xùn)練里其實是缺失的。

往深了說，原子與分子之間的相互作用、混凝土凝固后的硬度，難道不是世界的一部分嗎？如果是，那科學(xué)實驗的數(shù)據(jù)、對分子測量的各種數(shù)據(jù)，都該拿來訓(xùn)練。只靠今天互聯(lián)網(wǎng)上的這點語言和圖像數(shù)據(jù)，是撐不起真正的通用人工智能的。

哪怕建模了人類已知的所有細(xì)節(jié)，我們也遠(yuǎn)沒有窮盡這個世界。客觀世界的復(fù)雜性是無限的，我們只能不斷去逼近它。只要這種無限性還在，只要我們能引入更深層的科學(xué)數(shù)據(jù)，Scaling Law 就沒有頭。

《知識分子》：智源一直在支持來自高校和企業(yè)界的學(xué)者。那作為一個獨立研究機(jī)構(gòu)，智源做的研究和大學(xué)以及企業(yè)做的研究有什么不同。

黃鐵軍：智源不做大學(xué)和企業(yè)正在做的事情。

有些事情大學(xué)做不了，不是因為沒有能力，而是條件不夠。想做一個有系統(tǒng)的、實際可操作的項目，需要團(tuán)隊、經(jīng)費、時間去搭建。學(xué)校里，老師可以自己琢磨理論問題，但要做一個完整的系統(tǒng)，就必須先找經(jīng)費、組團(tuán)隊，這個周期很長。而AI 的迭代速度根本不等你慢慢跑經(jīng)費。等你花一年時間把錢拿到手，技術(shù)風(fēng)向可能早就變了。

再說企業(yè)。企業(yè)是務(wù)實的，當(dāng)一條技術(shù)路線還沒有徹底跑通、還只是一種信念的時候，企業(yè)是不敢砸重金去試錯的。企業(yè)愿意做的是別人已經(jīng)試過了、行之有效的東西，然后迅速把它變成可預(yù)期的產(chǎn)品。

智源處在大學(xué)和企業(yè)之間的中間地帶。我們有相對穩(wěn)定的經(jīng)費和團(tuán)隊，我們只要達(dá)成共識，自回歸路線是解決所有模態(tài)的唯一通用路線，那我們就直接動手干。工程技術(shù)的東西，對不對不是靠說服，而是要拿實際的結(jié)果來證明。

我們要做的就是花時間把東西做出來。一旦證明這條路通了，企業(yè)自然會跟進(jìn)，花更多的錢去產(chǎn)業(yè)化

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點推薦

90 后正在掌管中國 AI，憑實力活成了「爽文」主角

愛范兒 2026-01-19 18:14:14
0 跟貼 0

山姆·奧特曼的炒作史

DeepTech深科技 2025-12-24 14:02:44
0 跟貼 0

世界引擎：Post-Training開啟Physical AGI新紀(jì)元

機(jī)器之心Pro 2026-04-19 20:00:03
0 跟貼 0

深度｜AGI是不是一個陰謀論？

DeepTech深科技 2025-12-08 15:01:46
0 跟貼 0

復(fù)旦鐵三角：開辟最優(yōu)物理AI路徑！時空一體世界動作模型問世

新智元 2026-05-31 13:08:37
3 跟貼 3

τ0-WM：最大規(guī)模預(yù)訓(xùn)練的開源具身世界模型來了

量子位 2026-05-31 15:37:06
3 跟貼 3

AI Agent是科技革命中的一次真正的范式轉(zhuǎn)移

量子位 2026-04-03 22:52:35
0 跟貼 0

DDIM之父宋佳銘，宣布離職

量子位 2026-05-31 22:29:09
1 跟貼 1

【鈦晨報】提升全民人工智能素養(yǎng)，四部門最新部署；MiniMax Group Inc.：擬于科創(chuàng)板上市；國家統(tǒng)計局：5月份制造業(yè)采購經(jīng)理指數(shù)（PMI）為50.0%

鈦媒體APP 2026-06-01 07:39:11
0 跟貼 0

MIT研究生用NotebookLM兩天學(xué)完一學(xué)期課程

量子位 2026-03-22 10:50:49
0 跟貼 0

00后小哥復(fù)刻Claude最強(qiáng)神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

Agent輸出到底該用誰？卡帕西轉(zhuǎn)發(fā)：試試讓AI輸出HTML

量子位 2026-05-13 07:19:50
0 跟貼 0

大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0

如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0

Anthropic的AI讀心術(shù)，讓人類讀懂大模型在想啥

量子位 2026-05-10 23:00:57
0 跟貼 0

這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0

安心養(yǎng)蝦！從OpenClaw 看云上AI安全落地路徑

量子位 2026-04-18 19:55:39
0 跟貼 0

博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0

邱錫鵬：未來我們一定會進(jìn)入泛情境智能時代

量子位 2026-05-21 08:04:26
0 跟貼 0

百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0

LLM數(shù)據(jù)量大管飽，機(jī)器人數(shù)據(jù)卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0

讓你的龍蝦秒變電影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟貼 0

對談樓天城：Harness會成為AI時代最關(guān)鍵的能力之一

量子位 2026-05-06 15:41:08
0 跟貼 0

亦莊機(jī)器人馬拉松現(xiàn)場名場面合集

量子位 2026-04-20 00:34:54
0 跟貼 0

陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0

王曉野：Working Agent將是下一個爆發(fā)點

量子位 2026-05-21 08:05:51
0 跟貼 0

黃仁勛：AGI時代已經(jīng)到來，“龍蝦開公司”不是夢！

財聯(lián)社 2026-03-26 23:15:59
0 跟貼 0

Rubrics綜述：Agent時代，如何定義一個「好答案」？

機(jī)器之心Pro 2026-05-31 18:08:42
0 跟貼 0

如果世界是電腦模擬的，人類能否像黑客一樣“越獄”逃離?

DeepTech深科技 2026-02-16 10:08:29
32 跟貼 32

揭秘魔術(shù)第一視角，原理竟如此簡單，手法快速才是關(guān)鍵！

笑料大爆炸 2026-05-28 15:55:43
1 跟貼 1

減速器的工作原理

大橘大利 2026-05-28 11:32:21
1 跟貼 1

寶馬發(fā)動機(jī)冷啟動缺缸，原理已經(jīng)被大神看透，還得是買國產(chǎn)車！

搞笑大琪琪 2026-05-30 11:34:11
1 跟貼 1

科學(xué)是用來服務(wù)有錢人的

猥皮剪影 2026-05-30 17:21:14
0 跟貼 0

這是什么原理，風(fēng)滾草放上去就燃燒了，能煮飯炒菜嗎！

爆笑毛毛 2026-05-31 14:21:26
2 跟貼 2

這是什么原理，輪胎就動了起來

何二狗戶外 2026-05-29 14:16:38
1 跟貼 1

原來搭鐵還能這樣用，原理就是這么簡單，操作太簡單粗暴了！

能把人笑沒社 2026-05-31 14:27:52
1 跟貼 1

最古老的動畫片，這究竟是什么原理，眼見不一定為實

奇葩笑事集結(jié)號 2026-05-30 11:52:32
1 跟貼 1

帥哥挑戰(zhàn)高難度動作，神奇原理讓她瞬間無語，一般女人沒有此功能

樂活萌探 2026-05-30 10:46:05
1 跟貼 1

這個六一，給孩子一份來自前沿科技的啟蒙！

尹燁 2026-06-01 07:36:25
0 跟貼 0

這個就是手藝啊，干活講究方法，這是什么原理？

紫金聊影 2026-05-31 16:44:51
1 跟貼 1

庫里兄弟歐洲度假，一個賺5億，一個賺0.5億，老婆都很漂亮
鄉(xiāng)野小珥
2026-05-31 00:25:29

確認(rèn)了！新一輪國企改革方案正式下發(fā)，多地密集開會部署
證券時報
2026-05-31 23:12:05

禁投美股，難得全球大國中惟一正確
家傳編輯部
2026-05-30 12:24:47

誰罵我誰倒霉！透過澤連斯基，看懂什么叫頂級因果律武器
大又元
2026-05-12 16:13:52

降價2萬！上汽大眾官宣：全新SUV，價格下調(diào)
科技堡壘
2026-05-31 09:34:47

黃仁勛：AI時代無需過度糾結(jié)“應(yīng)該學(xué)什么專業(yè)”，工作中所需的“人性”部分無法被AI取代
每日經(jīng)濟(jì)新聞
2026-05-31 19:10:24

5億美元重壓下雷霆被迫拆隊，亞歷山大超越杜蘭特難度增大
郭蛹包工頭
2026-05-31 14:14:57

對越反擊戰(zhàn)走出的五位傳奇上將
祁州校尉
2026-05-31 13:00:17

湖人隊詹姆斯在馬刺隊淘汰雷霆隊，晉級NBA總決賽時都在做什么
好火子
2026-06-01 04:54:19

3-0爆冷，世界第69完勝世界第39，世界杯新軍迎來2連勝
側(cè)身凌空斬
2026-06-01 01:03:17

白衣美女，顏值真高
藍(lán)色海洋009
2026-05-27 22:23:01

法國外長強(qiáng)烈譴責(zé)：這是一個嚴(yán)重錯誤！
上觀新聞
2026-05-31 19:49:03

“沒穿幾次壞到離譜！”知名品牌淘寶旗艦店，上海消費者質(zhì)疑買到“陳年老鞋”，客服：庫存信息屬店鋪隱私，無法提供
新民晚報
2026-05-31 11:03:40

你慶幸自己看過哪本含金量極高的書?網(wǎng)友：顛覆了認(rèn)知，再不內(nèi)耗
夜深愛雜談
2026-05-30 08:34:39

破大防！荷蘭大臣曾向全球承認(rèn)誤判：沒想到中國真敢叫停芯片出口
老鵜愛說事
2026-06-01 02:53:38

2-0晉級！中國女網(wǎng)18歲1米81新星崛起：鄭欽文王欣瑜后繼有人
李喜林籃球絕殺
2026-05-31 21:00:21

他汀藥有7種，只有一種不影響血糖，早知道早收益！
藥師方健
2026-05-31 22:45:44

原來真有“印度神油“！涂抹15秒即刻起效，ED凝膠已獲FDA認(rèn)證
思思夜話
2026-05-31 12:32:49

原價26.7萬的“華為電車”，二手暴打1.8折，保值率慘不忍睹
閑搞機(jī)
2026-05-30 11:05:41

釋永信“私生子”傳聞再次發(fā)酵！網(wǎng)友：他此前每天怎么面對佛祖的
火山詩話
2026-05-31 12:25:32

2026-06-01 09:00:49

知識分子

關(guān)注科學(xué)、人文、思想

667文章數(shù) 1104關(guān)注度

往期回顧全部

科技要聞

關(guān)停三年后，天涯社區(qū)今起開放訪問

英偉達(dá)版「MacBook Pro」曝光：老黃自研了CPU！

幾十億美元投進(jìn)人形機(jī)器人難關(guān)卡在一雙手上

戴爾諾基亞又回來了！AI重估老牌科技公司

AI寫小說的套路被扒光了

頭條要聞

媒體：中國防長不去"香會" 主辦方的意圖落空了

赫格塞思"香會"演講只字未提臺灣美媒：實屬罕見

伊朗總統(tǒng)被指已向最高領(lǐng)袖提出辭職官方回應(yīng)

兩年“香會” 美國防長因何“判若兩人”

媒體：印度多個領(lǐng)域面臨嚴(yán)重問題莫迪發(fā)出罕見的號召

頭條要聞

媒體：中國防長不去"香會" 主辦方的意圖落空了

赫格塞思"香會"演講只字未提臺灣美媒：實屬罕見

伊朗總統(tǒng)被指已向最高領(lǐng)袖提出辭職官方回應(yīng)

兩年“香會” 美國防長因何“判若兩人”

媒體：印度多個領(lǐng)域面臨嚴(yán)重問題莫迪發(fā)出罕見的號召

體育要聞

阿森納用最悲壯的方式，成就了巴黎王朝

馬刺4-3雷霆時隔12年再進(jìn)總決賽文班22+7SGA35+9

上海33分大勝廣廈3-0奪冠軍點古德溫28+10張鎮(zhèn)麟23+9+6

包攬賽季三冠！29歲樊振東獨取2分率隊問鼎德甲+隊史首次斬3冠王

總決賽三戰(zhàn)33助攻僅4失誤！古德溫穩(wěn)居FMVP榜首答案+保羅合體？

娛樂要聞

朱軍退休，正義雖遲但到，女方受懲

68歲馮小剛和養(yǎng)女貼臉拍照親密

39歲熱依扎近況曝光！

16歲帶病奪冠，退役后定居美國，如今已成大老板

汪涵楊樂樂之間，出了大問題，寵妻人設(shè)崩塌？

財經(jīng)要聞

網(wǎng)紅驅(qū)蚊產(chǎn)品，標(biāo)注化妝品竟含農(nóng)藥成分

“AI工廠”全球競速，各國拼什么？

銀行理財密集止盈，低利率時代打法迎來新變局

為了孩子教育和生活，高管集體減持套現(xiàn)

“雞王”困于萬店，正新雞排謀上市逆天改命？

汽車要聞

900V+3.2秒破百領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

百變旋轉(zhuǎn)座艙零跑D99內(nèi)飾全面公開

增加新配色/搭1.5T動力新款吉利牛仔限時價7.59萬起

鴻蒙智行五界亮相大灣區(qū)車展尊界S800 Grand Design 典藏大觀開啟盲訂

蔚來ES9領(lǐng)銜蔚來三品牌全系亮相大灣區(qū)車展

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機(jī)

本地

數(shù)碼

健康

公開課

手機(jī)要聞

榮耀600系列、OPPO Reno16系列首銷成績出爐

蘋果已啟動iOS 28和macOS 28開發(fā)工作目標(biāo)鎖定2027年發(fā)布

蘋果已啟動iOS 28研發(fā)！新版Siri還將支持iCloud跨設(shè)備同步

天璣7500跑分來了！

本地新聞

用剪紙的方式，打開江蘇揚(yáng)州

用云錦的方式，打開江蘇南京

最近的潮汕人，堪比家里有人考上了清華北大

別搜晉江小說了，去看真的晉江

數(shù)碼要聞

英偉達(dá)N1x處理器預(yù)發(fā)布跑分曝光，與蘋果M3 Max基本持平

新版家用冰箱能效等級國家標(biāo)準(zhǔn)今日實施，約20%產(chǎn)品將被淘汰

消息稱蘋果首款智能眼鏡Apple Glass頗具野心

時隔整整6年HomePod mini2被曝已開發(fā)完畢：重點升級芯片、支持全新AI功能

嘗試干細(xì)胞療法如何避免踩坑？

外出踏青、郊游，千萬警惕這種蟲子！

千滾水、隔夜水到底能喝嗎？真相來了！

外賣這樣吃，便利又健康！很多人不知道

中疾控發(fā)布春夏呼吸道疾病防護(hù)指南

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻

為什么人類有不同的膚色？

七個無法存下錢的壞習(xí)慣

李彥宏：百度離破產(chǎn)30天

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

專訪智源理事長黃鐵軍：通往AGI的路已經(jīng)找到

01 通往 AGI 的路已經(jīng)找到，接下來就是把它走透

02 讓AI像預(yù)測語言一樣預(yù)測物理世界

03 用自回歸路線，統(tǒng)一多模態(tài)

關(guān)停三年后，天涯社區(qū)今起開放訪問

媒體：中國防長不去"香會" 主辦方的意圖落空了

媒體：中國防長不去"香會" 主辦方的意圖落空了

阿森納用最悲壯的方式，成就了巴黎王朝

朱軍退休，正義雖遲但到，女方受懲

網(wǎng)紅驅(qū)蚊產(chǎn)品，標(biāo)注化妝品竟含農(nóng)藥成分

900V+3.2秒破百 領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

態(tài)度原創(chuàng)

榮耀600系列、OPPO Reno16系列首銷成績出爐

用剪紙的方式，打開江蘇揚(yáng)州

英偉達(dá)N1x處理器預(yù)發(fā)布跑分曝光，與蘋果M3 Max基本持平

嘗試干細(xì)胞療法如何避免踩坑？

900V+3.2秒破百領(lǐng)克10+&領(lǐng)克10上市16.99萬元起