網易首頁 > 網易號 > 正文 申請入駐

黃仁勛揭秘Vera Rubin架構與物理AI的‘ChatGPT’時刻 | CES 2026演講全文2.5萬字+視頻

0
分享至

|未經許可不得轉載星標本號獲取最新頂級認知|


整理: Web3天空之城

在2026.1.6 拉斯維加斯璀璨的燈光下,英偉達(NVIDIA)創始人兼首席執行官黃仁勛拉開了2025年國際消費電子展(CES)的序幕。黃仁勛面對全球數百萬觀眾宣布:計算機行業正在經歷每10到15年一次的徹底重置。這一次,傳統的五層技術棧正在被重新發明,而英偉達正試圖通過加速計算、開源模型與物理人工智能(Physical AI),定義下一個十年的生存規則。

演講視頻完整版:

00:04:14 計算機平臺演變與推理驅動的人工智能革命

00:17:35 人工智能智能體與多模態企業級應用架構

00:28:24 物理人工智能:從世界模型到自動駕駛實踐

00:47:34 具身智能機器人與工業級物理人工智能生態

00:57:26 維拉·魯賓架構:下一代超級計算核心芯片解析

01:09:00 極端協同設計與高性能網絡互聯系統

01:21:14 語義存儲革新與超級計算工廠的效能飛躍

以下是本次主題演講的核心洞見:

  • ? 平臺轉型 :計算行業每10-15年重置一次,當前正處于人工智能與加速計算雙重轉型的交匯點,傳統五層技術棧正在被重新發明。

  • ? 具身智能與物理AI :2025年是具身智能的爆發年,通過 Cosmos 世界基礎模型和合成數據生成技術,AI 開始理解物理法則并與現實世界互動。

  • ? 自動駕駛飛躍 :發布了具備推理能力的自動駕駛 AI “Alpamayo”,實現了從傳感器輸入到執行器輸出的端到端訓練與邏輯解釋。

  • ? Vera Rubin架構 :新一代 6 芯片系統實現全面投產,通過“極端代碼設計”突破了摩爾定律放緩的限制,大幅提升了 AI 訓練與推理的能效比。

  • ? “計算行業每10到15年重置一次,當前我們正處于加速計算與人工智能雙重轉型的交匯點。”

  • ? “2025年將是具身智能的爆發年,AI開始理解物理法則并與現實世界深度互動。”

  • ? “開源模型已經達到前沿水平,DeepSeek R1等模型的進步激活了全球范圍內的AI創新運動。”

  • ? “未來的應用將建立在智能體(Agents)之上,它們具備推理、規劃并使用工具解決復雜問題的能力。”

  • ? “自動駕駛的未來在于具備推理能力的AI,它不僅是傳感器的反饋,更是對物理世界的邏輯解釋。”

  • ? “‘Vera Rubin’架構代表了極端的協同設計,我們在摩爾定律放緩的背景下,實現了算力的指數級躍升。”

范式轉移:從“編程軟件”到“訓練軟件”

黃仁勛指出,計算的基礎形態已經發生了根本性的重塑。過去,我們編寫代碼、預編譯程序并在CPU上運行;而現在,我們訓練軟件,并在GPU上運行。這種轉變意味著價值十萬億美元的計算領域正在進行現代化改造。

現在的應用程序需要理解上下文,并且每一次都從零開始生成每一個像素和標記 黃仁勛強調。這意味著每年數千億美元的研發預算正在從傳統方法轉向人工智能。在這個新世界中,人工智能不再僅僅是一個應用程序,而是構建所有應用程序的基石。

開源模型的崛起與“智能體”架構


去年是人工智能歷史上的重要節點,尤其是開源模型的進步。黃仁勛特別提到了DeepSeek R1的突破:“它是第一個具有推理系統的開源模型,讓全世界感到驚訝。開源模型已經達到了前沿水平,這讓每個國家和企業都能參與到這場革命中。”

英偉達的角色正在發生轉變,它不僅是芯片供應商,更是前沿人工智能模型的構建者。黃仁勛展示了英偉達如何通過開源模型、數據和工具庫(如Nemo、Cosmos)來賦能全球生態。他認為,未來的企業UI將不再是繁瑣的表格或命令行,而是“智能體系統”。

智能體系統就是界面,它能推理如何解決問題,而不只是機械地執行指令。 在現場演示中,一個基于英偉達架構的個人助理展示了如何跨模型協作:處理私密郵件時調用本地模型,處理復雜創意時調用云端前沿模型,同時控制物理機器人完成家務。這種“多模型、多云、混合云”的架構,正是未來應用的基本框架。

物理人工智能:物理世界的“ChatGPT時刻”


如果說大語言模型讓AI學會了說話,那么物理人工智能(Physical AI)則讓AI學會了行動。黃仁勛認為,物理AI的“ChatGPT時刻”已經迫近。

物理人工智能不僅是與世界互動,更是要理解物理定律。 為了教AI學會常識——如物體恒存性、因果關系和重力——英偉達構建了三臺計算機的閉環:一臺用于訓練,一臺用于模擬(Omniverse),一臺用于執行(機器人電腦)。

由于真實世界的物理數據極其稀缺,英偉達推出了Cosmos世界基礎模型。Cosmos將計算轉化為數據,通過合成數據生成技術,我們可以在虛擬世界中模擬數萬億英里的駕駛或機器人的各種極端操作場景。 這種“以物理定律為約束”的模擬,解決了機器人訓練中最昂貴、最慢的數據獲取難題。

Alpamayo:賦予汽車“思考”的能力

在自動駕駛領域,英偉達發布了具備推理能力的AI模型——Alpamayo。這是世界上第一個實現了“端到端訓練”且具備邏輯解釋能力的自動駕駛系統。

汽車不僅要學會像人類一樣自然駕駛,更要在遇到突發狀況時進行推理,并告訴你它為什么要這么做。 黃仁勛透露,英偉達與梅賽德斯-奔馳(Mercedes-Benz)深度合作的這一系統將在2025年第一季度正式上路。為了確保絕對安全,英偉達采用了雙重棧架構:一個端到端訓練的AI模型負責自然駕駛,一個基于規則的經典安全堆棧負責兜底護欄。這種多樣性和冗余性,是英偉達對未來十年交通自動化的承諾。

Vera Rubin架構:突破摩爾定律的極限

演講的高潮部分是全新高性能計算架構Vera Rubin的發布。面對摩爾定律的放緩,英偉達采取了“極端協同設計”(Extreme Co-design)的策略。

Vera Rubin架構是一個由六個芯片組成的復雜系統,包括性能翻倍的Vera CPU和算力提升5倍的Rubin GPU。“在晶體管數量僅增加1.6倍的情況下,我們實現了5倍的推理性能飛躍,這完全歸功于極端的代碼設計和新型張量核心結構。”

此外,英偉達還重塑了數據中心的基礎設施,推出了硅光子交換機和針對AI優化的以太網Spectrum X。“我們正在用熱水冷卻超級計算機,這使我們能節省全球約6%的數據中心電力。” 這種全棧式的創新,使得在給定時間內訓練超大規模模型所需的系統數量減少到原來的四分之一。

從設計芯片的EDA工具到制造機器人的數字化工廠,英偉達正與西門子、新思、楷登等巨頭合作,將物理AI帶入完整的工業生命周期。

“我們正處于一場新的工業革命的開端,”黃仁勛最后總結道,“人工智能正在重塑從芯片到基礎設施、再到應用的所有環節。我們的任務是構建完整的技術棧,以便你們可以為全世界創造出令人難以置信的應用。”

Web3天空之城全文整理 計算機行業的平臺轉型與AI現代化

拉斯維加斯的朋友們,大家好!新年快樂!歡迎來到國際消費電子產品展(CES)!我們這里有大約15場主題演講的內容要塞進來。

我很高興見到你們所有人。你們這個禮堂里有3,000人。庭院里有2,000人在觀看我們。據稱,在四樓本該是播放視頻的樓層,還有另外1,000人在觀看這次主題演講,當然,全球還有數百萬人將觀看這次演講以開啟新的一年。

大約每10到15年,計算機行業就會重置一次。

一個新的平臺轉變會發生。從大型機到個人電腦,從個人電腦到互聯網,從互聯網到云計算,再到移動設備。每一次,應用程序的世界都會瞄準一個新的平臺。這就是為什么它被稱為平臺轉變。你為一臺新計算機編寫新的應用程序。

只不過這一次,實際上同時發生了兩次平臺轉變。我們現在轉向人工智能,應用程序將建立在人工智能之上。起初,人們認為人工智能就是應用程序,事實上,人工智能確實是應用程序,但你將會在人工智能之上構建應用程序,但除此之外,軟件的運行方式和開發方式也發生了根本性的改變。

整個計算機行業的五層技術棧正在被重新發明。你不再是編程軟件,而是訓練軟件。你不再在中央處理器上運行它,而是在圖形處理器上運行。而且,過去應用程序是預先錄制、預先編譯并在你的設備上運行,而現在應用程序需要理解上下文,并且每一次都從零開始生成每一個像素、每一個標記。

由于加速計算和人工智能,計算的基礎形態已經發生了根本性的重塑。那五層蛋糕的每一層現在都在被重新發明。這意味著過去十年中價值約十萬億美元的計算領域正在以這種新的計算機方式進行現代化改造。這意味著每年數千億美元,大約兩千億美元的風險投資正在投入到現代化和發明這個新世界中去。這意味著價值十萬億美元的產業,其中百分之幾是研發預算,正在轉向人工智能。

人們會問,錢從哪里來?這就是資金的來源。人工智能的現代化進程,研發預算從傳統方法轉向現在的人工智能方法的轉變。大量資金涌入這個行業,這解釋了我們為何如此忙碌。去年也不例外。去年是不可思議的。去年,有一張幻燈片即將展示。這就是不練習時發生的情況。這是今年的第一次主題演講。我希望這是你今年的第一次主題演講。否則,你可能已經相當忙碌了。這是我們今年的第一次主題演講。年。我們要把蜘蛛網清干凈了。

所以2025年是不可思議的一年。這只是,似乎所有事情都同時發生了,事實上,可能確實如此。首先,當然是損失的擴大。2015年,我真正認為會帶來變革的第一個語言模型產生了巨大的影響。它被稱為Bert。2017年出現了變形金剛。直到五年后,也就是2022年,才出現了ChatGPT時刻,它讓全世界都意識到了人工智能的可能性。一年后發生了一件非常重要的事情。

ChatGPT的第一個01模型,第一個推理模型,是完全革命性的,它發明了一個叫做測試時縮放(test time scaling)的想法,這是一個非常符合常識的東西。

我們不僅預先訓練模型以進行學習,還使用真實的強化學習對其進行后訓練,使其能夠學習技能。現在我們也有了測試時縮放,換句話說就是思考。你是在實時思考。人工智能的每一個階段都需要大量的計算能力。而計算定律持續擴展。大型語言模型持續改進。

與此同時,又出現了一項突破。這項突破發生在2024年。具身智能系統開始涌現。2025年,它開始涌現。滲透、擴散到幾乎無處不在。那些具備推理能力、查找信息、進行研究、使用工具、規劃未來、模擬結果的具身模型,突然間開始解決非常非常重要的問題。

我最喜歡的具身模型之一叫做Cursor(光標),它徹底改變了我們在英偉達進行軟件編程的方式。具身智能系統將從這里真正起飛。當然,還有其他類型的人工智能。我們知道大型語言模型并非信息的唯一類型。無論宇宙中存在何種信息,無論宇宙存在何種結構,我們都可以訓練一種大型語言模型,一種語言模型的形態,去理解該信息,理解其表征,并將其轉化為人工智能。

其中一個最大、最重要的就是物理人工智能,即理解自然規律的人工智能。然后,當然,物理人工智能是關于人工智能與世界的互動,但世界本身包含信息,編碼信息,這就被稱為人工智能物理學。在物理人工智能的案例中,你有與物理世界互動的AI,還有人工智能物理學,即理解物理定律的AI。

開源模型的崛起與物理基礎模型

然后是去年的最后一件,也是最重要的事情之一,即開源模型的進步。

我們現在知道,當開源、開放創新、全球每家公司和每個行業的創新同時被激活時,人工智能將無處不在地擴散。開源模型去年真的騰飛了。事實上,去年我們看到了DeepSeek R1的進步,它是第一個具有推理系統的開源模型。它讓全世界感到驚訝,并真正激活了整個運動。這是一項非常非常令人興奮的工作。我們對此感到非常高興。

現在,世界各地都有各種各樣的開源模型系統,我們現在知道開源模型也已經達到了前沿水平。仍然比前沿模型落后整整六個月,但每隔六個月,就會有新的模型出現,而且這些模型變得越來越智能。正因為如此,你可以看到下載量已經激增。下載量增長如此之快,是因為初創公司想要參與人工智能革命,大公司想要,研究人員想要,學生想要,幾乎所有國家都想要。智能,即數字形式的智能,怎么可能把任何人落下?因此,開源模型去年確實徹底改變了人工智能的面貌。整個行業將因此被重塑。

現在,我們很早以前就有這種預感了。你可能聽說過,幾年前,我們就開始構建和運營自己的人工智能超級計算機了。我們稱之為DGX云。很多人問,你們是要進軍云計算業務嗎?答案是否定的。我們正在為我們自己的用途構建這些DGX超級計算機。事實證明,我們有數十億美元的超級計算機正在運行,以便我們能夠開發我們的開源模型。我對我們所做的工作感到非常滿意。

由于我們在眾多不同的領域從事前沿人工智能模型的研發工作,這開始吸引全球和各行各業的關注。我們在蛋白質、數字生物學領域所做的工作,例如La Pratina,能夠合成和生成蛋白質。Open Fold 3,用于理解蛋白質的結構。Evo 2。如何理解和生成多個。多個蛋白質,否則就是細胞表征的開端。地球2,理解物理定律的人工智能,我們用ForecastNet所做的工作,我們用CoreDiv所做的工作,真正徹底改變了人們進行天氣預測的方式。

Nemotri,我們現在在那里做著開創性的工作,第一個混合Transformer SSM模型,它速度極快,因此可以長時間思考,或者可以短時間快速思考并產生非常聰明、智能的答案。Nemotron 3是開創性的工作,您可以期待我們在不久的將來推出Neumotron 3之外的其他版本。Cosmos,一個前沿的、開放的、世界基礎模型,一個理解世界如何運作的模型。Groot,一個類人機器人系統,關節運動、移動性、行走能力,這些模型,這些技術現在正在被整合,并且在所有這些案例中,都向全世界開放。前沿的人機和機器人模型向全世界開放。

然后今天,我們將談論一點關于Alpamio,我們一直在自動駕駛汽車領域所做的工作。我們不僅開源這些模型,我們還開源用于訓練這些模型的數據。因為只有通過這種方式,你才能真正相信這些模型是如何產生的。我們將這些模型產生的一切都開源了。模型,我們幫助您基于它們創建衍生模型。

我們擁有一整套庫。我們稱之為 Nemo 庫,物理學 Nemo 庫,以及 Clara Nemo 庫,每種都是生物 Nemo 庫。這些庫中的每一個都是人工智能的生命周期管理系統,因此您可以處理數據、生成數據、訓練模型、創建模型、評估模型、設置護欄保護模型,直到部署模型。這些庫中的每一個都極其復雜,而且所有這些都是開源的。

因此,現在在這個平臺之上,英偉達是一家前沿人工智能模型的構建者,我們以一種非常特殊的方式構建它。我們完全公開地構建它,以便我們能夠使每家公司、每個行業、每個國家都能參與到這場人工智能革命中來。我為我們正在那里所做的工作感到非常自豪。事實上,如果您注意到圖表,圖表顯示我們對該行業的貢獻是首屈一指的,您會看到我們將繼續這樣做,甚至會加速。這些模型也是世界級的。所有系統都宕機了。

在圣克拉拉這從沒發生過。是因為拉斯維加斯嗎?

肯定有人想在外面贏大獎。所有系統都宕機了。

我想我的系統仍然宕機,但沒關系。我會隨機應變。所以這些模型不僅具有前沿能力,不僅是開放的,它們還登上了排行榜榜首。這是我們非常自豪的一個領域。它們在智能方面登上了排行榜榜首。

我們有一些重要的模型正在理解多模態文檔,也就是PDF文件。世界上最有價值的內容都以PDF的形式存儲著。但需要人工智能才能發現其中的內容、解釋其中的內容并幫助您閱讀它。因此,我們的PDF檢索器、PDF解析器,我們世界一流的,我們的語音識別模型,絕對是世界一流的。我們的檢索模型,基本上是搜索、語義搜索、人工智能搜索,是現代人工智能時代的數據庫引擎,世界一流。所以我們一直在排行榜上名列前茅。這是我們非常自豪的一個領域。

人工智能代理(Agents)與個人助理演示

而所有這一切都是為了幫助您構建人工智能代理。

這確實是一個開創性的發展領域。起初,當ChatGPT出現時,人們說,天哪,它產生了非常有趣的結果,但它產生了大量的幻覺。

它產生幻覺的原因,當然,它過去可以記住所有事情,但它無法記住現在未來會發生的所有事情。

因此,它需要以研究為基礎。在回答問題之前,它必須進行基礎研究。關于是否需要進行研究的推理能力;是否需要使用工具;

如何將一個問題分解成步驟;這些步驟中的每一步,都是人工智能模型知道如何完成的事情,然后它們共同組合成一系列步驟,以執行它以前從未做過的事情。

那是它從未接受過訓練去做的事情。這就是推理的神奇能力。我們可能會遇到一個從未見過的情況,并將其分解成我們知道如何處理的情況、知識或規則,因為我們過去經歷過。因此,現在的人工智能模型具備了極其強大的推理能力。

智能體的推理能力為所有這些不同的應用打開了大門。我們不再需要在第一天就訓練人工智能模型了解一切,正如我們自己也不需要在第一天就了解一切一樣,我們應該能夠在任何情況下,推理出如何解決那個問題。大型語言模型現在已經實現了這一根本性的飛躍。使用強化學習、思維鏈,以及搜索、規劃和所有這些不同的強化學習技術的能力,使我們能夠具備這種基本能力,而且現在也完全開源了。

但真正了不起的是另一件事。發生的又一個突破。我第一次看到它是在 Ervin 的 Perplexity(一個人工智能搜索公司)那里,那是一家非常出色、極具創新性的公司。當我第一次意識到他們同時使用了多個模型時,我覺得這完全是天才之舉。當然我們會這樣做。當然,一個人工智能在推理鏈的任何部分要解決它想解決的問題時,也會調用世界上所有偉大的人工智能。這就是原因所在。為什么人工智能真的是多模態的,這意味著它們理解語音、圖像、文本、視頻、3D圖形和蛋白質。它是多模態的。它也是多模態的,這意味著它們應該能夠使用最適合任務的任何模型。

因此,它本質上是多云的,因為這些人工智能模型存在于所有這些不同的地方,它也是混合云,因為如果你是一家企業公司,或者你制造了一個機器人,或者無論那個設備是什么,它有時在邊緣,有時在無線電基站,也許有時在企業里,或者可能是在一個醫院,你需要實時地將數據保存在你身邊。

無論這些應用是什么,我們現在都知道這就是未來人工智能應用的樣子。

或者從另一個角度來看,因為未來的應用是建立在人工智能之上的,這就是未來應用的基本框架。這種基本框架,這種能夠完成我所談論的事情的生成式人工智能的基本結構,它是多模型的,已經極大地提升了所有類型人工智能的性能。現在,由于所有開放的模型和我們提供的所有工具,你也可以定制你的人工智能,教你的人工智能沒有人教的技能。沒有其他人以那種方式使其人工智能變得智能或聰明。你可以為自己做這件事。這就是我們用 Nemotron、Nemo 以及我們用開源模型所做的所有事情的目的所在。你在它前面放一個智能路由器,這個路由器本質上是一個管理器,它根據你給出的提示的意圖,決定哪個模型最適合該應用、最適合解決該問題。好的?所以現在,當你考慮這種架構時,你擁有什么?

當你考慮這種架構時,突然之間,你擁有了一個人工智能,一方面你可以完全根據自己的需求進行定制。

你可以教它為你公司做你自己的特定技能。

一些屬于領域機密的東西,一些你擁有深厚領域專業知識的東西。

也許你擁有訓練該人工智能模型所需的所有數據。另一方面,你的人工智能在定義上始終處于前沿水平。一方面,你總是在最前沿。另一方面,你總是定制化的,而且它應該可以直接運行。所以我們想提供一個最簡單的示例供您使用。我們稱這個完整的框架為“藍圖”。我們的藍圖已經集成到世界各地的企業SaaS平臺中,我們對目前的進展感到非常滿意。但我們要做的是向您展示一個簡短的示例。這是任何人都可以做的事情。

讓我們來構建一個個人助理。我希望它能幫我處理日歷、電子郵件、待辦事項列表,甚至照看我的家。我使用 brev 將我的 DGX Spark 變成一個個人云。這樣,無論我使用的是云GPU還是DGX Spark,我都可以使用相同的界面。我使用前沿模型API來輕松入門。我想讓它幫我處理電子郵件,所以我為我的代理程序創建了一個可以調用的電子郵件工具。

我希望我的電子郵件保持私密,所以我將添加一個在Spark上本地運行的開源模型。現在,對于任何任務,我都希望代理程序為正確的任務使用正確的模型,所以我將使用一個基于意圖的模型路由器。

這樣,需要電子郵件的提示就會保留在我的Spark上,而其他所有內容都可以調用前沿模型。我希望我的助手能夠與我的世界互動,所以我將它連接到Hugging Face的Ritchie迷你機器人。我的代理程序通過工具調用來控制Ritchie的頭部、耳朵和攝像頭。我想給Ritchie一個聲音,我非常喜歡11 Labs,所以我將連接它們的API。你好,我是Ritchie,運行在DGX Spark上。嘿Ritchie,我今天的待辦事項清單上有什么?你今天的待辦事項清單。去買些雜貨、雞蛋、牛奶、黃油,然后把新劇本發給詹森。我們把這個更新發給詹森。告訴他們我們今天下班前會準備好給他。我們會照辦的。里奇,還有個草圖。你能把它變成一個建筑效果圖嗎?

當然可以。

這難道不令人難以置信嗎?

企業AI架構與物理人工智能

現在,奇妙之處在于這現在是完全微不足道的。

這現在是完全微不足道的。然而,就在幾年前,這一切還是不可能實現的。絕對是無法想象的。這個基礎框架,這種使用語言模型構建應用的基礎方式,

使用語言模型,使用那些經過預訓練且專有的前沿語言模型,將其與定制的語言模型結合,融入到一個代理框架、一個推理框架中,該框架允許你訪問工具和文件,甚至可能連接到其他代理。這基本上就是...的架構:是現代應用的或人工智能應用的架構。

而我們創建 these 應用的能力是極其迅速的。請注意,如果你給它這個應用,提供它從未見過的信息,或者提供一個與你所想結構不完全一致的結構,它仍然可以對這些數據、這些信息進行推理,并盡力去理解如何解決問題。人工智能。因此,這個基礎框架正在被整合,我剛才描述的一切,我們有幸與一些世界領先的企業平臺公司合作。

例如 Palantir。

他們整個的人工智能和數據處理平臺正在被集成,并由英偉達加速。Service Now,世界領先的客戶服務和員工服務平臺。Snowflake,世界頂級的云數據平臺,那里正在進行著令人難以置信的工作。

CodeRabbit,我們在英偉達全方位使用 CodeRabbit。CrowdStrike 正在創建人工智能來檢測、發現人工智能威脅。

NetApp,他們的數據平臺現在在其之上集成了英偉達的語義人工智能和智能體系統,供他們進行客戶服務。

但重要的是這一點。

這不僅是現在開發應用程序的方式,這將是您平臺的(新的)用戶界面。

所以,無論是Palantir、Service Now、Snowflake還是我們合作的許多其他公司,智能體系統就是界面。它不再是Excel,不再是那些讓你輸入信息的方格。也許它不再只是命令行。所有這些多模態信息現在都成為可能。你與你的平臺、平臺進行交互的方式更加,如果你愿意這么說,更加簡單,就像你與人互動一樣。這就是企業人工智能正被智能體系統徹底改變的地方。

接下來是物理人工智能。這是我已經談論了好幾年的一個領域。事實上,我們已經在這一領域工作了八年。問題在于,你如何將計算機內部的智能體,那個通過屏幕和揚聲器與你交互的東西,轉變為能夠與現實世界互動的實體,這意味著它能夠理解世界運行的基本常識。物體恒存性。

如果我移開視線再看回來,那個物體依然在那里。

因果關系。如果我推它,它就會倒下。它理解摩擦力和重力。它理解慣性。它理解在路上行駛的重型卡車需要更長的時間才能停下來。它理解一個球會一直滾動。這些概念即使對小孩來說也是常識,但對于人工智能來說,卻是完全未知的。

因此,我們必須創建一個系統,允許人工智能學習物理世界的常識,學習它的規律,當然,也能夠從數據中學習,而這些數據相當稀缺,并且要能夠評估該人工智能是否有效,這意味著它必須在一個環境中進行模擬。

如果人工智能不具備模擬物理世界對其行為的響應的能力,它怎么會知道它所執行的行為與其應該做的行為是一致的呢?模擬其行為的響應確實非常重要。否則,就沒有辦法評估它。它每次都不同。

因此,這個基本系統需要三臺計算機。一臺計算機,當然是我們知道英偉達(Nvidia)用于訓練人工智能模型的計算機。另一臺計算機我們知道是用于模型的推理。模型的推理本質上是一臺機器人的計算機,它在汽車中運行,或在機器人中運行,或在工廠中運行,在任何邊緣位置運行。但必須有另一臺專為模擬而設計的計算機。而模擬是英偉達所做幾乎所有事情的核心。這是我們最熟悉的地方。模擬是我們用物理人工智能所做幾乎一切的基礎。所以我們有三臺計算機,以及運行在這些計算機上的多個堆棧、這些庫,使它們變得有用。

Omniverse 是我們基于物理學的數字孿生模擬世界。如我之前提到的,Cosmos 是我們的基礎模型,不是語言的基礎模型,而是世界的底層模型。它也與語言相協調。你可以說一些諸如“你知道球發生了什么”之類的話,它們會告訴你球正在沿著街道滾動。所以,一個世界基礎模型,當然,還有機器人 Modics 模型。我們有兩個。

其中一個叫做 Groot。另一個我將要介紹的是 Alpamio。現在,我們在物理人工智能方面必須做的最重要的事情之一,是首先創建數據來訓練人工智能。

這些數據從哪里來呢?而不是像我們創建了大量文本一樣,我們認為這些文本是人工智能可以從中學習的真實基礎數據。我們如何教人工智能物理學的基本事實?有很多很多的視頻。有很多很多的視頻,但還遠遠不足以捕捉我們所需要的多樣性和交互類型。

因此,偉大的思想家們齊聚一堂,將原本的計算轉變成了數據。現在,利用以物理定律為基礎并受其約束、以基本事實為基礎并受其約束的合成數據生成技術,我們現在可以巧妙地選擇生成數據,然后用這些數據來訓練人工智能。因此,例如,進入這個人工智能、這個宇宙人工智能世界模型(在左邊這里)的是一個交通模擬器的輸出。

現在,這個交通模擬器還遠遠不足以讓人工智能從中學習。我們可以將這個輸入到宇宙基礎模型中,并生成在物理上基于和物理上合理的(環境),人工智能現在可以從中學習。有非常多的這樣的例子。讓我向您展示宇宙(模型)能做什么。

物理人工智能的ChatGPT時刻已接近。但挑戰是明確的。物理世界是多樣化且不可預測的。收集真實世界的訓練數據是緩慢且昂貴的,而且永遠都不夠。答案是合成數據。它始于NVIDIA Cosmos,一個用于物理人工智能的開放前沿世界基礎模型,它使用互聯網規模的視頻、真實駕駛和機器人數據以及3D模擬進行預訓練。Cosmos學習了一種統一的世界表征,能夠對齊語言、圖像、3D和動作。它執行生成、推理和軌跡預測等物理人工智能技能。

從單張圖Cosmos可以生成逼真的視頻。

從3D場景描述,可以生成物理上一致的運動。來自駕駛遙測和傳感器日志、環繞視頻。

來自規劃模擬器、多攝像頭環境,或者來自場景提示,它能讓邊緣案例生動起來。

開發者可以在Cosmos中運行交互式的閉環模擬。當采取行動時,世界會做出響應。Cosmos進行推理。它分析邊緣場景,將其分解為熟悉的物理交互,并推理接下來可能發生什么。Cosmos將計算轉化為數據,為自動駕駛汽車訓練長尾場景,并訓練機器人在每種場景中學習如何適應。

這太不可思議了。Cosmos是全球領先的基礎模型。它的下載量已達數百萬次。被廣泛應用。面向全球,為這個物理人工智能的新時代做好準備。我們自己也在使用它。我們自己用它來制造我們的自動駕駛汽車。利用它進行場景生成和評估,我們可以實實現并在計算機內部有效地行駛數十億、數萬億英里。

自動駕駛 AI:Alpamayo 與梅賽德斯合作

我們取得了巨大的進步。今天我們發布 Alpamio,世界上第一個具有思考、推理能力的自動駕駛汽車人工智能。Alpamio 經過端到端訓練,字面意義上是從攝像頭輸入到執行器輸出。

攝像頭輸入,它自己駕駛了大量的里程,我們進行人工駕駛,使用人類演示數據。

我們還有 Cosmos 生成的大量里程數據。除此之外,還非常非常仔細地標記了數十萬個示例,以便我們能教汽車如何駕駛。Alpamio 做了一些非常特別的事情。它不僅接收傳感器輸入并激活方向盤、剎車和加速,它還會推理出即將采取的行動,它會告訴你將要采取什么行動,得出該行動的原因,當然,還有軌跡。所有這些都直接耦合,并通過大量人類訓練數據以及宇宙生成數據進行非常具體地訓練。其結果確實是令人難以置信的。

你的汽車不僅會像你期望的那樣駕駛,而且因為它直接從人類演示中學習,所以駕駛得非常自然。但在每一種場景中,當它遇到該場景時,它會進行推理,告訴你它將要做什么,并推理出你將要做什么。

現在,這之所以如此重要,是因為駕駛的“長尾效應”。

在那種情況下,我們不可能收集到所有國家和所有可能發生的所有人群的所有可能發生情況的每一個場景。然而,然而,它非常不可能,每一種場景如果分解成一堆其他更小的場景,對你來說都是很正常的理解。因此,這些長尾場景將被分解為汽車知道如何處理的相當正常的情況。它只需要對此進行推理。那么,讓我們來看一看。接下來你們將看到的一切都是一鏡到底的。這是不撒手的。

我們八年前開始研發自動駕駛汽車。

這樣做的原因是因為我們很早就判斷出深度學習和人工智能將要重塑整個計算技術棧。如果我們想要理解如何實現自主導航,以及如何引導行業邁向這個新未來,我們就必須擅長構建整個技術棧。正如我前面提到的,人工智能是一個五層的蛋糕。最底層是基礎動力和硬件外殼。在機器人學的案例中,最底層就是汽車本身。再往上一層是芯片。圖形處理器、網絡芯片、中央處理器,所有這些東西。

再往上的一層是基礎設施。

如我之前提到物理人工智能那樣,在這種特定情況下,該基礎設施就是Omniverse和Cosmos。然后在它們之上是模型。

在我剛才展示的這些模型之上,這里的模型被稱為Alpamayo。而Alpamayo今天已開源。

這項令人難以置信的工作,耗費了數千人。為了作一對比,我們的自動駕駛汽車團隊就有數千人。我們的合作伙伴Ola,我想Ola就在觀眾席中的某個地方,梅賽德斯(奔馳),在五年前同意與我們合作,來實現這一切。我們想象,總有一天路上行駛的十億輛汽車都將是自動駕駛的。你可以選擇它是一個你指揮、從別人那里租來的自動駕駛出租車,或者你可以擁有它,它自己駕駛。或者你可以決定自己駕駛。但每一輛車都將具備自動駕駛能力。每一輛車都將由人工智能驅動。

因此,在這種情況下,模型層是 Alpamio,其上方的應用是梅賽德斯-奔馳。因此,整個技術棧是我們英偉達的第一個整體技術棧項目。

我們一直在為此付出努力,我非常高興 VDIA 的第一輛自動駕駛汽車將在第一季度上路,然后在第二季度進入歐洲,美國是在第一季度,然后歐洲是第二季度,我想是第三和第四季度進入亞洲。有力的是,我們將繼續使用下一代 Alpamayo 版本和之后的版本對其進行更新。我對此深信疑。這將是最大的機器人產業之一,我很高興我們參與其中。它教會了我們如何幫助世界其他地區構建機器人系統方面的海量知識。那種深刻的理解,即知道如何自己構建它,自己構建整個基礎設施,以及知道機器人系統需要什么樣的芯片。在這種特定情況下,是雙重的Orin,下一代的雙重Thor。

這些處理器是為機器人系統設計的。

并且是為最高級別的安全能力而設計的。

這輛車剛剛獲得了評級。它剛剛投入生產。

梅賽德斯-奔馳CLA剛剛被歐洲新車安全評鑒協會(NCAP)評為世界上最安全的汽車。據我所知,它是唯一一個擁有每一行代碼、芯片、系統、系統、每一行代碼都通過安全認證的系統。整個模型系統基于多樣化和冗余的傳感器,軟駕駛汽車堆棧也是如此。阿爾帕米奧(Alpamio)堆棧是端到端訓練的,并具備驚人的能力。然而,除非你永遠駕駛它,否則沒人知道它是否能保證絕對安全。

因此,我們設置護欄的方式是依靠另一個軟件堆棧,一個完整的自動駕駛(AV)堆棧作為底層支撐。整個自動駕駛堆棧都構建為完全可追溯,我們花了大約五年時間構建它,實際上是花了六、七年時間來構建第二個堆棧。這兩個軟件堆棧是相互鏡像的,然后我們有一個策略和安全評估器來決定。

這是我非常有信心并能論證其能非常安全駕駛的事情嗎?

如果是,我將讓阿爾帕米奧(Alpamio)來執行。如果是我就沒有太大信心的情形,并且安全策略評估器決定我們要回到一個非常簡單、更安全的護欄系統,那么它就會返回到經典的自動駕駛堆棧。我們是世界上唯一同時運行這兩個自動駕駛堆棧的汽車,而且所有安全系統都應該具備多樣性和冗余性。我們的愿景是,總有一天,每一輛汽車、每一輛卡車都將實現自動化,我們一直在為實現這個未來而努力。

當然,在梅賽德斯-奔馳的案例中,整個堆棧是垂直集成的。我們共同構建了整個堆棧。我們正準備部署這輛車。我們正準備運營這個技術棧。我們將長期維護這個技術棧。我們將生存下去。

機器人產業與工業數字孿生

然而,如同我們公司所做的其他一切事情一樣,我們構建了整個技術棧,但整個技術棧對生態系統是開放的。

并且與我們合作構建L4級自動駕駛和機器人出租車(Robotaxies)的生態系統正在擴大,并且無處不在。我完全期望這會是,這對我們來說已經是一個巨大的業務了。這對我們來說是一個巨大的業務,因為他們用它來訓練我們的,訓練數據、處理數據以及訓練他們的模型。在某些情況下,他們用它來進行合成數據生成,在某些汽車公司中,他們幾乎只是構建車內所安裝的計算機和芯片。

數據生成在某些情況下,在某些汽車公司中,他們幾乎只是構建車內所安裝的計算機和芯片。有些公司與我們進行全棧合作。有些公司與我們合作,(或合作)其中的一部分。所以你決定使用多少并不重要。我唯一的要求是在任何可能的地方都使用一點視頻。而且,但整個事情是開放的。現在,這將是第一個大規模、主流的、人工智能的、物理性人工智能市場。我想我們現在都可以同意,這已經完全到來了。而這種從非自動駕駛汽車過渡到自動駕駛汽車的拐點,很可能就發生在這個時間點附近。在接下來的10年里,我相當確定,世界上將有非常非常大比例的汽車實現自動駕駛或高度自動駕駛。

但這就是我剛才描述的,使用三臺計算機、使用合成數據生成和仿真的基本技術,它適用于所有形式的機器人系統。它可以是一個僅僅是機械臂、一個操作器的機器人。也許它是一個移動機器人。也許它是一個完全擬人化的機器人。因此,機器人系統的下一次發展、下一個時代將是機器人。而這些機器人將會有各種不同的尺寸。我邀請了一些朋友。他們來了嗎?

到這邊來。以前,現在,其中一件事,其中一件事是,你們有“杰森一家”(Jetsons),他們里面有小小的杰森電腦。它們在“元宇宙”(Omniverse)中進行訓練。那這個怎么樣?讓我們向大家展示一下你們學習如何成為機器人的那個模擬器。你們想看看那個嗎?我們來看看那個。請運行它。

我不知道。它是否都完全在機器人內部。還有那個機器人?

那就是你們學習成為機器人的方式?你們所有的一切都是在“云端”(Omniverse)里完成的嗎?還有那個機器人?還有那個機器人,是嗎?艾薩克、Sim和艾薩克實驗室。還有任何想制造機器人的人,沒有人會像你一樣可愛。但現在我們有了所有,看看我們所有正在制造機器人的朋友們。我們正在制造大的。不,就像我說的,沒有人像你們一樣可愛。但我們有神經機器人(neurobot),我們有,我們那邊有助教機器人(adjubot)。我們這邊有樂金(LG)。他們剛剛宣布了一款新機器人。卡特彼勒(Caterpillar),他們擁有有史以來最大的機器人。然而,那個機器人是給您家里送餐的。它連接著優步吃送餐服務(Uber Eats),它就是沖浪機器人(Surf Robot)。我喜歡那些家伙。敏捷性,波士頓動力,令人難以置信。

你有手術機器人,你有來自法國的機械臂機器人。你有通用機器人公司的機器人,數量驚人的不同類型的機器人。

所以這是下一章。

我們將會在未來更多地談論機器人技術,但它不僅僅是關于機器人——我知道一切都與你們有關——它是關于實現目標,以及世界上最重要、將被物理人工智能和人工智能物理學徹底變革的行業之一,就是英偉達(Nvidia)啟動我們所有人的那個行業。如果沒有我接下來要談到的這些公司,這一切將是不可能的,我非常高興所有這些公司,從楷登電子(Cadence)開始,都將加速一切。楷登電子(Cadence)的 CUDA X 已經集成到他們所有的仿真和求解器中。他們將使用英偉達的物理人工智能來進行不同的物理工廠和工廠模擬。

你將看到人工智能物理學被集成到這些系統中。因此,無論是 EDA 還是 STA,以及未來在機器人系統中,我們將擁有基本上使你們成為可能的相同技術。現在徹底革新這些設計堆棧,新思(Synopsys)。沒有新思,新思和楷登電子是完全。在芯片設計的世界中是完全不可或缺的。新思科技(Synopsis)在邏輯設計和知識產權(IP)方面處于領先地位。在楷登電子(Cadence)方面,他們在物理設計、布局布線、仿真和驗證方面處于領先地位。

楷登電子在仿真和驗證方面非常出色。他們兩者都在向系統設計和系統仿真領域邁進。因此,在未來,我們將在新思科技內部設計您的芯片,我們將在這些工具內部設計您的系統,并對所有內容進行仿真和模擬。這就是您的未來。您將誕生于這些平臺之中。非常了不起,因此,我們非常高興能與這些行業合作。

正如我們將英偉達(NVIDIA)集成到 Palantir 和 Service Now 中一樣,我們將英偉達集成到計算最密集的仿真行業——新思科技和楷登電子中。今天我們宣布,西門子(Siemens)也在做同樣的事情。我們將把 KutaX、物理人工智能、代理人工智能、Nemo、Nemotron 深度集成到西門子的世界中。這樣做的原因是……首先,我們將設計芯片,未來所有這些都將由英偉達加速。您對此會非常滿意。我們將擁有自主式芯片設計師和系統設計師與我們一起工作,幫助我們,幫助我們進行設計,正如我們今天擁有自主式軟件工程師來幫助我們的軟件工程師編寫代碼一樣。

因此,我們將擁有自主式芯片設計師和系統設計師。我們將在其中創造你。但然后我們必須制造你。我們必須建造制造你的工廠、生產設施。我們必須設計制造生產線來組裝你們所有人。而這些制造工廠本質上將是巨大的機器人。

難以置信,我知道,我知道。

所以你將在計算機中被設計。你將在計算機中被制造出來。你將在計算機中接受測試和評估。在您必須花費任何時間應對重力之前很久,很久以前。我知道。你知道如何應對重力嗎?你會跳嗎?

你會跳嗎?你會跳嗎?行了,別炫耀了。

那么現在這個行業,成就英偉達成為可能的這個行業,我非常高興的是,我們現在創造的技術的復雜性和能力已經達到了一個新的水平,我們現在可以幫助他們徹底變革他們的行業。所以,從他們開始的地方,我們現在有機會回去幫助他們徹底變革他們的行業。讓我們來看看我們將與西門子一起做的事情。來吧。

物理人工智能的突破正使人工智能從屏幕走向我們的物理世界。而且恰逢其時,在全球各地建設各種芯片、計算機、救命藥物和人工智能工廠之際。隨著全球勞動力短缺日益加劇,我們比以往任何時候都更需要由物理人工智能和機器人技術驅動的自動化。人工智能與全球最大工業的交匯之處,正是英偉達和西門子合作的基礎。近兩個世紀以來,西門子一直在建設全球的工業。現在,它正在為人工智能時代對其進行重塑。西門子已實現集成。

將英偉達-KudaX 庫、人工智能模型和 Omniverse 集成到其電子設計自動化(EDA)、計算機輔助工程(CAE)和計算機輔助工程(C-A-E)以及數字孿生工具和平臺組合中。我們共同將物理人工智能帶入完整的工業生命周期。

從設計和仿真,到生產和運營,再到生產和運營。

我們正處于一場新的工業革命的開端,即由英偉達和西門子為下一代工業構建的物理人工智能時代。難以置信,對吧,各位?你們怎么看?我會抓緊了,就抓緊了。所以,如果你看看全球的模型,毫無疑問。毫無疑問。開放人工智能是當今領先的令牌生成器。生成的開放人工智能令牌比任何其他事物都要多。第二大群體,第二大可能是開源模型。我的猜測是,隨著時間的推移,由于有如此多的公司、如此多的研究人員、如此多的不同類型的領域和模式,開源模型將占據絕對的主導地位。

下一代計算架構: Vera Rubin

我們來談談一位非常特別的人物。你們想這么做嗎?

我們來談談Vera Rubin。

她是一位美國天文學家。她是第一位觀測到。她注意到星系的尾部移動速度與星系的中心差不多快。我知道。這說不通。這說不通。

牛頓物理學會說,就像太陽系一樣,離太陽更遠的行星繞太陽公轉的速度比離太陽更近的行星慢。

因此,除非存在我們稱之為暗體、暗物質的看不見的物質占據空間,否則這種情況就沒有意義,盡管我們看不到它。

所以,我們以Vera Rubin的名字命名了我們的下一臺計算機。這不是個好主意嗎?

我知道。

Vera Rubin的設計旨在應對我們面臨的這一根本性挑戰。人工智能所需的計算量正在急劇增加。對英偉達圖形處理器(GPU)的需求正在急劇增加。需求激增是因為模型每年都在以10倍,一個數量級的速度增長。更不用說,正如我提到的,O1的推出是人工智能的一個轉折點。推理不再是一次性的答案,而是一個思考過程。

為了教會人工智能如何思考,在后訓練中引入了強化學習和非常可觀的計算量。

這不再是監督微調,或者稱為模仿學習或監督訓練。你現在有了強化學習,本質上是計算機嘗試不同的迭代,它在學習如何執行任務。結果是,預訓練、后訓練和測試時間擴展所需的計算量爆炸式增長。現在我們進行的每一次推理,不再是一次性的,你可以看到人工智能思考的令牌數量,我們很欣賞這一點,它思考得越久,往往會產生更好的答案。因此,測試時間擴展導致每年生成的令牌數量增加5倍。更不用說。

與此同時,人工智能競賽正在進行中。每個人都在努力達到下一個水平。每個人都在努力達到下一個前沿領域。每當他們到達下一個前沿領域,上一代人工智能的代幣成本就開始下降。每年大約下降10倍。每年下降10倍實際上告訴你一些不同的信息。這說明競爭非常激烈。每個人都在努力達到下一個水平,并且有人正在達到下一個水平。

因此,所有這一切都是一個計算問題。你計算得越快,就能越早到達下一個前沿領域的下一層。

所有這些事情都在同時發生。所以,我們決定我們必須每年都推進計算的最先進水平,不能落后一年。現在,我們在一年前半就開始交付GB-200了。現在,我們正處于全面制造階段。Vera Rubin的。如果Vera Rubin能在今年內完成,那么它現在必須已經投產了。因此,今天我可以告訴大家,Vera Rubin已全面投產。你們想看看Vera Rubin嗎?請進。請播放。

恰好趕上人工智能的下一個前沿領域。這是我們如何構建它的故事。

這種架構是一個由六個芯片組成的系統,經過精心設計以協同工作,誕生于極端的代碼設計。它始于維拉(Vera),這是一種定制設計的中央處理器(CPU),性能是上一代的兩倍,以及Rubin圖形處理器(GPU)。Vera Rubin從一開始就經過協同設計,以更快、更低延遲地實現雙向和一致的數據共享。然后,17000個組件聚集在Vera Rubin計算板上。高速機器人以微米級的精度放置組件,然后由兩顆 Rubin GPU 完成組裝,構成 Vera CPU。它能夠提供 100 拍浮(Petaflops)的 AI 算力,是其前代的五倍。人工智能需要數據。快。ConnectX9 為每顆 GPU 提供每秒 1.6 太比特(terabits per second)的橫向擴展(scale-out)帶寬。Bluefield 4DPU 卸載了存儲和安全任務,使計算能夠完全專注于人工智能。Vera Rubin 計算托盤進行了徹底重新設計,取消了電纜、軟管或風扇,配備了 Bluefield 4 DPU、8 個 ConnectX9、2 個 Vera CPU 和 4 個 Rubin GPU。Vera Rubin 人工智能超級計算機的計算構建模塊。

接下來是第六代 MV 鏈路交換機。傳輸的數據量超過全球互聯網,連接 18 個計算節點,可擴展多達 72 顆 Rubbin GPU,作為一個整體運行。然后是 Spectrum X 以太網光模塊(Photonics)。這是世界上首款擁有 512 條通道和 200 千兆位(gigabit)兼容共封裝光模塊的以太網交換機,可橫向擴展數千個機架,構建成一個人工智能工廠。自設計啟動以來歷經 15,000 工程師年,首臺 Vera Rubin MVL 72 機架上線。六款突破性芯片,18個計算托架,9個MV-link交換模塊,220萬億晶體管,重近兩噸。邁向人工智能下一前沿的巨大飛躍。Rubin在這里。

極端協同設計與性能參數解析

你們覺得怎么樣?

這是一個Rubin計算單元,包含1152個圖形處理器(GPU)。在16個機架中。正如你們所知,每個機架包含一個72核的Vera Rubin 或72個Rubin單元。每個Rubin單元是兩個實際連接在一起的圖形處理器芯片。

我將向你們展示

但有些事情,我稍后會告訴你們。我不能馬上告訴你們所有事情。

我們設計了六種不同的芯片。首先,我們公司內部有一條規定,而且是一條很好的規定。新一代產品中,芯片的更改數量不應超過一到兩個。但問題在于此。正如您所看到的,我們描述了每個芯片中晶體管的總數,而我們知道摩爾定律在很大程度上已經放緩了。因此,我們逐年能夠獲得的晶體管數量不可能跟上。跟上大 10 倍的模型。跟不上每年生成多五倍的詞元(tokens)。

跟不上詞元成本下降會如此激進的事實。

除非我們部署激進、極端的代碼設計,基本上同時在所有芯片、在整個技術棧中進行創新,否則整個行業不可能以這種速度繼續發展,這也是我們決定在這一代產品中別無選擇,必須重新設計每一塊芯片的原因。現在,我們剛才描述的每一塊芯片本身就可以成為一場新聞發布會。在過去,可能有一整家公司專門致力于做這件事。它們每一個都是徹底的革命性的,并且是同類產品中的佼佼者。Vera 中央處理器,我為它感到非常自豪。在一個功耗受限的世界里,在一個受限的世界里。Gray 的中央處理器在功耗受限的世界中實現了兩倍的性能。它的每瓦性能是世界上最先進的中央處理器的兩倍。它驚人的數據速率令人難以置信。它的設計初衷是用于處理超級計算機。

Vera 曾是一款出色的全球定位系統(GPS),Grace 曾是一款出色的圖形處理器(GPU)。現在,Vera 大幅提升了單線程性能,提升了內存容量,提升了所有一切。

這是一個巨大的芯片。

這就是 Vera 中央處理器。這是一個中央處理器。這與Rubin GPU相連。看看那個東西。

它是一個巨大的芯片。現在真正特別的是,我會瀏覽這些,我想需要三只手,四只手才能做到這一點。這是Vera CPU。它有88個CPU核心。并且CPU核心被設計成多線程的。但是Vera的多線程特性被設計成使得176個線程中的每一個都能獲得其全部性能。所以這基本上就像有176個核心,但只有88個物理核心。所以這些核心是使用一種稱為空間多線程的技術設計的。但是I/O。性能令人難以置信。這是Rubin GPU。它的浮點性能是Blackwell的5倍。但重要的是看最終結果。最終結果是,它的晶體管數量僅是Blackwell的1.6倍。這在一定程度上說明了當今半導體物理學的水平。

如果我們不對整個系統中的基本上每一塊芯片進行代碼設計,進行極端的代碼設計,那么我們如何才能每年交付性能提升,最多只有1.6倍的水平呢?因為那是你擁有的晶體管總數。即使你每個晶體管的性能提升一點點,比如25%,你也不可能從你獲得的晶體管數量中實現100%的良率。因此,1.6倍的提升給每年的性能提升設定了一個上限,除非你采取一些極端的措施。我們稱之為極端代碼設計。

我們所做的一件事,這是一項偉大的發明,叫做NVFP4張量核心(tensor core)。我們芯片內部的Transformer引擎不僅僅是簡單地將我們放入數據路徑中的4英尺、浮點數。它是一個完整的處理器,一個處理單元,它知道如何動態地、自適應地調整其精度和結構,以處理轉換器(transformer)的不同層次,這樣你就可以在任何可以損失精度的地方實現更高的吞吐量,并在任何需要的地方恢復到盡可能高的精度。這種動態執行該操作的能力。你無法在軟件中做到這一點,因為顯然它的運行速度太快了。因此,你必須能夠在處理器內部自適應地完成它。這就是NV-FP4。當有人提到FP4或FP8時,對我們來說幾乎沒有任何意義。這樣做的原因在于張量核心結構以及使之起作用的所有算法。MVP4,我們已經就此發表了論文。它所能保持的吞吐量和精度的水平是完全不可思議的。這是開創性的工作。我不會對業界希望我們將這種格式和結構在未來變成行業標準感到驚訝。這完全是革命性的。這就是為什么盡管我們的晶體管數量只增加了1.6倍,我們仍然能夠實現如此巨大的性能飛躍。

硬件工程與冷卻技術的革新

那么這就是,現在,一旦你擁有了一個出色的處理節點,這就是處理器節點,在里面,所以這,舉個例子,讓我這樣做,這是非常非常沉重的,你必須是一個身體狀況非常好的首席執行官才能做這份工作,所以這個東西是,我猜這可能,我猜這可能,我不知道,幾百磅,我覺得這很有趣。來吧。

本可以的。每個人都在往下走。我不這么認為。好吧。所以,所以看看這個。這是最后一個。我們徹底改造了整個MGX機箱。這個節點,43根線纜,零線纜。六根管子,這里只有兩根,組裝這個需要兩個小時。如果你運氣好,需要兩個小時,需要兩個小時。你很可能會組裝錯。你將不得不重新測試、測試、測試,然后重新組裝。所以裝配過程極其復雜。考慮到這是我們第一批以這種方式解構的超級計算機之一,這是可以理解的。這個,從兩個小時,縮短到五分鐘。

80%液冷,100%液冷。

真是,真是個突破。這是新的計算機箱。連接所有這些設備到機架頂部交換機(即東西向流量)的是名為 Spectrum X-NIC 的設備。這是全球最好的網卡。毫無疑問,英偉達對很久以前加入我們的 Mellanox 的收購,他們的用于高性能計算的網絡技術是全球最無可匹敵。算法、芯片設計、所有的互連,以及在其上運行的所有軟件堆棧,都具有直接內存訪問(DMA)功能,絕對,絕對是首屈一指的,全球最好的。現在它具備了可編程遠程直接內存訪問(RDMA)和數據路徑加速器的能力,這樣像 AI 實驗室這樣的合作伙伴就可以創建自己的算法來控制數據在系統內的移動方式。但這是完全世界級的 ConnectX。ConnectX9 和 Vero CPU 是共同設計的,我們從未透露過,直到 CX9 出現才發布,因為我們是為一種新型處理器共同設計它的。

ConnectX9,或者 CX8 和 Spectrum X,徹底改變了以太網在人工智能領域的應用方式。

人工智能的以太網流量要大得多,需要更低的延遲。瞬間的流量激增與以太網所見過的任何情況都不同。

因此,我們創建了 Spectrum X,它就是人工智能以太網。兩年前,我們發布了 Spectrum X。

英偉達如今是世界上規模最大的網絡公司。因此,它非常成功,并在許多不同的部署中得到了應用。它正在席卷人工智能領域。

性能令人難以置信,尤其是在您擁有一個 200 兆瓦的數據中心,或者一個千兆瓦的數據中心時,這些都是價值數十億美元的。

我們假設一個千兆瓦的數據中心價值 500 億美元。如果網絡性能允許您在使用 SpectrumX 的情況下額外提升 10%,那么實現 25% 的更高吞吐量并不少見。如果我們僅僅提升 10%,那也價值 50 億美元。網絡方面的投入幾乎是免費的,這就是為什么,所有人都使用 Spectrum X。這真是一件不可思議的事情。現在我們將發明一種新的類型,一種新的數據處理類型。因此,SpectromX 適用于東西向流量。我們現在有了一個名為 Bluefield 4 的新處理器。

Bluefield 4 允許我們接管一個大型的、非常大的數據中心,將其不同部分隔離,以便不同的用戶可以使用其不同的部分。

確保如果他們決定虛擬化,所有內容都可以被虛擬化。這樣您就可以卸載大量用于南北向流量的虛擬化軟件、安全軟件和網絡軟件。因此,每個計算節點都標配 Bluefield 4。Bluefield 4 還有第二個應用,我馬上會講到。這是一個革命性的處理器,我對此感到非常興奮。這是 NVLink 6-6 開關。

就在這里。

這個開關,這個交換芯片,在MVLink交換機內部有四個。這些交換芯片中的每一個都擁有歷史上最快的30秒(性能)。全世界的速率才勉強達到200吉字節。這是一個400吉比特每秒的交換機。之所以這非常重要,是因為它能讓我們所有的圖形處理器(GPU)都能在完全相同的時間與所有其他圖形處理器進行通信。這個機架背板上的交換機使我們能夠以兩倍的速度傳輸相當于全球互聯網數據兩倍的總量,即全球所有互聯網數據總量的兩倍。你獲取整個地球互聯網的橫截面帶寬。大約是每秒100太字節。這是每秒240太字節。所以這在一定程度上讓人有所認識。這樣做的目的是讓每一個圖形處理器都能與每一個其他的圖形處理器在完全相同的時間內協同工作。

可以嗎?然后在此之上,在此之上,所以這是一個機架。

這是一個機架。

正如你們所見,這些機架中的每一個,這個機架中的晶體管數量是1.7倍。

你能幫我做這個嗎?

所以這通常是大約兩噸。

但今天它是兩噸半,因為他們運輸的時候忘記把里面的水排掉了。

所以我們從加利福尼亞運送了很多水。你能聽到它在吱吱叫嗎?當你轉動兩噸半的物體時,它會有點吱吱叫。

你可以做到的。我們不會讓你做兩次。好的。那么,那么,在這些后面是MV-鏈路(MV-link)主干線。基本上是兩英里的銅纜。銅是我們所知道的最好的導體。而且這些都是屏蔽的銅纜,結構化的銅纜。這是有史以來在計算系統中用過的最多的。我們的冗余單元以每秒400吉比特的速度驅動銅纜,從機架頂部一直到機架底部。這太不可思議了。所以這總共有兩英里的銅纜,5,000根銅纜。

這使得中壓(MV)鏈路骨干成為可能。這是真正開啟下一代交換機(NGX)系統的革命。

現在,我們決定創建一個行業標準系統,以便整個生態系統、我們所有的供應鏈都能在這些組件上實現標準化。

構成這些MGX系統的組件總共有大約80,000種。如果每年都更換它,那將是徹底的浪費。從富士康、廣達、緯創,名單還在繼續,到惠普、戴爾和聯想,所有主要的計算機公司。每個人都知道如何構建這些系統。所以,盡管性能要高得多,但我們能夠將Rubin 集成到其中,而且非常重要的是,功耗也高了一倍。Vera Rubin的功耗是格蕾絲·布萊克威爾(Grace Blackwell)的兩倍。然而,這也是一個奇跡,它所需要的風量,即空氣流動,大致相同。

而且非常重要的一點是,進入其中的水的溫度也是一樣的,45攝氏度。使用45攝氏度的水,數據中心就不需要水冷機了。

我們基本上是用熱水來冷卻這臺超級計算機,這效率高得驚人。所以這就是新的機架。晶體管數量是1.7倍,但峰值推理性能提高了五倍,峰值訓練性能提高了三倍半。

可以嗎?它們在頂部通過Spectrum X連接。

這是世界上第一個使用臺積電(TSM)新工藝制造的芯片,我們共同創新的工藝稱為COOP。這是一種硅光子學、集成的硅光子學工藝技術。

這使我們能夠直接將硅光子技術應用于芯片。這是512個端口,速率為200千兆比特每秒。這就是新的以太網人工智能交換機,Spectrum X以太網交換機。再看這個巨大的芯片。但真正令人驚奇的是,它直接連接了硅光子技術。激光器進來。激光器從這里進來。激光器從這里進來。光學元件在這里,它們連接到數據中心的其余部分。我馬上會向您展示這個,但它在機架的頂部。這是新的。

Spectrum X,硅光子交換機。

語義存儲與 KV 緩存上下文內存

好的?我們還有一些新的東西想告訴您。

正如我之前提到,幾年前我們推出了 Spectrum X,以便我們能夠重塑網絡構建的方式。

以太網非常易于管理,每個人都有以太網協議棧,世界上每個數據中心都知道如何處理以太網。我們當時唯一使用的技術是英飛凌(Infiniband),它用于超級計算機。

英飛凌的延遲非常低,但當然,英飛凌的軟件協議棧,其整個可管理性對于使用以太網的人來說非常陌生。因此,我們決定首次進入以太網交換機市場。Spectrum X 一經推出便迅速獲得成功,正如我所說,它使我們成為世界上最大的網絡公司。下一代 SpectrumX 將延續這一傳統。但正如我早些時候所說,人工智能已經重塑了整個計算堆棧,計算堆棧的每一層。可以合理地推斷,當人工智能開始在世界各地的企業中部署時,它也將重塑存儲的構建方式。人工智能不使用 SQL。人工智能使用語義信息。當使用人工智能時,它會創建這種臨時知識、臨時內存,稱為 KV 緩存,即鍵值組合,但它是一個 KV 緩存。

基本上,就是那個緩存。人工智能,也就是人工智能的工作記憶。而人工智能的工作記憶存儲在HBM內存中。對于每一個單獨的詞元(token),GPU都會讀取模型中的整個模型。它讀取整個工作記憶,然后產生一個詞元。然后它將這個詞元存回KV緩存中。然后下一次它執行這個操作時,它會讀取整個,它會讀取整個內存,讀取它,然后將其串流通過我們的GPU,再生成另一個詞元。它會反復地這樣做,一個接一個地產生詞元,顯然,如果你與該人工智能進行長時間的對話,隨著時間的推移,這個記憶,這個上下文記憶,將會急劇增長。更不用說模型本身在增長,我們使用的輪次數量也在增加。人工智能正在增加。我們希望這個人工智能陪伴我們一生,并記住我們與它有過的每一次對話,我讓它進行的每一次研究。當然,將要共享這臺超級計算機的人數還會持續增加。因此,這個最初能夠容納在HBM(高帶寬內存)中的上下文內存,已經不再足夠大了。

去年,我們創造了Grace Blackwell中非常快的內存,我們稱之為快速上下文內存。

這就是我們將Grace直接連接到Hopper的原因,這就是我們將Grace直接連接到Blackwell的原因,以便我們能夠擴展上下文內存。但即使那樣也不夠。所以下一個解決方案,當然是連接到網絡,即南北網絡,連接到公司的存儲。但是,如果您同時運行大量人工智能,該網絡的運行速度將不再足夠快。所以答案非常明確,那就是采取不同的做法。因此,我們創建了Bluefield 4,以便我們可以在機架中直接擁有一個非常快速的KV緩存上下文內存存儲。

所以我在一秒鐘后就會向您展示,但存在一個全新的存儲系統類別。

業界對此感到非常興奮,因為這對于當今進行大量 Token 生成的幾乎所有人來說都是一個痛點,人工智能實驗室、云服務提供商都深受由 KV 緩存(KV Cache)移動所產生的網絡流量的影響。

因此,我們設想創建一個新的平臺、一個新的處理器,來運行整個 Dynamo KV 緩存上下文內存管理系統,并將其非常靠近機架的其他部分,這完全是革命性的。

所以,這都是計算節點。它們每一個都是 NVLink 72。

所以這是 Vera Rubin,MVLink 72,144 個 Rubin GPU。這就是存儲在這里的上下文內存。

在它們每一個的后面都是四個藍色區域。每個藍色區域后面是 150 GB,150 TB 的內存,即上下文內存。對于每個 GPU,一旦你進行分配,每個 GPU 將獲得額外的 16 TB。現在在這個節點內部,每個GPU基本上都有一個太字節的容量。現在,有了這個回程,你直接在同一東西向流量上以完全相同的數據速率,每秒200吉字節進行存儲。在整個計算節點的結構中,你將獲得額外的16太字節的內存,好的?這是管理平面。這些是Spectrum X交換機,它們將所有設備連接在一起。而在另一邊,末端的這些交換機將它們連接到數據中心的其余部分。好的?所以這就是Vera Rubin。

現在,關于它,有幾件事真的非常了不起。因此,我提到的第一件事是,整個系統的能源效率提高了兩倍,從某種意義上說,其溫度性能也提高了兩倍,因為盡管功耗是兩倍高,使用的能量是兩倍高,計算量比那高出很多倍,但進入的冷卻液仍然是45攝氏度。這使我們能夠節省全球約6%的數據中心電力。所以這是一件非常重大的事情。

第二個非常重大的進展是,整個系統現在是機密計算安全的,這意味著所有數據在傳輸中、靜止時以及計算過程中都經過了加密。并且每一條總線現在都經過了加密。每一個PCI Express、每一個NV Link、每一個,CPU和GPU之間的NV Link、GPU之間的連接。現在一切都經過了加密。因此,它是機密計算安全的。這使得公司感到安全,因為即使他們的模型是由其他人部署的,也絕不會被任何其他人看到。好嗎?因此,這個特定的系統不僅能源效率極高,而且還有另一件令人難以置信的事情。由于人工智能工作負載的性質,它會隨著一個稱為“全約簡”(all reduce)的計算層而瞬間出現峰值。電流的量、使用的能量,但同時是真正地超出了常態的。通常情況下,它們會激增25%。我們現在已經在整個系統上實現了電源平滑處理,這樣您就不必過度配置25倍,或者如果您過度配置了25倍,您也不必浪費或閑置25%的能源。所以現在你可以填滿整個功耗預算,而無需過度,無需繼續,無需超出該范圍進行配置。

訓練效率、成本對比與結語

然后最后一件事,當然是性能。所以我們來看看性能。這一點。這些圖表是只有構建人工智能超級計算機的人才會喜歡的。這需要我們對每一塊芯片、對所有系統的完全重新設計,以及重寫整個技術棧,才得以實現。基本上,這一列是訓練人工智能模型。你訓練人工智能模型越快,你就能越快地將下一個前沿技術推向世界。這是你的上市時間。這就是技術領導力。這是您的定價。能力。

因此,在綠色的情況下,這本質上是一個擁有10萬億參數的模型。

我們從DeepSeek(深度探索)將其規模擴大,DeepSeek,這就是我們稱之為DeepSeek++的原因,訓練了一個擁有10萬億參數的模型,使用了十萬萬億個詞元。好的。這是我們對構建下一個前沿模型所需投入的模擬預測。下一個前沿模型,埃隆已經提到過,GROC(格羅克)的下一個版本,我認為是GROC 5,是每錘7萬億參數。所以這是10。綠色代表Blackwell。而在Rubin的情況下,請注意,吞吐量要高得多,因此,在給定的一組系統(此處為訓練所需系統數量)中,只需要四分之一的系統就能在一個月內訓練完模型。

好的嗎?因此,時間對每個人來說都是一樣的。

現在,您能多快訓練該模型以及您能訓練多大的模型,將決定您何時能率先達到前沿水平。第二部分是你的工廠吞吐量。Blackwell 又變綠了。工廠吞吐量之所以重要,是因為在千兆瓦的情況下,你的工廠價值500億美元。

一個價值500億美元的數據中心只能消耗一千兆瓦的電力。因此,如果你的每瓦性能、每瓦吞吐量非常好,與相當差的相比,這直接轉化為你的收入。

你數據中心的收入與第二列直接相關。在 Blackwell 的情況下,它比 Hopper 高出約10倍。在 Rubin 的情況下,它將再次提高約10倍。好的。在代幣成本方面,生成代幣的成本效益如何,Rubin 約為十分之一,正如……是的。

這就是我們將如何把所有人帶到下一個前沿,將人工智能推向新水平的方式。

當然,還要以高能效和高成本效益來建設這些數據中心。這就是全部了。這就是今天的英偉達。

你們知道,我們提到我們制造芯片,但正如你們所知,英偉達現在制造的是整個系統。

人工智能是一個完整的技術棧。我們正在對從芯片到基礎設施、再到模型和應用的方方面面進行人工智能的重塑。我們的工作是構建完整的技術棧,以便在座的各位可以為全世界創造出令人難以置信的應用。感謝大家的到來。祝大家有一個愉快的國際消費電子展(CES)。現在,在我讓大家離開之前,我們有很多幻燈片沒有用上。所以我們這里放了一些花絮片段。我想這對你們來說會很有趣。祝大家CES(國際消費電子展)愉快。收工。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
玩什么?!火箭今天停掉所有訓練!

玩什么?!火箭今天停掉所有訓練!

柚子說球
2026-04-26 09:57:07
10國簽反華協議!沉默一天后,中方出手,不得未經允許接受美資

10國簽反華協議!沉默一天后,中方出手,不得未經允許接受美資

清歡百味
2026-04-25 16:25:29
白宮晚宴槍手27日受審!45年前里根在同一酒店遇刺受重傷,兇手已出獄還發新歌

白宮晚宴槍手27日受審!45年前里根在同一酒店遇刺受重傷,兇手已出獄還發新歌

紅星新聞
2026-04-26 13:39:37
長沙公園驚現 “老年服務圈”!低價剛需服務,姑娘邊服務邊嘮嗑

長沙公園驚現 “老年服務圈”!低價剛需服務,姑娘邊服務邊嘮嗑

社會日日鮮
2026-04-25 19:09:27
色情片并不可怕,但它會偷走你的“勁”,讓你做什么都索然無味

色情片并不可怕,但它會偷走你的“勁”,讓你做什么都索然無味

知識圈
2026-04-26 09:35:01
賴清德被摁住,29國24小時內為臺撐腰,大陸三句話回應

賴清德被摁住,29國24小時內為臺撐腰,大陸三句話回應

嘴角上翹
2026-04-26 03:57:43
“媽,我在隧道救了個人,我可能出不去了……”小伙被困后撥通母親電話留下遺言

“媽,我在隧道救了個人,我可能出不去了……”小伙被困后撥通母親電話留下遺言

都市快報橙柿互動
2026-04-26 00:33:10
確診癌癥別先住院!先去政務中心,50萬費用只花2萬多

確診癌癥別先住院!先去政務中心,50萬費用只花2萬多

苗苗情感說
2026-04-25 21:52:52
特朗普:美國總統是危險職業 不想生活在恐懼之中

特朗普:美國總統是危險職業 不想生活在恐懼之中

財聯社
2026-04-26 12:16:05
“兩萬名海面上的‘活靶子’,隨時可能被炸成灰燼”

“兩萬名海面上的‘活靶子’,隨時可能被炸成灰燼”

中國新聞周刊
2026-04-26 07:26:10
切爾諾貝利被遺忘的60萬人:拿鏟子對抗核輻射,沒人告訴他們真相

切爾諾貝利被遺忘的60萬人:拿鏟子對抗核輻射,沒人告訴他們真相

網易新聞出品
2026-04-26 08:51:02
大媽每月電費1700,兒子關掉電閘,次日警方上門:你鄰居出事了

大媽每月電費1700,兒子關掉電閘,次日警方上門:你鄰居出事了

小秋情感說
2026-04-26 09:44:52
宋慶齡為汪精衛妻子請求赦免,毛主席當即同意,但卻提了一個要求

宋慶齡為汪精衛妻子請求赦免,毛主席當即同意,但卻提了一個要求

大運河時空
2026-04-25 13:00:03
世界羽聯會員大會投票通過“15分制”改革,將于2027年實行

世界羽聯會員大會投票通過“15分制”改革,將于2027年實行

懂球帝
2026-04-25 22:23:26
南京一派出所副所長為完成查處任務,“設計”讓6名未成年人吸毒再查獲,犯欺騙他人吸毒罪一審被判5年

南京一派出所副所長為完成查處任務,“設計”讓6名未成年人吸毒再查獲,犯欺騙他人吸毒罪一審被判5年

大風新聞
2026-04-25 22:34:13
森林狼3比1掘金:逆境中殺出了多孫穆?!

森林狼3比1掘金:逆境中殺出了多孫穆?!

張佳瑋寫字的地方
2026-04-26 12:02:17
田馥甄曬3人合體爬山,陳嘉樺帶包子接地氣,任家萱現在最沒星味

田馥甄曬3人合體爬山,陳嘉樺帶包子接地氣,任家萱現在最沒星味

離離言幾許
2026-04-25 20:49:13
掘金瀕臨出局!約基奇回應G4沖突:絕不后悔,誰讓他不講武德!

掘金瀕臨出局!約基奇回應G4沖突:絕不后悔,誰讓他不講武德!

仰臥撐FTUer
2026-04-26 14:38:10
嫌犯攜多種武器沖向安檢點后開火,特朗普再次躲過危險稱與伊朗無關

嫌犯攜多種武器沖向安檢點后開火,特朗普再次躲過危險稱與伊朗無關

澎湃新聞
2026-04-26 12:32:27
簡直是霸王條款!男子花21999元網購三星三折疊手機 被要求必須當面激活才能簽收

簡直是霸王條款!男子花21999元網購三星三折疊手機 被要求必須當面激活才能簽收

閃電新聞
2026-04-25 08:55:39
2026-04-26 14:52:49
Web3天空之城 incentive-icons
Web3天空之城
美好,有趣的,值得銘記的
116文章數 93關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

特朗普2年內遭遇4次刺殺威脅 第一個任期也曾險遭襲擊

頭條要聞

特朗普2年內遭遇4次刺殺威脅 第一個任期也曾險遭襲擊

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《八千里路云和月》大結局意難平

財經要聞

DeepSeek V4背后,梁文鋒的轉身

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

教育
旅游
家居
房產
時尚

教育要聞

麻省理工公開課19:吉爾伯特教授線性代數課-

旅游要聞

下一站|一天體驗越南三大特色

家居要聞

自然肌理 溫潤美學

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

IU的臉,真的有自己的時間線

無障礙瀏覽 進入關懷版