![]()
——這是一場以“金錢換時間”的防御性清場,標志著 AI 計算范式從“暴力并行的訓(xùn)練時代”向“極致延遲的推理時代”徹底轉(zhuǎn)型的里程碑。
1. 引言:為何英偉達不計代價鎖定 LPU?
2025年末,英偉達(NVIDIA)以約 200 億美元的對價(現(xiàn)金+股權(quán)激勵)與 AI 推理初創(chuàng)公司 Groq 達成深度技術(shù)許可協(xié)議,并以“Acqui-hire(收購式招聘)”模式收編了其超過 80% 的核心工程團隊。這筆交易的價格高出 Groq 此前估值的近 3 倍。
深層邏輯探究:
英偉達為何急于“吞噬”一個曾經(jīng)的挑戰(zhàn)者?答案不在于算力(TOPS),而在于“確定性(Determinism)”。
戰(zhàn)略防御:Groq 的 LPU(語言處理單元)是目前唯一在物理架構(gòu)上能對 GPU 推理形成“代差”威脅的技術(shù)。英偉達必須封鎖任何讓 AMD、谷歌或亞馬遜通過收購此類架構(gòu)實現(xiàn)“推理側(cè)彎道超車”的可能性。
范式補完: 傳統(tǒng)的 GPU 擅長“吞吐量(Throughput)”,即一次性處理多少數(shù)據(jù);而未來的 Agentic AI(智能體)要求的是“延遲(Latency)”,即 AI 反應(yīng)有多快。收編 Groq,意味著英偉達完成了從“算力重工廠”向“實時神經(jīng)中樞”的屬性進化。
大模型推理中出現(xiàn)的“打字機式”卡頓,本質(zhì)上是由于傳統(tǒng) GPU 架構(gòu)在處理逐個 Token 生成時遇到了“內(nèi)存墻(Memory Wall)”。
2.1 SRAM vs. HBM:物理維度的降維打擊
英偉達Blackwell 架構(gòu)依賴 HBM(高帶寬內(nèi)存),數(shù)據(jù)需在片外顯存與計算核心間往返。而Groq LPU 采用的是 SRAM(靜態(tài)隨機存取存儲器) 片上集成。
維度
NVIDIA GPU (HBM3e)
Groq LPU (集成 SRAM)
對推理的影響
內(nèi)存帶寬
~3.5 TB/s
~80 TB/s
消除數(shù)據(jù)搬運等待,實現(xiàn)“秒回”
調(diào)度方式
硬件動態(tài)調(diào)度(非確定性)
軟件編譯器調(diào)度(確定性)
消除延遲抖動,提供極速穩(wěn)定的 Token 流
首 Token 延遲
~500ms+
<200ms (感知極限以下)
讓 AI 對話不再有“非人類”的停頓感
2.2 “確定性計算”的魔力
核心追問:為什么 GPU 的延遲會有“抖動”? 傳統(tǒng) GPU 內(nèi)部存在復(fù)雜的硬件調(diào)度器和分支預(yù)測,數(shù)據(jù)流向像隨機的交通流量。而 LPU 通過編譯器在編譯階段就精確規(guī)劃了每一比特數(shù)據(jù)在芯片內(nèi)每一納秒的位置。 結(jié)論: 這種“時態(tài)指令集(TISC)”讓計算過程透明化。整合該技術(shù)后,英偉達能在未來的 Rubin 架構(gòu) 中引入“GPU(存權(quán)重)+ LPU(處理流)”的混合設(shè)計,徹底抹平 AI 的“思考感”。3. 戰(zhàn)略版圖:從數(shù)據(jù)中心到邊緣側(cè)的“毫秒級霸權(quán)”
英偉達此舉并非孤立的補強,而是其2025-2026 戰(zhàn)略藍圖(智能體、實時 AI、主權(quán) AI)的核心支撐。
3.1 具身智能的“反射弧”革命
對于搭載 Jetson Thor 平臺的機器人(物理 AI)而言,延遲是“生死線”。
應(yīng)用場景: 機器人的避障、抓取和語音交互需要亞毫秒級的確定性反饋。
整合效益: 通過 LPU 技術(shù),英偉達賦予了機器人接近生物本能的反應(yīng)速度,使其能實時理解復(fù)雜物理環(huán)境并做出決策,而非等待云端返回。
在全球貿(mào)易不確定性下,HBM 與 CoWoS 封裝是極其脆弱的瓶頸。
解耦意圖: Groq 的 SRAM 架構(gòu)不依賴頂尖的 HBM 產(chǎn)能,甚至可在更成熟的工藝節(jié)點上實現(xiàn)極高性能。
主權(quán)賦能: 英偉達借此可向?qū)?strong>供應(yīng)鏈敏感的國家提供“不依賴核心存儲進口”的高性能推理卡,從而加速全球“主權(quán) AI 工廠”的建設(shè)。
英偉達進入“確定性計算”賽道,是對競爭格局的一次重新洗牌。
4.1 對競爭對手的沖擊
AMD MI300/400: AMD 試圖通過拼 HBM 容量來對抗英偉達,但英偉達通過 LPU 直接跳出了 HBM 競賽,開辟了“確定性延遲”的新維度。
云廠商自研芯片(TPU/Inferentia): 云廠商原本通過低成本 ASIC 尋找生存空間,但英偉達現(xiàn)在不僅擁有生態(tài)(CUDA),還擁有了比自研芯片更快的推理內(nèi)核。
具身智能: 毫秒級閉環(huán)控制成為標配。
實時金融: 在高頻交易中,利用深度學習模型進行“確定的”微秒級策略推演。
智能體工業(yè)化: 賦能能夠獨立思考、反思并瞬間執(zhí)行的多步推理智能體。
通過這筆 200 億美元的交易,英偉達完成了其商業(yè)版圖的最后一次大拼圖。
專家觀點: 英偉達不再僅僅是提供算力的“重工業(yè)基地”,而是正在進化為定義“實時交互標準”的全球神經(jīng)中樞。
當計算不再有抖動,當 AI 的響應(yīng)速度超越人類神經(jīng)傳導(dǎo),英偉達便確立了其在未來十年“實時 AI 霸權(quán)”的絕對統(tǒng)治地位。這場交易宣告了 AI 芯片競爭的終局:上半場比拼誰能算得準,下半場比拼誰能回得快。而英偉達,已經(jīng)同時掌握了這兩張底牌。
*本文依據(jù)網(wǎng)絡(luò)搜集數(shù)據(jù)整理,由AI工具輔助完成
All rights reserved. Copyright ? 2025
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.