網易首頁 > 網易號 > 正文申請入駐

行業觀察｜英偉達 200 億美元整合 Groq——定義“實時智能”的權力終局

2026-01-04 07:02:06　來源: 創新文化促進會

北京舉報

分享至

——這是一場以“金錢換時間”的防御性清場，標志著 AI 計算范式從“暴力并行的訓練時代”向“極致延遲的推理時代”徹底轉型的里程碑。

1. 引言：為何英偉達不計代價鎖定 LPU？

2025年末，英偉達（NVIDIA）以約 200 億美元的對價（現金+股權激勵）與 AI 推理初創公司 Groq 達成深度技術許可協議，并以“Acqui-hire（收購式招聘）”模式收編了其超過 80% 的核心工程團隊。這筆交易的價格高出 Groq 此前估值的近 3 倍。

深層邏輯探究：
英偉達為何急于“吞噬”一個曾經的挑戰者？答案不在于算力（TOPS），而在于“確定性（Determinism）”。

戰略防御：Groq 的 LPU（語言處理單元）是目前唯一在物理架構上能對 GPU 推理形成“代差”威脅的技術。英偉達必須封鎖任何讓 AMD、谷歌或亞馬遜通過收購此類架構實現“推理側彎道超車”的可能性。
范式補完：傳統的 GPU 擅長“吞吐量（Throughput）”，即一次性處理多少數據；而未來的 Agentic AI（智能體）要求的是“延遲（Latency）”，即 AI 反應有多快。收編 Groq，意味著英偉達完成了從“算力重工廠”向“實時神經中樞”的屬性進化。

2. 技術核心：SRAM 與確定性計算如何消除“思考感”？

大模型推理中出現的“打字機式”卡頓，本質上是由于傳統 GPU 架構在處理逐個 Token 生成時遇到了“內存墻（Memory Wall）”。

2.1 SRAM vs. HBM：物理維度的降維打擊

英偉達Blackwell 架構依賴 HBM（高帶寬內存），數據需在片外顯存與計算核心間往返。而Groq LPU 采用的是 SRAM（靜態隨機存取存儲器）片上集成。

維度

NVIDIA GPU (HBM3e)

Groq LPU (集成 SRAM)

對推理的影響

內存帶寬

~3.5 TB/s

~80 TB/s

消除數據搬運等待，實現“秒回”

調度方式

硬件動態調度（非確定性）

軟件編譯器調度（確定性）

消除延遲抖動，提供極速穩定的 Token 流

首 Token 延遲

~500ms+

<200ms (感知極限以下)

讓 AI 對話不再有“非人類”的停頓感

2.2 “確定性計算”的魔力

核心追問：為什么 GPU 的延遲會有“抖動”？傳統 GPU 內部存在復雜的硬件調度器和分支預測，數據流向像隨機的交通流量。而 LPU 通過編譯器在編譯階段就精確規劃了每一比特數據在芯片內每一納秒的位置。結論：這種“時態指令集（TISC）”讓計算過程透明化。整合該技術后，英偉達能在未來的 Rubin 架構中引入“GPU（存權重）+ LPU（處理流）”的混合設計，徹底抹平 AI 的“思考感”。

3. 戰略版圖：從數據中心到邊緣側的“毫秒級霸權”

英偉達此舉并非孤立的補強，而是其2025-2026 戰略藍圖（智能體、實時 AI、主權 AI）的核心支撐。

3.1 具身智能的“反射弧”革命

對于搭載 Jetson Thor 平臺的機器人（物理 AI）而言，延遲是“生死線”。

應用場景：機器人的避障、抓取和語音交互需要亞毫秒級的確定性反饋。
整合效益：通過 LPU 技術，英偉達賦予了機器人接近生物本能的反應速度，使其能實時理解復雜物理環境并做出決策，而非等待云端返回。

3.2 主權 AI 與供應鏈解耦

在全球貿易不確定性下，HBM 與 CoWoS 封裝是極其脆弱的瓶頸。

解耦意圖： Groq 的 SRAM 架構不依賴頂尖的 HBM 產能，甚至可在更成熟的工藝節點上實現極高性能。
主權賦能：英偉達借此可向對供應鏈敏感的國家提供“不依賴核心存儲進口”的高性能推理卡，從而加速全球“主權 AI 工廠”的建設。

4. 行業影響：降維打擊與生態收割

英偉達進入“確定性計算”賽道，是對競爭格局的一次重新洗牌。

4.1 對競爭對手的沖擊

AMD MI300/400： AMD 試圖通過拼 HBM 容量來對抗英偉達，但英偉達通過 LPU 直接跳出了 HBM 競賽，開辟了“確定性延遲”的新維度。
云廠商自研芯片（TPU/Inferentia）：云廠商原本通過低成本 ASIC 尋找生存空間，但英偉達現在不僅擁有生態（CUDA），還擁有了比自研芯片更快的推理內核。

4.2 顛覆性應用領域

具身智能：毫秒級閉環控制成為標配。
實時金融：在高頻交易中，利用深度學習模型進行“確定的”微秒級策略推演。
智能體工業化：賦能能夠獨立思考、反思并瞬間執行的多步推理智能體。

5. 結論：英偉達的新角色——全球實時智能神經中樞

通過這筆 200 億美元的交易，英偉達完成了其商業版圖的最后一次大拼圖。

專家觀點：英偉達不再僅僅是提供算力的“重工業基地”，而是正在進化為定義“實時交互標準”的全球神經中樞。

當計算不再有抖動，當 AI 的響應速度超越人類神經傳導，英偉達便確立了其在未來十年“實時 AI 霸權”的絕對統治地位。這場交易宣告了 AI 芯片競爭的終局：上半場比拼誰能算得準，下半場比拼誰能回得快。而英偉達，已經同時掌握了這兩張底牌。

*本文依據網絡搜集數據整理，由AI工具輔助完成

All rights reserved. Copyright ? 2025

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.