在 AI 時代,芯片作為算力基礎設施的重要性與日俱增。當前,專有指令集架構(ISA)如 x86 和 ARM 在市場中占據主導地位,但其封閉性與高昂授權費用已成為技術創新的桎梏。而開源模塊化的 RISC-V 架構憑借其靈活性和可定制性,正在 AI 領域展現出突破性潛力,有望打破現有市場格局。
近期,RISC-V+AI 領域迎來多個重要進展。
據彭博社報道,由“Zen 之父”、芯片架構設計大師 Jim Keller 領銜的 AI 芯片創企 Tenstorrent 于近日完成了新一輪 6.93 億美元的融資, 由韓國 AFW Partners 和三星證券領投, 亞馬遜創始人貝佐斯的投資公司 Bezos Expeditions、LG 電子、富達等機構跟投, 本輪融資后公司估值達到 26 億美元。這筆資金將用于擴大工程團隊規模、投資全球供應鏈, 并建設大型 AI 訓練服務器。
圖丨 Jim Keller(來源:Tenstorrent)
作為一家志在挑戰英偉達 AI 芯片霸主地位的初創企業,Tenstorrent 采用了與英偉達截然不同的技術路線。Jim Keller 在接受采訪時表示,Tenstorrent 選擇放棄使用高帶寬內存(HBM),轉而采用開源技術和更普及的組件。“如果使用 HBM,就無法在成本上戰勝英偉達,因為英偉達是 HBM 最大的買家,具有成本優勢。”Keller 解釋道,“而且由于 HBM 深度集成在他們的產品和插槽中,他們永遠無法真正降低價格。”
該公司最新推出的基于 RISC-V 架構的 Blackhole 加速器包含 768 個 RISC-V 核心,峰值計算性能可達 745 TFLOPS,超過了英偉達的 A100 和 L40S 加速器。該加速器將整合在 Tenstorrent 正在開發的 Blackhole Galaxy 設備。該機器將配備 32 個 Blackhole 加速器,以 4x8 網格連接,實現 23.8 petaFLOPS FP8 性能、1TB 內存和 16TB/秒原始帶寬。
圖丨 Blackhole Galaxy 的架構(來源:Tenstorrent)
Jim Keller 表示,Tenstorrent 的產品有望比同等性能的 GPU 系統便宜 5 到 10 倍。目前, 公司已與客戶簽訂了總額近 1.5 億美元的合同。雖然與英偉達每季度數百億美元的數據中心收入相比仍有較大差距,但增長勢頭強勁。
與此同時,另一家來自的德國的 RISC-V 初創公司 Ubitium 近期獲得 370 萬美元種子輪融資, 由 Runa Capital、Inflection 和 KBC Focus Fund 共同領投。該公司計劃開發出一種結合 CPU、GPU、DSP 和 FPGA 功能的“通用”處理器。
圖丨 Ubitium 的通用處理器(來源:Ubitium)
該公司首席執行官 Hyun Shin Cho 解釋說:"我們的微處理器架構允許芯片的晶體管被重復用于不同的處理任務,使單個處理器能夠動態適應從簡單控制邏輯到大規模并行數據流處理和 AI 推理等各類工作負載。"
目前,邊緣設備和嵌入式系統通常依賴于集成多個專用處理單元的片上系統 (SoC),包括用于通用任務的 CPU、用于圖形和并行處理的 GPU、用于加速 AI 工作負載的 NPU、用于信號處理的 DSP 以及用于可定制硬件功能的 FPGA。
這種方案雖然可行,但增加了硬件和軟件的復雜性,同時推高了制造成本。更重要的是,當設備沒有運行特定功能時,相應的處理單元會處于閑置狀態,造成硅片面積和能源的浪費。
Ubitium 的通用處理器架構通過將相同的晶體管重復用于各種工作負載來解決這些問題。據 Shin Cho 透露,這種方法可以將系統的性能/成本比提高 10 到 100 倍。"重用晶體管顯著減少了處理器中的總晶體管數量,進一步節省了能源和硅片面積。"
目前,公司已經獲得了 18 項相關專利,并完成了基于 FPGA 仿真的原型驗證。Ubitium 計劃在未來幾個月推出多項目晶圓原型和開發套件,預計在 2026 年向客戶交付首批邊緣計算芯片。
Ubitium 的未來目標是建立一個標準化的計算平臺,簡化開發流程并加速各行業的創新。"我們的工作負載無關處理器能夠在無需硬件修改的情況下適應新的 AI 發展。這將使開發者能夠在現有設備上實現最新的 AI 模型,降低與硬件變更相關的成本和復雜性。" Cho 說。
在國內,RISC-V 的發展也取得了重要進展。近日,中國 AI 芯片初創企業希姆計算在 RISC-V 美國峰會上發布了其 RISC-V 矩陣擴展開源項目的 0.5 版本,成為業內首家向國際社區提交完整 RISC-V 矩陣指令集及配套工具的企業,在底層技術標準制定方面實現重要突破。
圖丨希姆計算的矩陣擴展開源項目發展歷程(來源:RISC-V International)
從技術角度來看,希姆計算最新發布的 RISC-V 矩陣指令集采用了基于 Tile 的矩陣乘法架構設計,通過參數化寄存器架構和模塊化類型系統,能夠適應從邊緣到云端的各類應用場景。該公司還配套更新了一系列開發工具,包括基于 LLVM 的編譯器、基于 Spike 的模擬器、基于 GDB 的調試器,以及基于 SCOOP 平臺的開源核心實現,為開發者提供了完整的工具鏈支持。
這一突破的意義在于,隨著生成式 AI 的興起,矩陣計算已成為核心計算需求。目前主流的 x86、Arm 架構都在推出相應的矩陣指令集擴展,如 Arm 的 SME 和英特爾的 AMX。而開源的 RISC-V 架構因其靈活性和可定制性,被認為很可能成為 AI 時代最理想的指令集架構選擇。在這一背景下,統一的矩陣指令集標準對推動 RISC-V 在 AI 領域的應用具有重要意義。
總體來看,隨著資本的持續涌入與統一標準的制定,RISC-V 生態將迎來更進一步的發展。其開源特性和高度的可定制性,使得開發者能夠根據需求量身定制硬件,降低了創新的門檻,并推動了更加開放、透明的技術生態系統建設。
這種去中心化的特性尤其對中國等后發國家具有重要意義,可以減少對專有技術的依賴,增強技術自主性。隨著更多企業加入這一生態,RISC-V 有望在 AI 時代與傳統指令集架構形成“三足鼎立”之勢,為全球半導體產業帶來新的發展機遇。
參考資料:
1.https://www.theregister.com/2024/12/04/riscv_ai_champion_investment/
2.https://venturebeat.com/data-infrastructure/ubitium-tackles-edge-ai-and-more-with-new-universal-processor/
3.https://riscv.org/blog/2024/11/stream-computing-risc-v-matrix-extension-open-source-project-upgrades-to-version-0-5-supporting-vectormatrix-implementation/
4.https://www.bloomberg.com/news/articles/2024-12-02/jeff-bezos-is-betting-on-ai-chip-startup-tenstorrent-to-take-on-nvidia-nvda?embedded-checkout=true
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.