![]()
今年天津智博會釋放了一個再明顯不過的信號:AI基礎設施的競爭,正在從“低精度訓練時代”硬生生地拽進“全精度融合時代”。
過去三年,大模型熱潮把整個行業綁在了一條單一賽道上:訓練更大的模型。基礎設施幾乎只做一件事——如何更低精度、更高吞吐地“跑數”。華為384超節點是那個階段最耀眼的產物。它用芯片、框架、網絡的垂直整合,硬生生把國產AI訓練能力拽到了超節點級別。
但行業已經變天了。
今年,AI一頭扎進了藥物研發、蛋白質折疊、材料模擬、量子化學——不再是陪人聊天,而是開始理解世界。這些場景不講“概率誤差”,不認“差不多就行”。分子結構偏一點,仿真結果錯一次,整個研究就可以直接報廢。
大模型可以用FP16/BF16賭個概率,科學計算不行。中國工程院院士錢德沛早就把話說透了:算網融合、智算融合是必由之路。張云泉也反復建議:走超智融合,建全精度、高互聯的智算中心。
于是,一個被擱置太久的能力被重新拽回牌桌:全精度計算。這不是在低精度上修修補補,而是要求系統在高精度科學計算和低精度AI訓練之間來回切換、動態協同,支撐“仿真—訓練—驗證”的全流程閉環。這也解釋了為什么今年智博會上“超智融合”突然炸成熱詞——因為舊邏輯已經跑不通了。
而在這個新邏輯下,不同廠商的處境,殘酷得一目了然。
華為不是沒看見風向變了。它近期也把“超算+智算”寫進了戰略。但問題是:它的硬件天生就不是干這個活的。昇騰NPU從設計第一天起,就是為低精度矩陣運算優化的——跑大模型一把好手,但不擅長應對FP64雙精度、科學計算需要的數值穩定性。這種ASIC架構在AI訓練上確實高效,可一旦任務從“訓模型”變成“算科學題”,它就成了最別扭的那一環。
也有分析指出:華為最近考慮從ASIC轉向GPGPU、甚至要兼容CUDA生態,不是主動升級,是被現實逼著補課。換句話說,在大模型時代攢起來的領先身位,到了超智融合的牌桌上,不僅不靈,反而成了拖累。
而反觀那些本來就扎根超算、做系統集成的廠商,反而像魚回到水里。這次智博會,中科曙光真機展出了scaleX萬卡超集群,成為展會焦點。與前者不同的是,scaleX萬卡超集群從設計之初就是為全精度設計的——FP8到FP64全覆蓋,算、存、網、電、冷、管、軟全鏈條自研,系統可用性99.99%。拼的不是芯片或或一個環節的長短,而是整個系統的穩定性和協同效率。
結論已經越來越清楚:大模型時代,華為靠垂直整合贏了上半場。但AI進入實體產業后,比賽規則徹底換了——不再是“低精度訓練多快”,而是“全精度系統多穩”。后者恰恰是華為當前最明顯的短板。它現在的轉型動作本身,就是最誠實的自白:原來的路,走不通了。
當然,中國AI不可能只有一種芯片、一條路線。但產業風向已經明牌了——誰能在全精度融合上真正站穩,誰才有資格定義下一個時代。而這背后,是“東數西算”“人工智能+”“AI賦能科學研究”這些國家政策在硬推著產業往前走。當AI變成新的科學工具、新的工業能力,基礎設施的淘汰賽,其實已經開始了。
中國AI基礎設施,正在從“追趕時代”切換成“定義時代”——但不是所有人都能跟上這班車。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.