“別再瞎糾結中美AI到底差幾年了,本質根本不一樣:別人是畫整體設計圖紙、定底層規則框架的,我們更多只是照著圖紙蓋房子、搞搭建落地。”
2026年春天的一場閉門行業研討會上,DeepSeek創始人梁文鋒說了這幾句話。據說,全場沉默了很長時間。
不是沒人想接話,而是所有人都知道——他說的是真話。
![]()
此時此刻,國內AI行業正在經歷一輪前所未有的狂歡。大模型發布會一場接一場,PPT上的跑分數據一次比一次高,論文數量曲線陡峭得像要沖出坐標系。臺下閃光燈連成一片,臺上演講者信心滿滿:我們離GPT-5只有一步之遙了,我們已經實現了對國外主流模型的全面超越,我們即將迎來中國AI的“iPhone時刻”。
可當喧囂散去,當聚光燈熄滅,一個赤裸裸的問題始終橫亙在所有人面前:我們蓋了那么多高樓,有幾棟樓的地基是自己挖的?
一、圖紙與房子的比喻:到底差在哪?
梁文鋒的比喻一針見血。
畫圖紙的人,決定了這棟樓有多高、用什么結構、哪里是承重墻、哪里是逃生通道。他掌握的是底層邏輯和頂層設計。而照著圖紙蓋房子的人,可以在裝修上極盡精美,可以把外墻貼得金碧輝煌,甚至可以優化施工流程、提高蓋樓速度——但所有的“優化”都必須在圖紙劃定的邊界之內。
放到AI領域,所謂的“圖紙”就是基礎理論、核心架構、底層框架。Transformer——今天幾乎所有大模型的基石——是Google團隊在2017年畫出來的。那是整個AI行業的“原始設計圖”。所有基于Transformer的改進、變體、優化,都只是在這張圖紙上進行裝修和局部改造。我們引以為傲的“千億參數”、“萬億tokens”、“跑分第一”,本質上都是在別人定好的規則體系里刷成績。
而所謂的“蓋房子”,就是基于開源框架和成熟硬件,快速做出應用、工程優化、商業模式。周鴻祎今年在一次公開對話中直言不諱:“人家一開源、放出基礎東西,我們這邊馬上就能跟著往前跑、做出東西。”這句話的潛臺詞再清楚不過:如果哪天對方不開源了呢?
英偉達一更新軟硬件生態,國內AI公司就得排隊搶芯片、找代購、囤算力。CUDA生態是英偉達幾十年建起來的護城河,國內至今沒有任何一家公司能望其項背。OpenAI拿出GPT系列,我們可以在三個月內復現一個“接近”的模型;但下一次范式革命——比如從Transformer走向新的架構——會由誰引爆?
答案似乎并不令人樂觀。
二、狂歡的B面:論文、跑分與“虛假的安全感”
從數據上看,中國AI確實在“高速發展”。
每年的AI頂會論文數量,中國學者貢獻的占比穩居世界前列。根據斯坦福大學《AI指數2025》報告,中國發表的AI論文數量占全球30%以上,在計算機視覺、自然語言處理等熱門方向甚至超過美國。專利申請量同樣遙遙領先。
大模型方面,國內已發布的參數規模超過百億的大模型超過200個,“百模大戰”從2023年打到了2026年,仍未分出勝負。每次發布會,必然有“超越GPT-4”、“達到國際領先水平”之類的表述。跑分榜單上,中文評測集里國產模型往往包攬前幾名——雖然很多評測集的公允性本身就在業內飽受爭議。
但論文數量不等于創新能力。一個反復被提及的殘酷事實是:從深度學習爆發至今,真正意義上的“原始創新”——反向傳播、卷積神經網絡、殘差網絡、注意力機制、Transformer、擴散模型、RLHF——幾乎全部來自美國、加拿大、英國等國家的研究機構和公司。中國學者貢獻了大量“增量創新”——在已有架構上做改進、做調優、做應用——但底層的“從0到1”,始終稀缺。
這帶來了一個危險的錯覺:當你在別人畫好的圖紙上把房子蓋得又高又快,你很容易誤以為自己就是建筑大師。直到有一天,圖紙的主人決定換個新圖紙,而你手里的舊圖紙瞬間變成廢紙。
梁文鋒的沉默時刻,正是戳破了這層虛假的安全感。
三、規則的權力:為什么“話語權”比“跑分”重要一萬倍?
“畫圖紙”之所以比“蓋房子”重要,不僅僅是因為技術上的先發優勢,更因為誰定義底層規則,誰就掌握了整個行業的游戲規則。
以芯片為例。英偉達的CUDA生態不僅僅是“讓顯卡能跑AI計算”那么簡單。它是一整套編程語言、編譯器、庫函數、優化工具、開發者社區。成千上萬的AI工程師習慣了“寫CUDA”這個動作,就像呼吸一樣自然。即使明天出現一款性能超越英偉達的國產AI芯片,只要它不能無縫運行CUDA代碼,絕大多數開發者就會拒絕遷移。這不是技術水平的問題,這是生態慣性——而生態慣性,是由最先畫圖紙的那個人決定的。
大模型框架同樣如此。PyTorch和TensorFlow兩大框架統治了全球AI開發者的日常工作流。雖然國內也有深度學習框架(如飛槳PaddlePaddle),但國際論文、開源項目、預訓練模型幾乎默認基于PyTorch。這意味著,任何脫離PyTorch的嘗試,都要付出巨大的兼容性成本。
Transformer架構更是如此。所有的注意力機制改進、位置編碼變體、稀疏注意力優化,都是在Transformer這張圖紙上的“裝修”。當OpenAI或Google的下一個團隊推出一套全新的架構——比如某種超越注意力的更高效機制——國內的大模型公司就必須立刻跟上,否則就會在下一代技術競賽中掉隊。
這就是“圖紙持有者”的權力:他可以在任何時候改變賽道,而所有“蓋房子”的人只能被動跟隨。這不是用“努力”或“資金”就能彌補的差距——這是結構性的、系統性的、規則制定權帶來的代差。
四、為什么我們只能“蓋房子”?
這個問題遠比表面復雜。
首先是基礎研究的投入周期問題。 畫圖紙需要的是“坐冷板凳”的定力。Transformer從論文發表到引爆GPT熱潮,中間隔了五年以上。擴散模型最早提出于2015年,真正成為圖像生成的主流方法是2022年以后的事。底層創新往往要經歷漫長的“無人問津期”,而國內無論是資本還是評價體系,都更青睞短周期、快回報的“應用型成果”。一篇頂會論文的周期是一到兩年,一項底層突破的周期可能是十年。在“非升即走”的考核壓力下,有多少學者敢把十年押在一個看不見結果的方向上?
其次是產業環境的差異。 美國有硅谷,有從半導體設備到設計軟件到云服務的完整鏈條,有愿意為“高風險、高回報”的底層技術長期投資的資本。而國內的風險投資更習慣“復制一個美國模式”的套利邏輯,對于“沒有人驗證過”的技術方向,往往敬而遠之。
再者是人才結構的偏向。 我們的教育體系培養了大量優秀的“工程師”——他們擅長調參、優化、工程實現,但真正敢于挑戰基礎理論、提出全新框架的“科學家”比例偏低。這不是智力問題,這是文化、激勵機制和學術生態共同作用的結果。
梁文鋒本人的DeepSeek,恰恰是這種結構性困境中的一個“異類”。DeepSeek在MLA(多頭潛在注意力)架構上的創新,在MoE(混合專家模型)工程化落地上的突破,都是“在現有圖紙上做出了精妙的局部創新”。但即便這樣,DeepSeek依然離不開Transformer這個底層框架,依然離不開PyTorch這個開發環境,依然離不開英偉達的GPU——雖然他們通過PTX層級的極致優化,把H800的性能壓榨到了極限。這種“戴著鐐銬跳舞”的極致努力值得尊敬,但它恰恰反襯出“鐐銬”本身的存在。
五、出路在哪里:從“蓋房子”到“畫圖紙”有多遠?
意識到問題,是解決問題的第一步。
梁文鋒的話之所以能讓全場沉默,是因為它擊中了行業最深處的焦慮。大家都在狂歡,但沒有人真的敢問:狂歡之后呢?
![]()
短期內,我們必須清醒地認識到:在可預見的未來,我們仍然需要“蓋房子”。AI領域的應用落地、場景創新、產業結合,正是中國的強項。龐大的內需市場、豐富的垂直行業、海量的數據資源,決定了中國在“AI+產業”這條路上有巨大的空間。蓋好房子、做好裝修、服務好用戶,本身就有不可替代的價值。
但長期來看,“只蓋房子”是不夠的。如果始終拿不到圖紙的繪制權,我們永遠都是產業鏈的“執行端”而非“定義端”。一旦國際地緣政治環境進一步惡化——開源許可證不再開放、芯片供應徹底切斷、基礎軟件生態被隔離——我們蓋好的所有房子都可能瞬間失去支撐。
真正的破局點在于:在“蓋房子”的同時,悄悄開始畫自己的圖紙。 這意味著需要重新審視基礎研究的投入邏輯。不是要求所有研究者都去做“從0到1”的冒險,而是要為那些敢于冒險的人提供足夠長的跑道、足夠多的耐心、足夠寬容的評價體系。
這同樣意味著需要構建自主的軟硬件生態。CUDA很難替代,但不代表永遠不能替代。華為昇騰、寒武紀、壁仞等國產芯片廠商正在艱難地培育自己的軟件棧;百度飛槳、華為MindSpore等國產框架也在逐步完善。這條路極其漫長,甚至需要一代人的努力——但如果不走,就永遠不會有走通的一天。
梁文鋒的沉默時刻,是一次難得的行業集體自省。它提醒我們:在AI這個賽道上,跑分和論文不是終點,PPT和發布會也不是終點。真正的終點,是有一天我們也能拿出一張全新的“圖紙”——不是Transformer的改進版,不是CUDA的翻版,而是真正意義上的、定義下一代AI的基礎設計。
那一天還很遠。但至少,我們已經停止了自我欺騙。
“我們堆的高度再多、表面數據再好看,底層的根、核心的源頭話語權,依然牢牢攥在別人手里。”
唯有承認差距,才能走向超越。唯有正視沉默,才能打破沉默。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.