網易首頁 > 網易號 > 正文申請入駐

梁文鋒的“圖紙之問”：當AI狂歡落幕，我們才聽懂那句沉默

2026-05-29 19:20:33　來源: 民間胡扯老哥

廣東舉報

分享至

“別再瞎糾結中美AI到底差幾年了，本質根本不一樣：別人是畫整體設計圖紙、定底層規則框架的，我們更多只是照著圖紙蓋房子、搞搭建落地。”

2026年春天的一場閉門行業研討會上，DeepSeek創始人梁文鋒說了這幾句話。據說，全場沉默了很長時間。

不是沒人想接話，而是所有人都知道——他說的是真話。

此時此刻，國內AI行業正在經歷一輪前所未有的狂歡。大模型發布會一場接一場，PPT上的跑分數據一次比一次高，論文數量曲線陡峭得像要沖出坐標系。臺下閃光燈連成一片，臺上演講者信心滿滿：我們離GPT-5只有一步之遙了，我們已經實現了對國外主流模型的全面超越，我們即將迎來中國AI的“iPhone時刻”。

可當喧囂散去，當聚光燈熄滅，一個赤裸裸的問題始終橫亙在所有人面前：我們蓋了那么多高樓，有幾棟樓的地基是自己挖的？

一、圖紙與房子的比喻：到底差在哪？

梁文鋒的比喻一針見血。

畫圖紙的人，決定了這棟樓有多高、用什么結構、哪里是承重墻、哪里是逃生通道。他掌握的是底層邏輯和頂層設計。而照著圖紙蓋房子的人，可以在裝修上極盡精美，可以把外墻貼得金碧輝煌，甚至可以優化施工流程、提高蓋樓速度——但所有的“優化”都必須在圖紙劃定的邊界之內。

放到AI領域，所謂的“圖紙”就是基礎理論、核心架構、底層框架。Transformer——今天幾乎所有大模型的基石——是Google團隊在2017年畫出來的。那是整個AI行業的“原始設計圖”。所有基于Transformer的改進、變體、優化，都只是在這張圖紙上進行裝修和局部改造。我們引以為傲的“千億參數”、“萬億tokens”、“跑分第一”，本質上都是在別人定好的規則體系里刷成績。

而所謂的“蓋房子”，就是基于開源框架和成熟硬件，快速做出應用、工程優化、商業模式。周鴻祎今年在一次公開對話中直言不諱：“人家一開源、放出基礎東西，我們這邊馬上就能跟著往前跑、做出東西。”這句話的潛臺詞再清楚不過：如果哪天對方不開源了呢？

英偉達一更新軟硬件生態，國內AI公司就得排隊搶芯片、找代購、囤算力。CUDA生態是英偉達幾十年建起來的護城河，國內至今沒有任何一家公司能望其項背。OpenAI拿出GPT系列，我們可以在三個月內復現一個“接近”的模型；但下一次范式革命——比如從Transformer走向新的架構——會由誰引爆？

答案似乎并不令人樂觀。

二、狂歡的B面：論文、跑分與“虛假的安全感”

從數據上看，中國AI確實在“高速發展”。

每年的AI頂會論文數量，中國學者貢獻的占比穩居世界前列。根據斯坦福大學《AI指數2025》報告，中國發表的AI論文數量占全球30%以上，在計算機視覺、自然語言處理等熱門方向甚至超過美國。專利申請量同樣遙遙領先。

大模型方面，國內已發布的參數規模超過百億的大模型超過200個，“百模大戰”從2023年打到了2026年，仍未分出勝負。每次發布會，必然有“超越GPT-4”、“達到國際領先水平”之類的表述。跑分榜單上，中文評測集里國產模型往往包攬前幾名——雖然很多評測集的公允性本身就在業內飽受爭議。

但論文數量不等于創新能力。一個反復被提及的殘酷事實是：從深度學習爆發至今，真正意義上的“原始創新”——反向傳播、卷積神經網絡、殘差網絡、注意力機制、Transformer、擴散模型、RLHF——幾乎全部來自美國、加拿大、英國等國家的研究機構和公司。中國學者貢獻了大量“增量創新”——在已有架構上做改進、做調優、做應用——但底層的“從0到1”，始終稀缺。

這帶來了一個危險的錯覺：當你在別人畫好的圖紙上把房子蓋得又高又快，你很容易誤以為自己就是建筑大師。直到有一天，圖紙的主人決定換個新圖紙，而你手里的舊圖紙瞬間變成廢紙。

梁文鋒的沉默時刻，正是戳破了這層虛假的安全感。

三、規則的權力：為什么“話語權”比“跑分”重要一萬倍？

“畫圖紙”之所以比“蓋房子”重要，不僅僅是因為技術上的先發優勢，更因為誰定義底層規則，誰就掌握了整個行業的游戲規則。

以芯片為例。英偉達的CUDA生態不僅僅是“讓顯卡能跑AI計算”那么簡單。它是一整套編程語言、編譯器、庫函數、優化工具、開發者社區。成千上萬的AI工程師習慣了“寫CUDA”這個動作，就像呼吸一樣自然。即使明天出現一款性能超越英偉達的國產AI芯片，只要它不能無縫運行CUDA代碼，絕大多數開發者就會拒絕遷移。這不是技術水平的問題，這是生態慣性——而生態慣性，是由最先畫圖紙的那個人決定的。

大模型框架同樣如此。PyTorch和TensorFlow兩大框架統治了全球AI開發者的日常工作流。雖然國內也有深度學習框架（如飛槳PaddlePaddle），但國際論文、開源項目、預訓練模型幾乎默認基于PyTorch。這意味著，任何脫離PyTorch的嘗試，都要付出巨大的兼容性成本。

Transformer架構更是如此。所有的注意力機制改進、位置編碼變體、稀疏注意力優化，都是在Transformer這張圖紙上的“裝修”。當OpenAI或Google的下一個團隊推出一套全新的架構——比如某種超越注意力的更高效機制——國內的大模型公司就必須立刻跟上，否則就會在下一代技術競賽中掉隊。

這就是“圖紙持有者”的權力：他可以在任何時候改變賽道，而所有“蓋房子”的人只能被動跟隨。這不是用“努力”或“資金”就能彌補的差距——這是結構性的、系統性的、規則制定權帶來的代差。

四、為什么我們只能“蓋房子”？

這個問題遠比表面復雜。

首先是基礎研究的投入周期問題。畫圖紙需要的是“坐冷板凳”的定力。Transformer從論文發表到引爆GPT熱潮，中間隔了五年以上。擴散模型最早提出于2015年，真正成為圖像生成的主流方法是2022年以后的事。底層創新往往要經歷漫長的“無人問津期”，而國內無論是資本還是評價體系，都更青睞短周期、快回報的“應用型成果”。一篇頂會論文的周期是一到兩年，一項底層突破的周期可能是十年。在“非升即走”的考核壓力下，有多少學者敢把十年押在一個看不見結果的方向上？

其次是產業環境的差異。美國有硅谷，有從半導體設備到設計軟件到云服務的完整鏈條，有愿意為“高風險、高回報”的底層技術長期投資的資本。而國內的風險投資更習慣“復制一個美國模式”的套利邏輯，對于“沒有人驗證過”的技術方向，往往敬而遠之。

再者是人才結構的偏向。我們的教育體系培養了大量優秀的“工程師”——他們擅長調參、優化、工程實現，但真正敢于挑戰基礎理論、提出全新框架的“科學家”比例偏低。這不是智力問題，這是文化、激勵機制和學術生態共同作用的結果。

梁文鋒本人的DeepSeek，恰恰是這種結構性困境中的一個“異類”。DeepSeek在MLA（多頭潛在注意力）架構上的創新，在MoE（混合專家模型）工程化落地上的突破，都是“在現有圖紙上做出了精妙的局部創新”。但即便這樣，DeepSeek依然離不開Transformer這個底層框架，依然離不開PyTorch這個開發環境，依然離不開英偉達的GPU——雖然他們通過PTX層級的極致優化，把H800的性能壓榨到了極限。這種“戴著鐐銬跳舞”的極致努力值得尊敬，但它恰恰反襯出“鐐銬”本身的存在。

五、出路在哪里：從“蓋房子”到“畫圖紙”有多遠？

意識到問題，是解決問題的第一步。

梁文鋒的話之所以能讓全場沉默，是因為它擊中了行業最深處的焦慮。大家都在狂歡，但沒有人真的敢問：狂歡之后呢？

短期內，我們必須清醒地認識到：在可預見的未來，我們仍然需要“蓋房子”。AI領域的應用落地、場景創新、產業結合，正是中國的強項。龐大的內需市場、豐富的垂直行業、海量的數據資源，決定了中國在“AI+產業”這條路上有巨大的空間。蓋好房子、做好裝修、服務好用戶，本身就有不可替代的價值。

但長期來看，“只蓋房子”是不夠的。如果始終拿不到圖紙的繪制權，我們永遠都是產業鏈的“執行端”而非“定義端”。一旦國際地緣政治環境進一步惡化——開源許可證不再開放、芯片供應徹底切斷、基礎軟件生態被隔離——我們蓋好的所有房子都可能瞬間失去支撐。

真正的破局點在于：在“蓋房子”的同時，悄悄開始畫自己的圖紙。這意味著需要重新審視基礎研究的投入邏輯。不是要求所有研究者都去做“從0到1”的冒險，而是要為那些敢于冒險的人提供足夠長的跑道、足夠多的耐心、足夠寬容的評價體系。

這同樣意味著需要構建自主的軟硬件生態。CUDA很難替代，但不代表永遠不能替代。華為昇騰、寒武紀、壁仞等國產芯片廠商正在艱難地培育自己的軟件棧；百度飛槳、華為MindSpore等國產框架也在逐步完善。這條路極其漫長，甚至需要一代人的努力——但如果不走，就永遠不會有走通的一天。

梁文鋒的沉默時刻，是一次難得的行業集體自省。它提醒我們：在AI這個賽道上，跑分和論文不是終點，PPT和發布會也不是終點。真正的終點，是有一天我們也能拿出一張全新的“圖紙”——不是Transformer的改進版，不是CUDA的翻版，而是真正意義上的、定義下一代AI的基礎設計。

那一天還很遠。但至少，我們已經停止了自我欺騙。

“我們堆的高度再多、表面數據再好看，底層的根、核心的源頭話語權，依然牢牢攥在別人手里。”

唯有承認差距，才能走向超越。唯有正視沉默，才能打破沉默。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.