中美AI的差距到底有多大?上周在清華舉辦的一場內(nèi)部研討會上,國內(nèi)一些核心AI參與者給出了明顯不同于公開輿論場的判斷。
過去一年來,國內(nèi)大模型追得很快、差距只剩半年的聲音,頻繁出現(xiàn)在行業(yè)討論與公眾輿論中。從榜單、跑分、Demo 演示來看,似乎構(gòu)成了一套高度可見的比較體系,也在無形中影響著大家對中美 AI 實力的整體認(rèn)知。
但這場聚集了國內(nèi)大模型全明星陣容的討論,顯然給出了更接近真實情況的判斷。從參會嘉賓的組成,大家就能感受到這個判斷的分量:智譜唐杰、Kimi楊植麟、阿里林俊旸,還有回國后首次公開亮相的姚順雨。
這不是一場商業(yè)峰會,而是定位于高規(guī)格的學(xué)術(shù)交流,所以大家在相對封閉、坦誠的語境里,更能直視中美AI的真實差距:我們現(xiàn)實中看到的中美差距,可能只是“卷面分?jǐn)?shù)”,而真實的差距恰恰隱藏在榜單數(shù)據(jù)背后。
一、為什么說這場討論“有分量”
關(guān)于中美AI的差距,可以說是一個非常有分歧的話題,為什么這場會上的觀點更有分量。從會議的組織和參與方來看,這是由清華大學(xué)基礎(chǔ)模型北京市重點實驗室發(fā)起,面向未來的AGI-Next前沿峰會,來參會的要么是創(chuàng)始人、要么是技術(shù)大拿,以及長期處在一線的學(xué)界研究者。
參會者的分享,也不是普通意義上的PR自家的產(chǎn)品或技術(shù),而是真真實實的聚焦在技術(shù)和前沿趨勢的討論上。前面的分享環(huán)節(jié),智譜唐杰、Kimi楊植麟、阿里林俊旸分別分享了過去一年,在大模型上的探索以及對未來的展望。
而在隨后的圓桌環(huán)節(jié),三位來自一線的唐杰、林俊旸、姚順雨和來自學(xué)界的楊強(qiáng),才真正把“中美 AI 差距”這個話題推向了它應(yīng)有的深度。如果說前面的主題分享,更像是在系統(tǒng)性展示各家在模型、Agent、多模態(tài)等方向上的階段性判斷,那么圓桌討論的價值,則在于這些判斷開始彼此對照、相互校驗。
討論不再停留在“我們做了什么”,而是自然滑向了“為什么我們會走到這里”“哪些地方已經(jīng)出現(xiàn)結(jié)構(gòu)性分叉”。這種討論方式,在公開場合并不多見。尤其值得注意的是,這幾位來自一線的嘉賓在公司內(nèi)部,都是對技術(shù)路徑、組織選擇和長期投入結(jié)果承擔(dān)責(zé)任的人。所以他們關(guān)于中美差距的判斷,不再是情緒化的“追上了 / 被甩開了”結(jié)果式判斷,而是不斷回到一些更底層的問題上:什么樣的智能才算真正有價值?什么樣的能力差距會在未來被放大?
正是在這種多重視角的交叉中,中美 AI 差距的問題,開始顯露出它真正復(fù)雜的一面。它不再只是“模型能力對齊到哪一步”,而是涉及資本耐心、真實場景密度等一整套系統(tǒng)性條件。
二、領(lǐng)先概率只有 20%
論壇上,林俊旸給出的一個數(shù)字,在會后被媒體反復(fù)提及:未來三年,中國大模型處于領(lǐng)先位置的概率,只有20%。這句話之所以引發(fā)關(guān)注,是因為它與過去一年輿論場中不斷強(qiáng)化的樂觀預(yù)期形成了強(qiáng)烈反差。
需要強(qiáng)調(diào)的是,這并不是一個針對單項能力的判斷。無論是在代碼能力、Agent、還是部分評測榜單上,中國模型都已經(jīng)非常接近,甚至在某些維度上實現(xiàn)了階段性超越。林俊旸的判斷,更像是一種系統(tǒng)級概率評估:在模型能力、算力投入、資本耐心、真實使用生態(tài)同時拉開時間維度后,領(lǐng)先只是一個小概率事件。
在討論中,OpenAI多次被作為隱性參照對象出現(xiàn)。并不是因為它在某一個榜單上分?jǐn)?shù)更高,而是因為它在多個關(guān)鍵維度上,形成了高度耦合的正反饋結(jié)構(gòu):強(qiáng)模型 → 高付費意愿 → 更大規(guī)模的算力投入→ 更長時間的前沿探索。
與之相比,中國大模型在開源領(lǐng)域“看起來很亮眼”,但正如唐杰所反復(fù)提醒的那樣,真正決定前沿走向的能力,往往集中在閉源體系之中。而閉源模型所依賴的,不只是技術(shù)判斷本身,還包括長期資本、穩(wěn)定現(xiàn)金流,以及一個愿意為“最強(qiáng)能力”持續(xù)付費的市場環(huán)境。
這也是為什么,“領(lǐng)先概率只有 20%”這句話,并不是在否定努力,而是在戳破一種常見的誤解:榜單上的接近,并不等同于整體競爭態(tài)勢的對等。
三、差距從何而來
如果把論壇上的零散觀點重新梳理,會發(fā)現(xiàn)一個高度一致的結(jié)論:中美AI的差距,并非來自某一個技術(shù)點,而是一整套系統(tǒng)性差異的疊加。
1、投資與基礎(chǔ)設(shè)施
從表面看,中美都在建設(shè)數(shù)據(jù)中心、采購算力、訓(xùn)練模型;但真正的差異在于資本規(guī)模與“耐心”。美國擁有更成熟的耐心資本體系,以及更健康的云服務(wù)付費環(huán)境。云計算的高付費率,使模型公司能夠通過持續(xù)商業(yè)化獲得“回血能力”,從而支撐長期、非線性的技術(shù)投入。
相比之下,國內(nèi)云生態(tài)的付費能力偏弱,決定了模型公司在商業(yè)化尚未成熟之前,很難承受長期高強(qiáng)度投入。這不是短期問題,而是一種結(jié)構(gòu)性約束。
2、算力現(xiàn)實
“美國是富人在搞大模型,中國是窮人在搞大模型。”這句話在論壇現(xiàn)場引發(fā)了不小的共鳴。大模型并不是一次性投入的工程,而是高度依賴長期、穩(wěn)定、冗余算力的產(chǎn)業(yè)。即便是國內(nèi)頭部公司,在算力采購與持續(xù)訓(xùn)練上的自由度,依然受限。
算力不足并不意味著“做不出來”,但意味著每一次嘗試都更謹(jǐn)慎、更功利,也更難承擔(dān)失敗成本。
3、創(chuàng)業(yè)文化與路徑選擇
路徑選擇的差異,同樣深刻影響著技術(shù)邊界。
美國更鼓勵 0 → 1 的高風(fēng)險探索,即便成功率極低,也愿意為可能的范式突破持續(xù)下注;國內(nèi)創(chuàng)業(yè)環(huán)境則更偏好已被驗證的路徑,在明確需求與回報的前提下快速推進(jìn)。
結(jié)果是在被驗證領(lǐng)域進(jìn)展更快,但前沿探索的深度與廣度不足。
四、真正的差距在前沿布局
論壇中最有啟發(fā)性的部分,恰恰不在于當(dāng)下能力的對比,而在于對“時間”的重新理解。
以芯片為例,從架構(gòu)設(shè)計到流片,再到真正落地應(yīng)用,往往需要至少三年時間。這意味著:今天我們看到的算力與模型能力,本質(zhì)上是三年前戰(zhàn)略判斷的結(jié)果。
類似的邏輯同樣適用于大模型。當(dāng)前被廣泛討論的“長期記憶”“復(fù)雜推理”等方向,并非突然出現(xiàn)。事實上,OpenAI 在三年前就已經(jīng)圍繞這些能力進(jìn)行系統(tǒng)性布局。
由此引出一個關(guān)鍵命題:我們看到的差距,是已經(jīng)顯現(xiàn)的差距;真正決定勝負(fù)的,是尚未顯現(xiàn)的差距。
為了幫大家理解這種差距,我們或許可以參照日常生活中一個極具解釋力的隱喻:85分vs 100分。你考85分,代表的是能力上限;而學(xué)霸考 100 分,往往只是卷面上限。
真正的差距不在分?jǐn)?shù),而在于知識結(jié)構(gòu)是否完整;知識密度是否足夠高;能否持續(xù)擴(kuò)展新的能力邊界。中美 AI 的差距,本質(zhì)上更接近后者。中美的AI競賽是一場涵蓋了:芯片、資本、生態(tài)、人才、教育、創(chuàng)業(yè)文化的全棧式競賽。
前者容易被量化,也最容易被討論;后者決定長期走向,卻往往被忽視。
當(dāng)然,討論中美AI差距,并不要唱衰中國AI。從現(xiàn)場的討論中,大家也一致認(rèn)可,中國AI在工程化能力、大規(guī)模落地、復(fù)雜場景適配方面,依然擁有確定性優(yōu)勢。
但共識同樣清晰:AI 是工業(yè)革命級別的長期競賽,而不是三年窗口期的沖刺。真正需要警惕的,也許并不是差距本身,而是我們不能用錯誤的尺度,討論一個長期問題。
如果說過去幾年,我們更多是在追趕“已經(jīng)看得見的能力”,那么這樣的討論至少在提醒我們:下一步該為“還看不見的能力”提前下注了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.