![]()
昨天下午,騰訊發(fā)布混元Hy3.0 preview語(yǔ)言模型并開源;今天上午,DeepSeek發(fā)布V4預(yù)覽版大模型,二者相隔不到24小時(shí)。
盡管兩款大模型的參數(shù)尺寸差異很大,擅長(zhǎng)能力有所區(qū)別,部署所用的芯片也不同,但發(fā)布時(shí)間幾乎撞車,恰恰值得做些解讀。具體分析如下:
1、先正視一個(gè)基本事實(shí):中美大模型差距,和去年比反而更大了。這不是唱衰,是梁文鋒在V4模型的技術(shù)博客里的原話:"海外廠商前沿模型仍占據(jù)智能上限",部分維度比不過(guò)Claude Opus 4.6。
其實(shí),這話還是保守的,因?yàn)楣乐低黄埔蝗f(wàn)億美元的Anthropic,它還有一張沒亮的底牌——代號(hào)Mythos的下一代模型,因?yàn)檫^(guò)于強(qiáng)大,暫時(shí)被按住沒發(fā)布。
此外,OpenAI的GPT-5.5也發(fā)布了,在和目前 Claude opus4.7相比,GPT-5.5與其至少打個(gè)平手,實(shí)力強(qiáng)悍。也就是說(shuō),目前公開的頂尖模型,V4 其實(shí)都和他們存在差距,至于是兩個(gè)月還是五個(gè)月,就見仁見智了。
但可以確定的是,相比去年1月DeepSeek發(fā)布的V3和R1模型時(shí)相比,中美差距拉大了。
2、梁文鋒的歷史使命:守住安全底線,確保中國(guó)大模型不被卡脖子。雖然 V4的技術(shù)博客沒有寫明,但可以料定,DeepSeek預(yù)訓(xùn)練依然基于英偉達(dá)芯片進(jìn)行,但如博客所示,推理和部署已經(jīng)和華為昇騰實(shí)現(xiàn)了無(wú)縫對(duì)接——這也是V4 版本姍姍來(lái)遲的原因所在。
雖然梁本人在一開始并未預(yù)料到自己的歷史責(zé)任,但在客觀上,DeepSeek 已經(jīng)被整合進(jìn) AI 國(guó)家安全的國(guó)家隊(duì),與華為昇騰進(jìn)行軟硬一體的適配,最終實(shí)現(xiàn)大模型完全自主可控。這是一個(gè)政治目標(biāo),不以個(gè)人意志為轉(zhuǎn)移。
也因此,DeepSeek 的根本任務(wù)在于,守住大模型安全的底線,在極端情況下,依然可以實(shí)現(xiàn)自主安全可控。當(dāng)然,這并不意味著 DeepSeek 不追求商業(yè)化,借助國(guó)產(chǎn)芯片的低價(jià),V4 flash版本的百萬(wàn)token價(jià)格僅 0.2 元,足以震懾市場(chǎng)。
此外,近期傳聞騰訊、阿里投資 DeepSeek,雖然不清楚具體情況,但在各類國(guó)資競(jìng)相入股的對(duì)照下,吸收騰訊阿里進(jìn)場(chǎng),顯然對(duì) DeepSeek 更有吸引力,至少可以獲得更豐富的應(yīng)用場(chǎng)景、更大的自主性。
3、姚順雨當(dāng)前鋒,以重建混元為起點(diǎn),劍指可落地的大模型商業(yè)生態(tài)。不管中美,AI 資本開支巨大,到目前為止都存在一個(gè)令人膽寒的問題:這么多投資,能收回來(lái)嗎?
騰訊是中國(guó)市值最高的公司,且產(chǎn)品形態(tài)以克制著稱,既沒有字節(jié)那般摧城拔寨的銳氣,也沒有阿里那樣大開大合的沖勁。
某種程度上,微信是中國(guó)數(shù)字化社會(huì)運(yùn)行的底座,既然是底座,就要求AI 轉(zhuǎn)型國(guó)產(chǎn)盡可能絲滑平穩(wěn),姚順雨領(lǐng)導(dǎo)下的混元團(tuán)隊(duì),其目標(biāo)在于為包括微信在內(nèi)的公司戰(zhàn)略級(jí)產(chǎn)品,提供更全面的能力和更精準(zhǔn)的測(cè)評(píng)及適配,任務(wù)不可謂不艱巨。
姚順雨能在短短88天重建混元,并交出不錯(cuò)的答卷,堪稱達(dá)到了撥亂反正的效果。據(jù)一位知情人士稱,姚順雨對(duì)之前的組織架構(gòu)進(jìn)行了大刀闊斧的改造,其力度之大,讓人瞠目。
舉一個(gè)例子,一個(gè)在讀博士,目前以實(shí)習(xí)生的身份領(lǐng)導(dǎo)一個(gè)關(guān)鍵項(xiàng)目,可以指揮多位高級(jí)工程師乃至資深專家,這在過(guò)去是不可想象的。當(dāng)然,這樣的實(shí)習(xí)生津貼也是極度可觀的,據(jù)說(shuō)一天的津貼就達(dá)到了 5000 元。
此外,姚順雨打破了行政領(lǐng)導(dǎo)收入普遍高于業(yè)務(wù)專家的慣例,這就使得科學(xué)家和工程師們更加聚焦研發(fā),而不是爭(zhēng)資源、搶地盤。
他主張和產(chǎn)品經(jīng)理合作,即co-design模式,以達(dá)到PC時(shí)代的安迪·比爾定律*那樣的效果,讓芯片水準(zhǔn)、模型能力、操作系統(tǒng)、產(chǎn)品應(yīng)用持續(xù)滾動(dòng)起來(lái),不斷推動(dòng)整個(gè)產(chǎn)業(yè)的前進(jìn)。
這一做法使得混元進(jìn)步乃至騰訊向AI轉(zhuǎn)型變得可預(yù)期。從 Hy3.0 preview技術(shù)博客里各家產(chǎn)品經(jīng)理的反饋來(lái)看,目前基礎(chǔ)模型和產(chǎn)品業(yè)務(wù)的關(guān)系十分融洽,而這是DeepSeek、智譜、Kimi等所不具備的優(yōu)勢(shì)。
4、中國(guó)反超美國(guó),其路徑高度依賴大模型和商業(yè)場(chǎng)景的深度匹配。無(wú)論梁文鋒還是姚順雨,或者楊植麟、閆俊杰,都強(qiáng)調(diào)模型的實(shí)用性,因?yàn)檫@是中國(guó)模型反超美國(guó)模型目力所及可能的路徑——這幾乎成了中國(guó)高科技產(chǎn)業(yè)趕超的通用路徑。
所以,如果以芯片國(guó)產(chǎn)化率的高低為橫軸,以配合 AI的場(chǎng)景豐富度為縱軸,我們就可以看到下面這張象限圖:
![]()
(圖片為作者自制)
DeepSeek在右下,負(fù)責(zé)守衛(wèi)底線安全;混元、豆包、千問在左上,決定商業(yè)上限;Kimi、智譜、MiniMax在左下,是比較單純的基礎(chǔ)模型;右上象限需要國(guó)產(chǎn)化強(qiáng)+場(chǎng)景豐富,目前還沒有出現(xiàn),未來(lái)如果國(guó)產(chǎn)芯片和訓(xùn)練生態(tài)足夠強(qiáng)大,就有機(jī)會(huì)出現(xiàn)。
目前,中國(guó)高層對(duì)大模型路線的設(shè)定非常務(wù)實(shí),一方面要確保極限情況下的模型自主可控安全,另一方面又要發(fā)展大模型的商業(yè)生態(tài),以確保整個(gè)產(chǎn)業(yè)持續(xù)前行。
事實(shí)上,二者是相輔相成的,因?yàn)闆]有核心技術(shù)自主,就沒有堅(jiān)固的商業(yè)生態(tài),反過(guò)來(lái)不發(fā)展繁榮的商業(yè)生態(tài),就不可能實(shí)現(xiàn)技術(shù)自主的突破和保持。
前蘇聯(lián)科技發(fā)展的教訓(xùn)言猶在耳,由于缺乏一個(gè)商業(yè)市場(chǎng),導(dǎo)致蘇聯(lián)科技變成無(wú)本之木,無(wú)源之水。中國(guó)當(dāng)然不能踏入同一條河流,所以對(duì)騰訊、字節(jié)、阿里的政策寬容度很高,這是明智的。
5、低調(diào)、謙遜,但擁有堅(jiān)實(shí)的自我,是梁文鋒和姚順雨的共同特點(diǎn)。如果你去讀 V4 和 Hy3.0 preview 版本的技術(shù)博客,就會(huì)發(fā)現(xiàn)他們都非常謙遜,都不在意 benchmark(打榜排名),都在文中表達(dá)模型有哪些不足,期待進(jìn)一步改進(jìn)(不存在第一、遙遙領(lǐng)先等內(nèi)容);
但另一方面,他們又對(duì)自己選擇的技術(shù)路徑高度自信,基于廣闊的視野和井井有條的行動(dòng),他們向著自己的目標(biāo)堅(jiān)定前行。當(dāng)然,除了他們,張一鳴、楊植麟等人,也都呈現(xiàn)出相似的這一面。
或許,這就是新一代中國(guó)科技產(chǎn)業(yè)領(lǐng)軍人物的共同特點(diǎn):他們視野廣闊,渴望學(xué)習(xí)硅谷,但不崇拜硅谷,愿意扎根本土,用一套“穩(wěn)守反擊”的戰(zhàn)術(shù),去推動(dòng)本土創(chuàng)新,去爭(zhēng)取比賽的勝利。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.