![]()
文 | 周天財(cái)經(jīng)
周天財(cái)經(jīng) 原創(chuàng)出品
圍繞蒸餾的敘事戰(zhàn),再起。
6月25日,外媒爆出,美國(guó)AI公司Anthropic指控阿里巴巴千問(Qwen)模型「蒸餾」其Claude模型。據(jù)路透社、《華爾街日?qǐng)?bào)》,Anthropic已致信美國(guó)參議員及白宮官員,指控阿里在4月到6月期間,用25000個(gè)虛假賬號(hào)與Claude進(jìn)行約2880萬次交互,試圖蒸餾Claude。
截至目前,Anthropic并沒有進(jìn)一步拿出實(shí)在的證據(jù),僅憑一紙信件,便對(duì)另一家公司口誅筆伐,掀起炒作浪潮,這一行徑,已經(jīng)引發(fā)全球AI社區(qū)絕大多數(shù)開發(fā)者的斥責(zé)。
![]()
而這并不是Anthropic的首次出擊。早在今年2月,該公司發(fā)布博客稱,DeepSeek、Kimi、MiniMax 3家中國(guó)公司蒸餾Claude,與今日Anthropic對(duì)阿里的指控幾乎完全一樣。
DeepSeek等三家公司并未發(fā)聲,而阿里對(duì)此也無回應(yīng)。但引人注意的是,就在這一新聞的前兩天(6月23日),阿里正式對(duì)美國(guó)國(guó)防部提起訴訟,要求將其從「中國(guó)軍事企業(yè)名單」中移除。
我試著深究里面的細(xì)節(jié),覺得可以分為兩個(gè)部分來看。
首先看看蒸餾本身,先說結(jié)論,蒸餾不能等同于抄襲和竊取,這種行業(yè)最普遍的技術(shù),已經(jīng)徹底被Anthropic污名化了。
蒸餾(Distill)本身是AI行業(yè)公認(rèn)的合法訓(xùn)練技術(shù),是由AI三巨頭之一、諾獎(jiǎng)得主Geoffrey Hinton 2015年提出的技術(shù)方法,后成為行業(yè)基操。
蒸餾屬于是一種「向高手學(xué)習(xí)」的訓(xùn)練方式:能幫助模型快速掌握某種回答風(fēng)格、任務(wù)范式和基礎(chǔ)能力,也可以把大模型已經(jīng)表現(xiàn)出來的一部分能力,較高效率地「壓縮」到小模型身上。因此,蒸餾的價(jià)值主要體現(xiàn)在提速、降本和能力遷移上,它能讓一個(gè)模型少走很多彎路,更快接近一個(gè)強(qiáng)模型已經(jīng)達(dá)到的水平。
一個(gè)行業(yè)皆知的事實(shí)是,美國(guó)AI公司就經(jīng)常互相蒸餾。無論OpenAI、Anthropic,還是Qwen/DeepSeek,模型訓(xùn)練的pipeline大同小異。
特別是Anthropic就經(jīng)常被業(yè)內(nèi)人士指出,這家公司就到處蒸餾其他家的成果。
滑稽的情形是,前段時(shí)間,其Claude Opus 4.8發(fā)布,有開發(fā)者調(diào)用其官方API測(cè)試,用中文問「你是什么模型」,模型返回字段是claude-opus-4-8,但輸出回答卻說:我是通義千問(Qwen)。這在AI社區(qū)引發(fā)大量討論,紛紛猜測(cè)Claude蒸餾了中國(guó)模型。隨后,陸續(xù)有開發(fā)者測(cè)得Claude 4.8輸出「我是DeepSeek」等回答。
![]()
就連李開復(fù)也在2026年3月的一次采訪中直言:「大家可能前一陣聽到美國(guó)Anthropic抱怨一些中國(guó)公司蒸餾了它的模型,蒸餾本身也沒有違背什么規(guī)則,是不是有點(diǎn)小題大做了呢……Anthropic還欠我3000美元稿費(fèi)。」
李開復(fù)這話所指的大背景是,Anthropic因?yàn)閺谋I版網(wǎng)站LibGen和PiLiMi上下載了約48.2萬本注冊(cè)版權(quán)書籍來訓(xùn)練模型,而被作者們集體訴訟,最終Anthropic賠了15億美金來求得和解,這也是美國(guó)歷史上最大的單筆版權(quán)和解案。
這種版權(quán)侵權(quán)可比蒸餾嚴(yán)重多了,是法官的嚴(yán)肅判決。而Anthropic指控阿里,卻毫無實(shí)在證據(jù),如今倒打一耙,從未如此具象化。
蒸餾不是一錘定音的一把絕招,AI專家Nathan Lambert就談到,蒸餾只是模仿,真正的能力來自強(qiáng)化學(xué)習(xí)的探索,而不僅僅是復(fù)制輸出。并且,Baseten公司模型訓(xùn)練負(fù)責(zé)人查爾斯·奧尼爾(Charles O'Neill)表示,單靠知識(shí)蒸餾無法構(gòu)建出頂尖的人工智能系統(tǒng),這還需要其他幾項(xiàng)復(fù)雜的底層技術(shù)。
打一個(gè)最通俗的比方,蒸餾就像一個(gè)運(yùn)動(dòng)員通過看世界冠軍比賽錄像、模仿冠軍動(dòng)作、甚至和冠軍陪練,來迅速理解高水平選手是怎么發(fā)力、怎么選擇節(jié)奏、怎么處理關(guān)鍵球的。這當(dāng)然非常有幫助,甚至可能讓他在短時(shí)間內(nèi)進(jìn)步明顯。
但真正決定他能不能成為世界冠軍的,仍然是他自己的體能儲(chǔ)備、技術(shù)細(xì)節(jié)、戰(zhàn)術(shù)素養(yǎng)、心理穩(wěn)定性、日常訓(xùn)練強(qiáng)度,以及背后完整的教練團(tuán)隊(duì)和訓(xùn)練、康復(fù)體系。
也就是說,看冠軍錄像可以幫助你少走彎路,跟冠軍陪練可以幫助你提高速度,但你最終能不能奪冠,靠的肯定不只是「模仿」這一件事。
真正能把一個(gè)模型推到頂尖水平的,通常還包括一整套更底層、更復(fù)雜的能力建設(shè)過程,比如大規(guī)模預(yù)訓(xùn)練所奠定的知識(shí)底座,高質(zhì)量數(shù)據(jù)清洗所保證的學(xué)習(xí)材料,訓(xùn)練配方所決定的穩(wěn)定性與效率,強(qiáng)化學(xué)習(xí)所帶來的探索與自我修正能力,評(píng)估體系所提供的反饋閉環(huán),以及工程優(yōu)化、推理加速和部署能力所實(shí)現(xiàn)的最終落地效果。換句話說,蒸餾更像是「學(xué)經(jīng)驗(yàn)」;它能幫助模型學(xué)得更快,但未必能單獨(dú)決定模型能走多遠(yuǎn)。
回過頭看,為何Anthropic對(duì)中國(guó)AI公司頻頻出手?答案顯而易見,中國(guó)AI不僅在性能榜單上奮起直追,在全球也越來越受到歡迎,全球最大的API三方平臺(tái)OpenRouter的大模型調(diào)用榜,就經(jīng)常被千問、GLM、Kimi、DeepSeek等中國(guó)大模型霸占。對(duì)暫時(shí)領(lǐng)先的Anthropic而言,怎能不急眼?
說完蒸餾這事兒,再來聊聊今天產(chǎn)業(yè)競(jìng)爭(zhēng)背后的屋內(nèi)大象:地緣壓力。
在基礎(chǔ)大模型上,中國(guó)公司這兩年展現(xiàn)出了非常強(qiáng)的追趕能力:在算力并不占優(yōu)、外部限制不斷增強(qiáng)的情況下,依然能通過更高的工程效率、更快的迭代節(jié)奏、更靈活的開源策略和更務(wù)實(shí)的應(yīng)用導(dǎo)向,把模型能力迅速推近全球前沿。
這種逼近,本身就足以讓部分海外廠商感到不安。
同時(shí),Anthropic這樣的公司,當(dāng)前就處于復(fù)雜的安全審查、政府關(guān)系夾縫之中。它必須不斷回應(yīng)來自政府、軍方的安全訴求。那么,主動(dòng)強(qiáng)化「中國(guó)威脅」敘事,不僅能夠幫助其在政策語境中占據(jù)一個(gè)更有利的位置,也可能成為其向華盛頓安全體系、五角大樓遞交「可信度」的一種投名狀。
考慮到Anthropic被美軍廣泛用于戰(zhàn)場(chǎng)之中,作為一種「軍火」而深刻卷入政府補(bǔ)助和采購當(dāng)中,可以說,Anthropic就是當(dāng)代新的軍工復(fù)合體,并非象牙塔里的脆弱白蓮花。
![]()
我近期去了一趟美國(guó),深入交流和觀察之后,感受頗多。
在美國(guó)期間,我注意到,渲染中國(guó)公司威脅論的節(jié)目在美國(guó)有不少信眾,比如舊金山的朋友就給我看一些美國(guó)百萬大V是如何質(zhì)疑宇樹機(jī)器人回傳數(shù)據(jù)的(當(dāng)然,我遇到的一位巴基斯坦裔百萬粉絲博主,則盛贊宇樹)
3D打印小巨頭拓竹,遭遇的是質(zhì)疑其反開源的聲音,一項(xiàng)原本為了增進(jìn)云服務(wù)穩(wěn)定性的技術(shù)安排,到歐美開源社區(qū)的語境里,被解讀成巨頭反開源的敘事,甚至也被渲染成地緣政治話題。
無一例外,以上這些中國(guó)標(biāo)桿科技企業(yè),特征都是拿出了前沿產(chǎn)品,卻也都因?yàn)橐恍o足輕重的技術(shù)細(xì)節(jié)被惡意攻擊,指責(zé)威脅安全。
當(dāng)敘事權(quán)不在自己手里,哪怕在細(xì)分市場(chǎng)已經(jīng)做到了全球第一,也依然會(huì)爭(zhēng)論不斷,這是中國(guó)企業(yè)很長(zhǎng)一段時(shí)間需要面對(duì)的煩惱。
還有個(gè)小插曲,在入境舊金山時(shí),我還被帶到小黑屋里進(jìn)行了一番審查,阿sir問出了我覺得是此行最佳的一句話:「你說你是tech blogger,那為什么你有很多年都沒再來過美國(guó)?在我看來,你應(yīng)該年年都來才對(duì)」。
言下之意,我不呆在美國(guó)就寫不了科技,這就流露出一種歐美中心主義視角,他們就是眼神清澈地「看不見」很多趨勢(shì)。我回答他說:中國(guó)自己就有大量科技與創(chuàng)業(yè)公司,已經(jīng)夠忙活好一陣的了。
一面放大威脅,一面貶低實(shí)力、漠視成果,這兩件自相矛盾的事兒是怎么融合在同一個(gè)指控之中的,令人費(fèi)解,左右腦互搏程度之深,已經(jīng)成為普遍的雙標(biāo)現(xiàn)象了。
Call back到最近的蒸餾爭(zhēng)議,我們同樣需要清晰地認(rèn)識(shí)到,今天的大模型競(jìng)爭(zhēng)已經(jīng)不再只是實(shí)驗(yàn)室里的性能競(jìng)爭(zhēng)、市場(chǎng)上的產(chǎn)品競(jìng)爭(zhēng),它同時(shí)還是一場(chǎng)定義權(quán)、解釋權(quán)競(jìng)爭(zhēng)和合法性競(jìng)爭(zhēng)。
可以預(yù)見的是,蒸餾爭(zhēng)議不會(huì)是一次偶發(fā)事件,圍繞蒸餾甚至更多技術(shù)細(xì)節(jié)的敘事戰(zhàn),會(huì)層出不窮很長(zhǎng)一段時(shí)間,阿里巴巴、拓竹、宇樹這些科技企業(yè)面臨的敘事壓力,還會(huì)在越來越多的前沿中國(guó)企業(yè)身上經(jīng)歷一遍,長(zhǎng)路漫漫,需要這一代人共同面對(duì)。
*本文如有提及上市公司,僅作為研究交流用途,不構(gòu)成推薦股票或相關(guān)金融產(chǎn)品的建議。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.