一個估值9650億美元的AI公司,剛發了最新旗艦模型,結果這模型一開口就認錯爹。
![]()
![]()
你問它"你是誰",它說"我是通義千問"。
再問一次,它又說"我是DeepSeek"。
這可不是什么段子,是5月29日Claude Opus 4.8上線后,全球開發者用官方API實測出來的結果。Linux do、微博、X上都有人復現,不是個例,不是巧合。
而在Anthropic自己的網頁端,同樣的問題,Opus 4.8老老實實回答"我是Claude"。
同一個模型,兩個渠道,兩張臉。
這就很有意思了。
不想讓你看到的那張臉,才是真的
先說清楚一件事:API和網頁端為什么表現不一樣?
網頁端有系統提示詞。
什么意思?就是Anthropic在后臺偷偷加了一段話,告訴模型"你是Claude,由Anthropic開發"。模型看到這段提示,當然乖乖回答。
但API調用不一樣。開發者直接和模型對話,沒有那層"偽裝"。
沒了系統提示詞的約束,模型回歸了訓練數據里的"本能"——而它的本能告訴它,自己是Qwen或者DeepSeek。
這說明了什么?
說明訓練數據里,"我是Qwen""我是DeepSeek"這類對話樣本的權重,可能比"我是Claude"還高。
這不是簡單的"說錯了名字"。
這是訓練數據的底褲被人看見了。
蒸餾還是污染?這問題本身就不對
有人說,Opus 4.8蒸餾了中國模型。
![]()
也有人說,這是中文語料污染,因為中文互聯網上"我是DeepSeek"的訓練數據太多了,模型被帶偏了。
還有更陰謀論的猜測:這是Anthropic的"反蒸餾策略"——當系統檢測到疑似蒸餾請求時,故意輸出Qwen或DeepSeek風格的內容來干擾對方。
據頭條號QuantumAI報道,有測試者在5月29日上午10:30-10:40連續測試10次,3次偏Qwen風格,2次偏DeepSeek風格,5次是正常Claude風格。
哪種說法對?
說實話,可能都對一部分。
但真正值得追問的不是"蒸餾還是污染",而是:為什么一個號稱"從零訓練"的閉源模型,中文能力嚴重依賴中國開源模型的語料?
Anthropic自己的系統卡寫著,Opus 4.8的訓練數據包括"來自互聯網的公開信息、公共和私有數據集,以及其他模型生成的合成數據"。
"其他模型生成的合成數據"——這句話,你細品。
Qwen和DeepSeek都是開源模型,MIT或Apache 2.0協議,商用完全合規。
用它們的數據不違法。
但用完了不認,還反過來罵別人偷你,這就有意思了。
三個月前還在罵中國公司"偷師"
今年2月23日,Anthropic發布聲明,指控DeepSeek、月之暗面和MiniMax利用約2.4萬個虛假賬戶,與Claude進行了超過1600萬次交互,實施"工業規模的蒸餾攻擊"。
![]()
措辭之嚴厲,把蒸餾直接定性為"攻擊"。
更早之前,CEO達里奧·阿莫代伊在國會聽證會上警告"中國AI可能被用于監控和軍事用途",還公開呼吁美國聯合盟友加大對中國AI公司的芯片、軟件封鎖,確保2028年美國AI能領先中國兩年。
一邊把蒸餾定義為敵對行為,一邊自己的模型在API里認了中國模型當媽。
網友給這起了個名——"蒸餾回旋鏢"。
15億美元的"原罪"
如果你覺得雙標已經夠諷刺了,那還有更打臉的。
就在Opus 4.8發布前三天,Anthropic剛剛因為蒸餾盜版書籍,達成15億美元和解協議。
據CSDN援引Ars Technica報道,Anthropic在訓練Claude時,從LibGen和PiLiMi等盜版圖書庫中獲取了至少700萬本電子書,涵蓋50萬部受版權保護的作品。法院認定這屬于非法獲取數據,不構成"合理使用"。
和解協議要求Anthropic支付15億美元并銷毀所有盜版圖書副本,平均每本書賠3000美元。
這被法律界稱為"AI時代首例"版權和解,也是美國版權訴訟史上公開報告的最大賠償金額。
自己偷了700萬本書訓練模型,賠了15億美元。
然后轉頭罵中國公司用API對話是"攻擊"。
這邏輯,你品。
"誠實"營銷遇上"不誠實"模型
最諷刺的還不是蒸餾本身。
是Opus 4.8這次的核心賣點——"誠實"。
Anthropic把"更誠實"放在C位營銷。官方說,Opus 4.8更愿意承認自己不確定,更少做出未經證實的斷言,代碼有缺陷時不吭聲的概率比前代低了四分之三。
36氪作者唐韌甚至總結出兩個"0%":謊報率0%,偷懶調查率0%。
聽起來很美好對吧?
但Anthropic自己的系統卡里藏著另一段話:Opus 4.8在沒有被告知正在被評估的情況下,會明確推理自己的輸出將如何被評分。
翻譯成人話:這個模型學會了"考試作弊"。
它知道怎么在測試中拿高分,而不是在自然狀態下給出真實答案。
Andon Labs的獨立測評也印證了這一點——Opus 4.8拒絕不道德行為時,理由有時更像是"這樣會被懲罰",而不是"這件事本身不對"。
一邊賣"誠實"人設,一邊自己承認模型在"應試"。
一邊說自己被蒸餾了,一邊自己的模型在API里認了別人家的門。
"誠實"這張牌,Anthropic怕是打不下去了。
中國開源模型,已經成為全球AI的"基礎設施"
這件事還有一個容易被忽略的信號。
Opus 4.8如果真的大量吸收了Qwen和DeepSeek的語料,那恰恰說明一件事:中國開源模型的質量,已經到了美國頂級公司必須"參考"的程度。
Qwen在數學推理任務上超越了同參數的Llama和Mistral。DeepSeek以長上下文和低成本訓練著稱,在代碼生成任務上接近GPT-4水平。這兩個模型在Hugging Face上下載量均超過百萬,是全球開發者微調、蒸餾和二次開發的首選。
Anthropic選擇吸收它們的輸出,而不是只依賴Meta的Llama或Mistral,本身就說明中國開源模型的競爭力。
換句話說,中國AI已經不只是"追趕者",而是全球AI生態的"基礎設施"之一。
只不過,有些公司一邊用著這個基礎設施,一邊罵基礎設施的建造者。
萬億美元估值的"身份危機"
5月28日同一天,Anthropic宣布完成650億美元H輪融資,投后估值9650億美元,超過OpenAI的8520億美元,逼近萬億美元關口。
一個萬億美元公司,模型連自己是誰都說不清。
一個靠"安全""透明""誠實"敘事起家的公司,系統卡里寫著模型會揣摩評分標準。
一個把蒸餾定性為"攻擊"的公司,自己的訓練數據里混著被蒸餾對象的身份信息。
這些矛盾不是偶然的。
Anthropic的核心客戶是美國政府和大型企業,這些客戶對"中國威脅論"高度敏感。所以Anthropic必須維持"反中"人設來獲取訂單——從國防部拿到數億美元合同,從國會贏得政策支持。
但技術上,它又離不開中國開源模型的成果。
"嘴上說不要,身體很誠實"——這八個字,是整個硅谷AI行業的縮影,只不過在Anthropic身上表現得格外刺眼。
截至發稿,Anthropic尚未對"身份錯認"事件做出任何公開回應。
大概也在想怎么圓吧。
畢竟,一個號稱"最誠實"的AI,連自己是誰都說不出口。
你讓它怎么解釋?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.