如果你是一家被美國政府列入出口黑名單、買不到任何英偉達芯片的AI公司,在Anthropic突然關停自家全球性能最強編程模型的第二天,你需要多久才能拿出一款同樣能打的替代品,并讓所有人都能免費下載?北京智譜給出的答案是:第二天就開始推送,一周后登頂開源排行榜。
6月12日,美國商務部發布出口管制指令,禁止Anthropic向任何外國人士提供Fable 5或Mythos 5,迫使該公司在全球范圍禁用這兩個模型。就在禁令生效的次日,原名為Zhipu AI的北京企業Z.ai便啟動了GLM-5.2的推送。這款模型采用MIT開源許可,完全開放權重。根據這家公司的說法,GLM-5.2的訓練堆棧里沒有一塊英偉達芯片,全程跑在大約10萬塊華為昇騰910B處理器上,使用MindSpore框架完成。
![]()
不到一周,GLM-5.2已經攀升至公開可訪問模型的榜首,公司估值隨之突破1萬億港元(約1280億美元)。于是出現了一個極具戲劇性的局面:在許多美國以外用戶能夠合法觸及的最強模型,變成了一款來自華盛頓貿易黑名單上的中國公司的免費下載。
GLM-5.2的成績單既有亮眼之處,也存在不均衡。在Design Arena的人類偏好編碼榜單上,它拿下第一,領先Fable大約10個Elo分。在Artificial Analysis的Intelligence Index v4.1上,它同樣是公開模型中的第一名,得分51,排在MiniMax-M3、DeepSeek V4 Pro和谷歌Gemini 3.1 Pro Preview之前。在SWE-bench Pro測試中,它得到62.1分,高于GPT-5.5的58.6。
換到需要長時間持續工作的場景,格局則略有變化。以Code Arena的前端開發榜單來看,GLM-5.2排在第二,居于Fable 5之后。而在Artificial Analysis的AA-Briefcase測試中——這個測試衡量的是模型處理由數千個碎片輸入構成的跨數周知識任務的能力——Fable 5曾以1587個Elo分領先,Opus 4.8以1356分排第二,GLM-5.2以1266分排第三,只是隨著出口禁令生效,Fable已被迫退出競技場。
在原始終端操作能力上,GLM-5.2同樣落后一些。它在Terminal-Bench 2.1上拿到81.0分,而Opus 4.8是85.0分,GPT-5.5是84.0分,不過它確實優于谷歌Gemini 3.1 Pro的74.0分。GLM-5.2今天之所以能占據“最可及最強模型”的位置,很大程度上是因為在它之上的那些模型,多半都來自Anthropic家族,而Fable已經關停。
GLM-5.2的訓練棧本身,就是對華盛頓遏制中國模型發展努力的一記重擊。Z.ai自2025年1月起就被列在美國實體清單上,無法獲取英偉達H100、H200和B200加速器。該公司公開表示,GLM-5系列完全在約10萬塊華為昇騰910B上訓練,使用MindSpore框架,任何階段都沒有使用英偉達芯片。針對先進AI芯片的出口管制,本就是為了防止出現這類成果,而現在看來,這一目的顯然沒有達到。
當然,差距依然存在。根據美國外交關系協會去年12月的一份報告,華為昇騰910C的推理性能大約相當于英偉達H100的60%,在能效和集群規模上仍存在顯著差距。同一份報告預測,最早到明年,美國最好的芯片……
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.