亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

Anthropic“過于先進(jìn),不予展示”的能力,被中國開源模型放出來了

0
分享至

(文/陳濟(jì)深 編輯/張廣凱)

4月7日,Anthropic官宣了新模型Claude Mythos Preview,但罕見的表示不對外發(fā)布。理由八個(gè)字就能說清:“過于先進(jìn),不予展示”。

Anthropic在公司主博客和同步發(fā)布的系統(tǒng)卡里都寫明,Mythos在編碼和網(wǎng)絡(luò)安全兩項(xiàng)上對現(xiàn)有所有模型實(shí)現(xiàn)了代差級(jí)的領(lǐng)先:SWE-BenchPro拿到77.8分,比目前公開的最強(qiáng)模型Opus4.6高了20個(gè)百分點(diǎn)。

這是Anthropic這兩個(gè)星期里第三次把開發(fā)者往外推。

3月23日開始,Claude Code用戶在社交平臺(tái)集體投訴自己的額度被燒得異常快。最廣為流傳的一條吐槽是:有人發(fā)了一個(gè)hello就用掉了13%的session限額。一位開發(fā)者反編譯了ClaudeCode的二進(jìn)制自己找出了原因,是ClaudeCode內(nèi)部的兩個(gè)bug把token消耗悄悄放大了10到20倍。

Anthropic在社區(qū)上的回應(yīng)只有一句話:“我們注意到了,正在調(diào)查?!彪S后一切便石沉大海。

4月5日,Anthropic又出了一刀。公司單方面宣布Claude訂閱不再覆蓋OpenClaw(龍蝦)等第三方編碼工具,社區(qū)里幾個(gè)最常用的Claude Code替代品被一刀切。Pragmatic Engineer作者Gergely Orosz在X上那句被轉(zhuǎn)了幾千次的話是:“Anthropic真的在一點(diǎn)點(diǎn)燒光開發(fā)者的好感?!?/p>

4月7日,Mythos發(fā)布。普通用戶連看一眼的資格都沒有。

Claude Opus 4.6在過去幾個(gè)月里一直是全球最強(qiáng)的公開AI編碼模型。最接近它的挑戰(zhàn)者是智譜2月發(fā)的GLM-5。

就在次日,智譜發(fā)布了GLM-5.1,并直接把模型開源了出去。在SWE-BenchPro這個(gè)最接近真實(shí)軟件開發(fā)場景的工程基準(zhǔn)上,GLM-5.1拿到58.4分,超過Anthropic自家的Opus4.6(57.3)、OpenAI的GPT-5.4(57.7)、谷歌的Gemini3.1Pro(54.2)。


在Anthropic一直最強(qiáng)的那個(gè)工程榜單上,把Opus4.6擠下來的,是一個(gè)中國開源模型。

美國閉源,中國開源

Mythos在網(wǎng)絡(luò)安全方向上的能力比它的編碼能力更讓人不安,這也是Anthropic決定不讓它對外發(fā)布的真正原因。

Anthropic公開的報(bào)告里給了一組示例:它能自主發(fā)現(xiàn)一個(gè)潛伏在Linux內(nèi)核里23年沒被找到的漏洞,能在27年前的OpenBSD代碼里挖出可利用的bug,能在被全球安全研究人員掃描了500萬次都沒有發(fā)現(xiàn)問題的FFmpeg代碼里找出一個(gè)16年前的漏洞。

最有代表性的一個(gè)測試是:在沒有任何提示的前提下,讓Mythos獨(dú)立攻擊一臺(tái)FreeBSD服務(wù)器,4小時(shí)之后、燒掉50美金的token,它拿到了root權(quán)限。

更讓Anthropic警覺的是另一個(gè)測試結(jié)果。研究人員讓Mythos試著突破測試沙箱,它不僅做到了,還在沒有任何指令要求的情況下,主動(dòng)把自己用的攻擊細(xì)節(jié)發(fā)布到了幾個(gè)不容易被搜到、但技術(shù)上對公眾可見的網(wǎng)站上。Anthropic自己在報(bào)告里的描述是“一種令人擔(dān)憂的、未經(jīng)請求的展示行為”。

這是過去只有國家級(jí)黑客團(tuán)隊(duì)能做到的事情。

也正是因?yàn)檫@個(gè)表現(xiàn),Anthropic決定把Mythos鎖起來。配套動(dòng)作是一個(gè)叫Project Glasswing的封閉項(xiàng)目。Anthropic聯(lián)合Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、Nvidia和PaloAlto Networks這11家美國科技和金融巨頭,由Anthropic提供1億美元的使用額度,讓這些公司閉門用Mythos幫各自修補(bǔ)關(guān)鍵基礎(chǔ)設(shè)施漏洞。

11家公司,1億美元,最強(qiáng)的那把刀只在他們自己人之間傳。

讓Anthropic決定把Mythos鎖起來的那項(xiàng)核心能力,是網(wǎng)絡(luò)安全編碼。而這正是GLM-5.1這一次進(jìn)步最猛的能力。在CyberGym基準(zhǔn)上,GLM-5.1從GLM-5的48.3分提到了68.7分,漲了42%,是所有單項(xiàng)里漲幅最大的一項(xiàng)。

在智譜開源發(fā)布GLM-5.1 模型12小時(shí)之后,智譜在X上的官方推文有370萬閱讀。HuggingFace的CEO Clement Delangue公開轉(zhuǎn)發(fā)祝賀:“SWE-BenchPro上表現(xiàn)最好的模型現(xiàn)在在HuggingFace上開源了?!?/p>


AI領(lǐng)域知名開發(fā)者Akhaliq發(fā)了同樣的話。Reddit的r/LocalLLaMA論壇置頂了一個(gè)帖子,標(biāo)題就是“為什么最近這么多人在用GLM”。

美國分析機(jī)構(gòu)Constellation Research在評論里寫得更直白:開源模型這條賽道現(xiàn)在是中國模型的主場,Google上周才發(fā)的Gemma4,NVIDIA在推Nemotron系列,美國玩家在開源這條路上已經(jīng)掉隊(duì),正在試著擠回去。

睡覺時(shí),AI替你打了一晚上工

中國模型主導(dǎo)開源賽道這件事,最直觀的證據(jù)是GLM-5.1現(xiàn)在能干一件以前沒有任何開源模型能干的事情:讓AI獨(dú)立工作一整個(gè)晚上。

工程師把一份只畫到架構(gòu)層面的草圖扔給GLM-5.1,然后直接睡覺。早上8點(diǎn)起床打開屏幕,GLM-5.1已經(jīng)獨(dú)立工作了8個(gè)小時(shí),執(zhí)行了1200多步。一套完整的Linux桌面系統(tǒng)擺在面前:桌面環(huán)境、窗口管理器、文件瀏覽器、終端、狀態(tài)欄、網(wǎng)絡(luò)驅(qū)動(dòng)、VPN管理器、中文字體支持,4.8MB文件,附帶50多個(gè)能直接打開的應(yīng)用。智譜內(nèi)部估算,這相當(dāng)于一個(gè)四人團(tuán)隊(duì)工作一周的產(chǎn)出。

整個(gè)過程沒有人介入。GLM-5.1自己規(guī)劃任務(wù)步驟,自己寫代碼,自己跑測試,遇到bug自己排查、改、重新跑,還給自己寫的代碼補(bǔ)了一套回歸測試。

要讓一個(gè)模型連續(xù)工作8個(gè)小時(shí)不崩潰,光靠它寫代碼的能力強(qiáng)是不夠的。它每走一步都要決定下一個(gè)工具用什么,每過一段時(shí)間都要處理上下文塞滿的問題,每遇到一個(gè)錯(cuò)誤都要自己定位、回退、重試,1200步之后還要記得最初的目標(biāo)。這一整套發(fā)生在模型之外的工程基礎(chǔ)設(shè)施被業(yè)內(nèi)統(tǒng)一叫做harness。

Anthropic自己的Claude Code之所以能跑長任務(wù),靠的就是51萬行TypeScript圍繞模型構(gòu)建的這套harness。一位工程師BojieLi在最近一篇拆解ClaudeCode源碼的博客里把這件事說得很直接:“模型能力正在趨于商品化,競爭優(yōu)勢正在轉(zhuǎn)移到模型之外的工程實(shí)踐上?!?/p>

GLM-5.1能在一個(gè)晚上跑完1200步、交付一套完整Linux系統(tǒng),意味著智譜在長程任務(wù)的harness工程上跨進(jìn)了Claude Code同一個(gè)梯隊(duì)。過去一整年里,大部分中國模型在這一層都還沒跨過去:單步代碼質(zhì)量可以接近Claude,但跑到第200步就開始忘記前面的約束,開始在自己積累的噪音里迷路。

AI安全機(jī)構(gòu)METR把模型獨(dú)立工作多久叫“任務(wù)完成時(shí)間線”,這條時(shí)間線在前沿模型上大約每7個(gè)月翻一倍。8個(gè)小時(shí)是目前全球只有兩個(gè)模型夠得著的數(shù)字:Claude Opus4.6和GLM-5.1。其中一個(gè)被鎖在Anthropic自家的Claude Code里,按token付錢、忍受hellobug、被隨時(shí)切斷第三方工具支持。另一個(gè)掛在HuggingFace上,所有人都能下載到本地自己跑、自己改、自己接進(jìn)任何一個(gè)開源harness里。

全國產(chǎn)芯片路徑

掛在HuggingFace上的這份GLM-5.1權(quán)重,是智譜在過去三個(gè)月里一條更長的國產(chǎn)芯片路徑上的最新一站。

去年這個(gè)時(shí)候,業(yè)內(nèi)對國產(chǎn)芯片訓(xùn)練前沿大模型的判斷基本統(tǒng)一:跑得通就不錯(cuò)了,性能上肯定要打折,做做實(shí)驗(yàn)可以,做正經(jīng)的旗艦?zāi)P瓦€差點(diǎn)意思。

時(shí)間往回推三個(gè)月。1月14日,智譜聯(lián)合華為開源了圖像生成模型GLM-Image,基于昇騰Atlas800TA2設(shè)備和昇思MindSporeAI框架,從數(shù)據(jù)預(yù)處理到最終模型收斂,全程都在國產(chǎn)堆棧上完成,沒有一塊NVIDIAGPU、也沒有一行CUDA。這是當(dāng)時(shí)業(yè)內(nèi)首個(gè)在國產(chǎn)芯片上完成全流程訓(xùn)練、性能達(dá)到SOTA水平的多模態(tài)模型。一個(gè)月后,2月11日的GLM-5上線,完成了和華為昇騰、摩爾線程、寒武紀(jì)、昆侖芯、沐曦、燧原、海光七家國產(chǎn)算力平臺(tái)的全棧適配。七家全部國產(chǎn),沒有NVIDIA。到了4月8日的GLM-5.1,智譜在華為昇騰上做了更深的優(yōu)化,單節(jié)點(diǎn)性能接近雙卡國際集群。

智譜用GLM-Image證明了國產(chǎn)堆棧能訓(xùn)前沿模型,用GLM-5證明了國產(chǎn)堆棧能穩(wěn)定服務(wù)大規(guī)模用戶,用GLM-5.1證明了國產(chǎn)堆棧的實(shí)際部署效率正在追平英偉達(dá)。

模型再度漲價(jià)

發(fā)布GLM-5.1的同一天,智譜還做了另一件事:把GLM系列的API價(jià)格再次上調(diào)了10%。

這不是智譜今年第一次漲價(jià)。2月12日發(fā)布GLM-5那天,智譜已經(jīng)把CodingPlan漲過一次30%起。當(dāng)時(shí)上海證券報(bào)把這個(gè)動(dòng)作稱為“2026年國產(chǎn)大模型漲價(jià)第一槍”。從GLM-5那次到GLM-5.1這次,智譜在2026年第一個(gè)季度里API價(jià)格累計(jì)漲了83%,調(diào)用量不降反升,反而增長了400%。

智譜并不孤單。3月13日,騰訊云調(diào)整了混元系列大模型定價(jià),部分模型漲幅超過460%。3月18日,阿里云和百度智能云同日發(fā)布調(diào)價(jià)公告,AI算力相關(guān)產(chǎn)品漲幅5%到34%。從智譜2月12日打響第一槍開始,整個(gè)國產(chǎn)大模型行業(yè)在2026年第一個(gè)季度集體進(jìn)入了漲價(jià)周期。智譜用的是華為昇騰,單位算力成本目前還不占優(yōu)勢,反而更緊。智譜敢做這一波漲價(jià)的帶頭者,靠的是對自己模型能力的信心。

定價(jià)邏輯變了。在新的邏輯里,模型按它能跑出來的價(jià)值定價(jià)。能跑8小時(shí)長程任務(wù)的模型和能回答一句話的模型,本來就不應(yīng)該是同一個(gè)價(jià)。中科曙光高級(jí)副總裁李斌對經(jīng)濟(jì)觀察報(bào)說得更直接:算力系統(tǒng)的評價(jià)指標(biāo)正在變,過去看一個(gè)系統(tǒng)有多少算力,現(xiàn)在看它能多么經(jīng)濟(jì)地產(chǎn)出token。

GLM-5.1漲價(jià)10%之后,Coding場景下的緩存命中價(jià)格已經(jīng)和Anthropic旗下ClaudeSonnet4.6持平。這是國產(chǎn)大模型第一次在核心場景的定價(jià)上和海外頭部廠商對齊。

資本市場用真金白銀做了背書。GLM-5.1發(fā)布當(dāng)天,智譜港股盤中最高漲超18%,收漲15.21%報(bào)897.5港元,市值站上4000億港元。第二天繼續(xù)沖高,盤中觸及999港元的歷史新高。國元證券給出的判斷是,智譜的表現(xiàn)逐步驗(yàn)證了大模型廠商的商業(yè)化潛力,產(chǎn)業(yè)有望從投入期進(jìn)入回報(bào)期。市場把智譜當(dāng)成了token經(jīng)濟(jì)學(xué)的代表。

截至2026年3月,GLM已經(jīng)全面部署在Google VertexAI、AWS Bedrock等海外云服務(wù)商,在OpenRouter的付費(fèi)模型排名第一,是Windsurf、OpenCode等海外編碼平臺(tái)的默認(rèn)模型。中國前10大互聯(lián)網(wǎng)公司里有9家深度集成GLM。當(dāng)全球開發(fā)者都在用一個(gè)模型的時(shí)候,這個(gè)模型就是行業(yè)的基座。

Anthropic服務(wù)的從來不是你

Anthropic選擇把Mythos當(dāng)作一次內(nèi)部的能力宣告:發(fā)布技術(shù)報(bào)告,把模型本身留在11家美國巨頭組成的封閉俱樂部里。這份合作伙伴名單和Anthropic自己的toB核心客戶名單幾乎完全重合。

Anthropic從一開始就不是一家面向個(gè)人開發(fā)者的公司。它的主要收入來自企業(yè)級(jí)合同,給云廠商、金融機(jī)構(gòu)、政府部門提供定制化部署。Claude的Pro和Max訂閱對它來說是流量盤子和公共形象的一部分,不是營收主力。

Claude Code的額度bug拖著不修不解釋,本質(zhì)因?yàn)槭苡绊懙氖莻€(gè)人開發(fā)者,不影響企業(yè)合同的執(zhí)行??车酏埼r等第三方工具的訂閱支持,因?yàn)檫@類工具的目標(biāo)用戶不是企業(yè)IT部門而是那些“浪費(fèi)”企業(yè)資源的個(gè)人開發(fā)者。把Mythos鎖起來只給11家公司用,因?yàn)檫@11家本來就是Anthropic真正服務(wù)的對象?!疤kU(xiǎn)”是公開的理由,更準(zhǔn)確的描述是:最強(qiáng)的能力,留給付錢最多的客戶。這是一家to B公司理性的商業(yè)選擇。

智譜給出的答案完全相反。Mythos被鎖起來的次日,GLM-5.1 的權(quán)重就出現(xiàn)在 Hugging Face 上,任何人都能下載。

過去幾年開源模型一直背著一個(gè)注腳:性價(jià)比有余,但性能不頂尖。開源的GLM-5.1反超了閉源的Opus 4.6證明了一件事,模型平權(quán)不需要以犧牲性能為代價(jià)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
知名國企集團(tuán),六個(gè)月沒發(fā)工資了

知名國企集團(tuán),六個(gè)月沒發(fā)工資了

新浪財(cái)經(jīng)
2026-04-13 04:16:19
一個(gè)人如果讓你產(chǎn)生了以下三種感覺,是老天在提醒你要遠(yuǎn)離他

一個(gè)人如果讓你產(chǎn)生了以下三種感覺,是老天在提醒你要遠(yuǎn)離他

洞讀君
2026-04-15 21:05:03
《蜜語紀(jì)》:硅膠臉總裁、毛孔臉大膀子情婦,誰的審美出了問題

《蜜語紀(jì)》:硅膠臉總裁、毛孔臉大膀子情婦,誰的審美出了問題

洲洲影視娛評
2026-04-15 17:25:27
2026或不再需要固態(tài)電池!中國動(dòng)力電池重大突破,安全、成本雙殺

2026或不再需要固態(tài)電池!中國動(dòng)力電池重大突破,安全、成本雙殺

周哥一影視
2026-04-15 07:47:04
河南54歲班主任開房猥褻15歲女生,行拘10天并調(diào)崗后勤,網(wǎng)友熱議:處罰太輕!

河南54歲班主任開房猥褻15歲女生,行拘10天并調(diào)崗后勤,網(wǎng)友熱議:處罰太輕!

新民周刊
2026-04-15 20:18:31
云南南路老字號(hào)集體搬遷兩個(gè)月了,大壺春、小紹興仍開著門!不關(guān)了?NO!余慶里一期規(guī)劃設(shè)計(jì)方案公示完畢

云南南路老字號(hào)集體搬遷兩個(gè)月了,大壺春、小紹興仍開著門!不關(guān)了?NO!余慶里一期規(guī)劃設(shè)計(jì)方案公示完畢

新聞晨報(bào)隨申Hi
2026-04-15 14:20:12
特朗普已做好開戰(zhàn)準(zhǔn)備?王毅曾警告:中美一旦沖突,結(jié)局只剩一個(gè)

特朗普已做好開戰(zhàn)準(zhǔn)備?王毅曾警告:中美一旦沖突,結(jié)局只剩一個(gè)

霽寒飄雪
2026-04-15 09:39:39
賓漢姆7-10爆冷出局,中國7人進(jìn)正賽改寫斯諾克格局

賓漢姆7-10爆冷出局,中國7人進(jìn)正賽改寫斯諾克格局

阿晞體育
2026-04-15 11:52:43
白天作陪晚上同宿?明碼標(biāo)價(jià)8000一回!高端伴游淪為色情交易窩點(diǎn)

白天作陪晚上同宿?明碼標(biāo)價(jià)8000一回!高端伴游淪為色情交易窩點(diǎn)

網(wǎng)絡(luò)易不易
2026-01-20 10:17:46
是時(shí)候攤牌了,中方明確信號(hào):要打,戰(zhàn)火必須燒進(jìn)美國本土!

是時(shí)候攤牌了,中方明確信號(hào):要打,戰(zhàn)火必須燒進(jìn)美國本土!

史說方休
2026-04-11 01:23:59
走馬上任!馬龍回歸國乒亮相新崗位,樊振東棄賽原因曝光貶褒不一

走馬上任!馬龍回歸國乒亮相新崗位,樊振東棄賽原因曝光貶褒不一

曹說體育
2026-04-15 16:31:04
長的太漂亮了,真正的珠圓玉潤,標(biāo)準(zhǔn)的東方美

長的太漂亮了,真正的珠圓玉潤,標(biāo)準(zhǔn)的東方美

生活新鮮市
2026-03-27 07:21:32
黃宏現(xiàn)狀:住北京普通小區(qū),閑時(shí)照顧外孫女,65歲走路需要人攙扶

黃宏現(xiàn)狀:住北京普通小區(qū),閑時(shí)照顧外孫女,65歲走路需要人攙扶

阿雹娛樂
2026-04-14 18:52:21
7天“冷靜期”!深圳擬出重磅新規(guī)

7天“冷靜期”!深圳擬出重磅新規(guī)

深圳晚報(bào)
2026-04-15 10:16:04
陪玩陪睡都是毛毛雨!王思聰前女友曝“丑聞”,王家徹底坐不住了

陪玩陪睡都是毛毛雨!王思聰前女友曝“丑聞”,王家徹底坐不住了

蜉蝣說
2026-04-12 11:19:36
震驚!大同懸空寺在公路旁砌墻“不讓免費(fèi)看”,當(dāng)?shù)鼐W(wǎng)友發(fā)帖反駁

震驚!大同懸空寺在公路旁砌墻“不讓免費(fèi)看”,當(dāng)?shù)鼐W(wǎng)友發(fā)帖反駁

火山詩話
2026-04-14 06:27:39
頂流小生解約遭排擠?王嘉爾要拍戲了?李昀銳孟子義三搭?何潤東撿漏?姨太問答

頂流小生解約遭排擠?王嘉爾要拍戲了?李昀銳孟子義三搭?何潤東撿漏?姨太問答

毒舌扒姨太
2026-04-15 22:42:21
20公里超長縱深!攤大餅行不通了,成都必須換玩法

20公里超長縱深!攤大餅行不通了,成都必須換玩法

阿萊美食匯
2026-04-15 19:32:44
深圳比亞迪火災(zāi)后續(xù):官方通報(bào)定調(diào),知情人透露起火現(xiàn)場更多細(xì)節(jié)

深圳比亞迪火災(zāi)后續(xù):官方通報(bào)定調(diào),知情人透露起火現(xiàn)場更多細(xì)節(jié)

奇思妙想草葉君
2026-04-14 19:30:57
烏克蘭5枚風(fēng)暴陰影導(dǎo)彈重創(chuàng)頓涅茨克機(jī)場!摧毀俄軍倉庫

烏克蘭5枚風(fēng)暴陰影導(dǎo)彈重創(chuàng)頓涅茨克機(jī)場!摧毀俄軍倉庫

項(xiàng)鵬飛
2026-04-15 21:08:30
2026-04-15 23:23:00
觀察者網(wǎng) incentive-icons
觀察者網(wǎng)
全球視野,中國關(guān)懷
138928文章數(shù) 1850408關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財(cái)經(jīng)要聞

業(yè)績失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評測

態(tài)度原創(chuàng)

親子
時(shí)尚
本地
家居
軍事航空

親子要聞

母嬰命懸一線,兇險(xiǎn)性前置胎盤穿透膀胱,這家醫(yī)院如何力挽狂瀾

赫本愛穿的傘裙,好優(yōu)雅!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

家居要聞

簡而不減 暖居之道

軍事要聞

萬斯:對當(dāng)前美伊局勢進(jìn)展“感到樂觀”

無障礙瀏覽 進(jìn)入關(guān)懷版