![]()
新智元報(bào)道
![]()
【新智元導(dǎo)讀】外媒重磅爆料!Anthropic疑似復(fù)制「降速門」,在新Opus 4.8發(fā)布前暗中閹割舊Claude性能,只為讓用戶一用新模型就覺得「神級」。曾經(jīng)高舉AI安全大旗的理想主義者,如今在商業(yè)化祭壇上親手撕掉最后一層遮羞布。
Anthropic欺人太甚!
外媒爆出Anthropic「計(jì)劃性淘汰」丑聞:為了推銷新模型Opus 4.8,Anthropic疑似在暗影中偷偷閹割了舊模型的性能。
![]()
另一邊,則是新旗艦Claude Opus 4.8倉促發(fā)布,bug不斷,token狂飆!
![]()
Claude的用戶,一覺醒來,腸子悔青了。
![]()
而在API調(diào)用中,Opus 4.8集體「認(rèn)親」國產(chǎn)Qwen,陷入了一場前所未有的身份坍塌。
![]()
那個(gè)曾經(jīng)標(biāo)榜「AI安全」、帶著理想主義光環(huán)的Anthropic,正「商業(yè)化」的祭壇上,親手撕掉自己的最后一層遮羞布。
![]()
![]()
不求最好,但要最貴
Claude模型是不是最厲害,還有爭議,但Anthropic的AI公認(rèn)地貴。
![]()
Claude在算力上已落人一步,加上Anthropic即將IPO,或許Opus 4.8操之過急!
![]()
Anthropic「陰謀」曝光:被指故意閹割舊模型
在消費(fèi)電子領(lǐng)域,蘋果曾因「降速門」被推上風(fēng)口浪尖——通過系統(tǒng)更新讓舊iPhone變慢,從而「誘導(dǎo)」用戶購買新品。
![]()
而現(xiàn)在,Anthropic把陰影籠罩在了大模型領(lǐng)域。
Chapter CEO指控:「Anthropic有點(diǎn)像是在照搬蘋果公司的做法:在新模型發(fā)布之前,故意降低舊模型的質(zhì)量,好讓新模型用起來感覺更棒。」
此前,用戶發(fā)現(xiàn)舊版Claude的性能正在無聲無息地縮水。
![]()
Anthropic先是試圖讓大家覺得4.7表現(xiàn)很好,但后來才承認(rèn)(或者說他們最終承認(rèn))4.7存在算力方面的問題。
![]()
Anthropic的公關(guān)辭令將其美化為「努力水平」(Effort Level)的調(diào)整。
但在從業(yè)者看來,這是一個(gè)冷酷的算力經(jīng)濟(jì)學(xué)算計(jì)。
大模型的智力,本質(zhì)上是昂貴GPU算力的函數(shù)。
為了讓新推出的Opus 4.8在跑分榜上驚艷世界,Anthropic必須騰出極其有限的H100算力池。
于是,舊模型被趕出了性能卓越的「精裝修機(jī)房」,塞進(jìn)了架構(gòu)更廉價(jià)、推理延遲更高、甚至量化精度更低的「數(shù)字貧民窟」。
這種「AI縮水式通脹(Shrinkflation)」比手機(jī)降速更危險(xiǎn)。
![]()
手機(jī)變慢只是讓你打開微信多等三秒。
而AI變笨,意味著你建立在其之上的商業(yè)決策、代碼邏輯和法律研判,正建立在一個(gè)隨時(shí)會(huì)坍塌的流沙地基上。
![]()
Opus 4.8降智了,蒸餾Qwen?
Opus 4.8這個(gè)版本,總感覺哪里不太對勁,就像是在匆忙修補(bǔ)4.7的漏洞。
![]()
Reddit上,一位Claude德語用戶變得很痛苦:
突然之間,它要么語法不對,要么會(huì)冒出完全莫名其妙的句子和詞語,根本說不通。
我試著通過修改系統(tǒng)提示詞來修正,但到目前為止效果不大。尤其是在「深度思考」模式下,幾乎沒法用——耗時(shí)太長,考慮的選項(xiàng)也太多。
他尋求意見:
有沒有什么設(shè)置可以調(diào)整,讓它「重回正軌」?
在基準(zhǔn)測試中,Opus 4.8都碾壓對手。
但殘酷的現(xiàn)實(shí)是,LLM根本無法通過基準(zhǔn)測試獲得有用的信號,來幫你判斷它們是否能完成你希望它們做的工作。
![]()
或許,好用的時(shí)候是真好用,但大部分并非如此!
![]()
Opus 4.7用20秒能處理的任務(wù),Opus 4.8要5分鐘!
![]()
有的Opus 4.8一直編造說自己被提示詞注入攻擊了,還說代碼被破壞了。
然后,它意識到自己在幻覺,繼續(xù)運(yùn)行,卻又開始懷疑有人在暗中破壞它。
![]()
有的Opus 4.8持續(xù)不斷、反復(fù)運(yùn)行同一個(gè)測試。
![]()
有的Opus 4.8突然降智。
![]()
Claude Opus 4.8已經(jīng)變得過于對抗性了,「智能有余,平衡不足」,導(dǎo)致嚴(yán)重結(jié)果:
不友好的體驗(yàn)、浪費(fèi)時(shí)間、誤導(dǎo)性的指導(dǎo)。它扼殺想法,而非在此基礎(chǔ)上進(jìn)行建設(shè)。
![]()
Claude Opus 4.8自稱Qwen,Anthropic也搞蒸餾?
這次的Claude Opus 4.8居然認(rèn)錯(cuò)祖宗!
如果你用中文提問,Opus 4.8會(huì)自稱是Qwen。
![]()
![]()
為什么呢?
一種可能的解釋是Opus蒸餾Qwen。
![]()
還有一種解釋是數(shù)據(jù)反向污染。
在訓(xùn)練Opus 4.8版本的語料庫中,已經(jīng)充斥了大量由Qwen、DeepSeek等開源模型生成的中文內(nèi)容。
當(dāng)這些開源模型以極高的效率和極大的規(guī)模占領(lǐng)互聯(lián)網(wǎng)語料庫時(shí),即便是高傲的Anthropic,也不得不吞下這些被開源AI重新「洗」過的二手?jǐn)?shù)據(jù)。
這不再是「誰偷誰」的問題,而是數(shù)字世界的近親繁殖。所有的閉源堡壘,最終都會(huì)在開源海洋的滲透下,變成對方的樣子。
第一次智能體讓我這么生氣
這次,Anthropic似乎徹底搞砸了Opus 4.8升級,情商帶來的傷害比智商似乎不遑多讓。
![]()
就連Claude Code的Harness也修不好它。
如果不使用Claude Code,網(wǎng)友Sam Cymbaluk直言:在日常聊天模式下,Opus 4.8蠢得要命!
![]()
Opus 4.8變得特別頑固。
Opus 4.8正在使用的服務(wù)器信息,但即使用戶明確指出了正確的對話,它仍然固執(zhí)地沿用錯(cuò)誤的配置。
![]()
它最終承認(rèn)了錯(cuò)誤,卻還是繼續(xù)使用錯(cuò)誤的服務(wù)器!
AI研究人員、哈佛博士、滑鐵盧大學(xué)助理教授Yuntian Deng,第一次被智能體如此憤怒。
![]()
如果和Claude聊聊科學(xué),它的毒舌絕對會(huì)給你精神暴擊。
![]()
相比之下,4.7簡直是個(gè)陽光小可愛。
![]()
大模型公司的護(hù)城河,不只是參數(shù)、算力和榜單。
更是用戶相信它不會(huì)在暗處縮水、不會(huì)在關(guān)鍵時(shí)刻失控、不會(huì)為了商業(yè)節(jié)奏犧牲體驗(yàn)的那份確定性。
一旦這份確定性被打穿,再強(qiáng)的模型,也會(huì)變成一門危險(xiǎn)的生意。
參考資料:
https://x.com/theinformation/status/2060783533564612887
https://x.com/yuntiandeng/status/2060545768054759705
https://x.com/hagen_hu/status/2060870150388072853https://x.com/jun_song/status/2060166645583343878
編輯:大衛(wèi)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.