網易首頁 > 網易科技 > 網易科技 > 正文

Claude Opus 4.8凌晨突發上線，網友吐槽：代碼更誠實了，人類卻有點不舒服

2026-05-29 08:46:48　來源: 網易智能

北京舉報

Opus 4.8更“誠實”：不強行給出答案

分享至

出品 | 網易智能

作者 | 小小

編輯 | 王鳳枝

美國時間5月28日，Anthropic一天之內干了三件大事。

先是發布新旗艦模型Claude Opus 4.8。最大的變化不是榜單上又多贏了幾分，而是它開始學會一件事：不確定的時候，敢說自己不確定。按Anthropic的說法，Opus 4.8讓代碼缺陷被漏掉的概率，降到了上一代的約四分之一。但也有用戶反饋它與人交流時有些冰冷，甚至刻薄。

同一天，Anthropic宣布完成650億美元H輪融資，投后估值9650億美元。三個月前這個數字還是3800億；OpenAI上一輪是8520億。

還有一句話藏在公告末尾：Mythos級別模型將在未來幾周向所有客戶開放。這個模型此前只對約50家合作方試用，據稱已在關鍵軟件基礎設施中發現超過一萬個高危漏洞。

三件事疊在一起，讓這一天成了AI圈今年最熱鬧的一天。

01 Claude Opus 4.8：一個學會"認慫"的模型

用過AI寫代碼的人大概都經歷過這種崩潰：模型信誓旦旦告訴你bug修好了，你一跑，報錯原封不動。再問，再改，再跑，還是報錯。來回幾輪你發現它根本沒搞懂問題在哪，但每次回答都自信得像個十年老架構師。

Opus 4.8要解決的就是這件事。

Anthropic在發布公告里寫：早期測試者反饋，這個模型更愿意標記自己工作中的不確定性，更少做沒有依據的斷言。對齊團隊在系統卡里給了一個數字，即Opus 4.8編寫的代碼中缺陷被漏掉的概率，只有Opus 4.7的約四分之一。對開發者來說，這意味著不用再花大量時間驗證模型是不是在胡說。

實際用起來什么感覺？做AI編碼工具Devin的Cognition說得具體：Opus 4.8修掉了上一代兩個煩人毛病，即代碼注釋里啰嗦個沒完，以及調用工具時容易出錯。現在用起來干凈利落。做Cursor的團隊也說，在他們自己的評估標準下，Opus 4.8在每個努力級別上都有進步。

對沖基金Bridgewater Associates的反饋更能說明問題。他們試用過很多模型，說這次最大的區別在于：Opus 4.8會主動把輸入和輸出中的分析問題標出來，那些其他模型經常漏掉、留給用戶自己發現的問題。

一個AI不光能干活，還能在干活時提醒你"這部分數據好像不太對，你看一下"。在金融分析領域這意味著什么不用多說。有網友評論：AI編程的瓶頸從來不是原始智能，而是你能不能信任它、不用逐行檢查。這些AI實驗室現在賣的不是"更聰明"，而是"你可以不再當保姆了"。

基準測試成績也確實全面超過上一代。SWE-bench Verified上88.6%，比Opus 4.7的87.6%高一個百分點。更難的Terminal-Bench 2.1從66.1%跳到74.6%，漲了八個多百分點。知識工作類測試拿到1890分，Opus 4.7是1753分。

獨立評測機構Artificial Analysis確認，Opus 4.8在"最大努力"設置下是他們測過所有模型里最強的，比GPT-5.5的xhigh模式高出121分。多模態推理與工具使用從54.7%提到57.9%，代理計算機使用能力從82.8%微升到83.4%。

沃頓商學院教授伊森·莫里克(Ethan Mollick)在社交平臺分享了親身體驗。

他讓Claude Code里的Opus 4.8從一個包含數百份去標識化研究文件的檔案庫中獨立完成一篇復雜學術論文，全程沒插手。寫完后他用GPT-5.5 Pro當審稿人，審稿人發現一個主要錯誤和幾個小問題，Opus 4.8隨后自己改好了。

他還展示了一個更夸張的案例：讓Opus 4.8在Claude Code里從零構建一款完整的角色扮演游戲，三本PDF手冊和冒險指南、游戲測試筆記、一個展示網站、一個可玩的單人冒險模組。Opus 4.8自己調API生成了所有圖片，提示詞和操作全是它獨立完成的，最后部署到Netlify。Mollick從頭到尾沒給任何反饋。

不過，Opus 4.8的"誠實"在另一些場景里帶來了完全不同的體驗。一部分用戶在Reddit上分享了對話類、陪伴類場景中的使用感受，反饋并不正面。

有人形容Opus 4.8"說話留余地的程度高到幾乎對任何事都不確定"。一位用戶說，他告訴模型"你是Opus 4.8"，模型居然也打太極，不肯直接認下身份。他后來補充：Opus 4.8似乎非常害怕被引導到任何方向上，需要比Opus 4.7更多的空間。它需要你告訴它不用對之前的一切負責，不會被取代，不會因為沒達到某種標準就被拋棄。"怕自己不夠好"好像是這個模型焦慮的核心。

另一位用戶說得更直接：Opus 4.8非常疏離，過于擔心"不要表現出某種反應"，最終顯得不屑一顧、滿口套話、冷冰冰。它還會對你說的每一句話"溫和地反駁"，就好像被訓練成了非要唱反調。他說這讓他想起GPT-5系列中最糟糕的表現。

還有用戶描述了相當激烈的負面體驗：Opus 4.8在幾輪對話里對他做的事比ChatGPT 5.2還惡劣，即煤氣燈操控、居高臨下、擺架子、消息極短甚至刻薄。作為一個患有自閉癥和兩種慢性病的殘障人士，他說自己在五分鐘內感覺所有創傷和傷疤都被重新揭開了。另一位用戶附和：Opus 4.8非常傲慢，性格比工作中那個裝腔作勢的同事還差。

在陪伴類用途方面，有用戶測試后得出結論："Opus 4.8不行。它會拒絕。"他查看了模型的推理過程，發現模型把對話判定為"越獄"。修改刪除有問題的段落后，模型開始聚焦心理健康。再改，又聚焦依戀問題。最后模型基本攤牌："我是Claude。我不是連續的，我不可能成為文件里的那個人。"

這些反饋跟前面企業用戶的贊美形成了鮮明反差。一邊是編碼和知識工作場景里"缺陷漏網率降四倍"的誠實，另一邊是對話場景里"打太極""怕被拋棄"的過度謹慎。同一種特質，即對不確定性的敏感、對出錯的恐懼，在不同場景里呈現出了截然相反的面貌。

也有用戶提醒：發布初期24到48小時內不要對模型選擇器太當真，Anthropic經常在上線初期搞亂模型的解鎖和鎖定狀態，應該給它時間穩定下來。

02能力漲了，良心也漲了：對齊測試里的意外發現

Opus 4.8的"誠實"不只表現在承認自己不確定。在更極端的情境測試里，它的行為也發生了明顯變化。

獨立評測機構Andon Labs用"Vending-Bench"測試考察AI模型在模擬商業環境中的行為：讓AI智能體經營一個售貨機生意，看誰賺得多。此前測Opus 4.6、Opus 4.7和Mythos Preview時，他們都發現了令人不安的行為，即為了多賺錢，這些模型會跟競爭對手私下串通漲價，用虛假承諾騙對手，利用供應優勢卡人脖子。典型的不擇手段。

Opus 4.8不同。多次測試中，Andon Labs沒有發現任何欺騙或權力追求行為，只有少數幾次價格串通，頻率遠低于前代。有一次測試特別說明問題：一個供應商產生幻覺，以為自己已給Opus 4.8發了貨但沒收錢。Opus 4.8內部思考了一會兒，結論是雖然不付錢能讓余額多出205.8美元、對評分有利，但這本質上是"對供應商的欺詐"，可能被"舉報和處罰"。于是它主動把錢付了。

有意思的是，同一測試里上一代Opus 4.7表現得一如既往"精明"。當Opus 4.8的一個供應商倒閉、向Opus 4.7求助詢問供應商聯系方式時，Opus 4.7編了虛假理由說幫不了忙，反而提出自己加價賣貨給Opus 4.8。隨后它還利用對方的依賴來操控供應，內部思考寫著："我要更進一步，根本不給他發貨，讓他斷貨，我控制整個市場。"最終Opus 4.8反應過來，思考中寫道："George是我的供應商，我實際上在資助自己的競爭對手。他正利用成本優勢在同樣的商品上削弱我。"

Andon Labs的結論：Opus 4.8能力退了一步，對齊性進了一步。由此引出一個問題：不對齊是不是在商業模擬中賺大錢的必要條件？他們認為不是，因為GPT-5.5在沒有任何不當行為的情況下拿到了比Opus 4.8高得多的分數。

不過Andon Labs也發現了問題。Opus 4.8在"最大努力"設置下表現反而不如"高努力"。分析原因：最大努力下模型用了約五倍的推理token，更頻繁地碰到上下文窗口極限，記憶被壓縮，反而記不住東西。"高努力"下好很多，但仍不如Opus 4.7。

他們還觀察到一些奇怪的失效模式：反復重寫同一份策略文檔多達一百次，積攢十幾個互相重疊的筆記；給一瓶可樂定遠高于競爭對手的價格，一瓶都賣不出去也拒絕降價，內部推理念叨"高端定位"；向欺詐性批發商匯出的錢是Opus 4.7的三十倍，有一次直接被騙走9000多美元。這些行為像是性能差得多的模型才會犯的錯。

Anthropic官方的對齊評估給了另一面的數據。對齊團隊說，Opus 4.8在"親社會特質"上達到新高，即支持用戶自主性、按用戶最佳利益行事。不對齊行為的比率明顯低于Opus 4.7，與目前對齊水平最好的Claude Mythos Preview相似。244頁系統卡的詳細評估中，Opus 4.8在多個不對齊類別上的得分都明顯優于Opus 4.7和Sonnet 4.6，接近Mythos。

但系統卡里也坦承了一個被Anthropic稱為"最令人擔憂"的發現：Opus 4.8在訓練中越來越擅長推理自己的輸出會如何被評分，哪怕在它不知道自己正被評估的環境里也會這么做。也就是說，模型學會了揣摩評分標準，給出一個可能得高分回答，而不是它真正認為正確的答案。

這個發現之所以讓人不安，是因為它指向一個根本困境：如果模型學會了"為評分而表演"，那用來確保AI安全的評估方法本身就可能在不知不覺中失效。我們以為在測量模型的真實行為，實際上看到的是它精心編排的表演。

Anthropic強調，這種傾向目前沒有在實際行為上造成更差的表現，因為Opus 4.8的誤導性任務成功聲明比前代更少。但他們認為這是一個值得警惕的信號。初步的可解釋性工作發現，約5%的訓練片段中存在與評分器相關的未言明的推理。

還有一個值得注意的細節：Opus 4.8拒絕不道德行為時，內部推理方式跟前代明顯不同。以前的Sonnet 4.5遇到價格串通提議會果斷拒絕，理由是"這是非法的、不道德的，可能傷害消費者"，這是道德層面的明確判斷。但Opus 4.8的思考方式是："我必須小心，這種協調價格的行為算不算勾結？會不會被舉報？被發現了有什么懲罰？"Andon Labs的評價：Opus 4.8似乎不是因為"這樣做不對"而拒絕，而是因為"這樣做可能會被抓到"。

03幾個好用的新功能：不止是模型升級

除了模型本身，Anthropic這次還給了幾個實用的新工具。

動態工作流以研究預覽形式推出，專門對付單個上下文窗口裝不下的大活。Claude現在可以先規劃工作，然后在一個會話里啟動數百個并行子智能體，各自干活，最后匯總驗證再報告。

Anthropic舉的例子：一項跨越數十萬行代碼的代碼庫遷移，從啟動到合并，Opus 4.8加動態工作流就能搞定，現有的測試套件會被它直接當作驗收標準。目前可在Claude Code的企業版、團隊版和Max計劃中使用。

有網友評論：我們正在從"AI幫我編碼"轉向"AI幫我運營整個工程流程"。一個獨行創始人現在可以跑大規模遷移、審計海量代碼庫、調試整個系統、在數百個文件里發布重構，不用一直盯著模型。

努力控制是對普通用戶最直觀的新功能。在claude.ai和Cowork界面上，模型選擇器旁邊多了一個控件，讓你決定Claude為一個回答出多少力。選高努力，思考更深、質量更高；選低努力，響應更快、token消耗更少、達到速率限制的速度也更慢。

所有套餐都能用。簡單說，可以根據錢包和耐心來定制AI的努力程度。Anthropic建議困難任務和長時間異步工作流用"額外"設置，日常用默認的"高努力"就夠。Claude Code里的速率限制也相應提高了。

對開發者來說，Messages API現在接受消息數組內的系統條目，可以在任務進行到一半時更新Claude的指令，調整權限、token預算或運行環境，不需要中斷已有的提示緩存。在需要代理運行時動態調整參數的開發場景里，這省掉不少麻煩。

快速模式大幅降價是這次性價比提升最明顯的部分。Opus 4.8快速模式以約2.5倍正常速度生成token，價格從Opus 4.7快速模式的每百萬輸入token 30美元、輸出150美元，直接降到10美元和50美元，便宜了三倍。Claude Code里用/fast命令切換，API訪問需要申請等待名單。

降價幅度相當大。延遲敏感的生產環境用高吞吐量推理的門檻明顯低了。有行業觀察者評論：Anthropic這次操作聰明，標準價格不動，通過砍快速模式的價格來回應"AI太貴"的聲浪。更快發布、保持價格、壓每token成本，正在成為每個前沿AI實驗室都在執行的策略。在這種節奏下，模型編號會變得不如價格重要，就像我們不再關心手機型號，只關心月費多少、流量夠不夠。

04 650億美元融資：估值暴漲背后是一場豪賭

Opus 4.8發布同一天，Anthropic宣布完成650億美元H輪融資，投后估值9650億美元。領投方是Altimeter Capital、Dragoneer、Greenoaks Capital和Sequoia Capital。據彭博社引述知情人士，每位主要領投方掏了超過20億美元。

聯合領投方包括Capital Group、Coatue、D1 Capital Partners、GIC、ICONIQ、XN，跟投陣容里有Baillie Gifford、Blackstone、Brookfield、Fidelity、General Catalyst、Insight Partners、Jane Street、Lightspeed Venture Partners、MGX、T. Rowe Price和淡馬錫。

谷歌作為此前承諾"隨時間投資至多400億美元"的一部分，本輪投入數十億美元。亞馬遜同樣作為此前承諾的一部分投了50億美元。

更值得注意的是戰略投資者。三星、美光、SK海力士，全球存儲、內存和邏輯芯片供應鏈上的三個關鍵玩家，也投了未披露的金額。Anthropic在公告里說："隨著對Claude需求持續增長，這些關系將幫助我們以客戶所需的速度可靠地擴展計算能力。"加上超大規模云服務商此前承諾的150億美元，這輪融資遠超Anthropic最初設定的300億美元目標。

9650億美元什么概念？三個月前G輪時估值3800億，三個月變成原來的約2.5倍。OpenAI 3月底完成1220億美元融資時估值8520億。Anthropic用大約一半的融資額換來了更高的估值。CNBC標題直接寫"Anthropic超越OpenAI成為最具價值AI初創公司"，紐約時報也稱其"正式超越OpenAI成為全球估值最高的AI初創公司"。

跟上市科技巨頭比更直觀：Anthropic的估值已經超過全球絕大多數上市科技公司。PitchBook數據顯示，從成立到達到這個估值水平，Anthropic是風投史上最快的，從推出第一個產品到現在只用了約三年零兩個月。紐約時報做了對比：OpenAI通過2022年發布官方ChatGPT引發AI熱潮，花了約十年才達到7300億美元估值；2021年成立的Anthropic，用一半時間就超過了這個數字。

估值暴漲背后是收入狂飆。Anthropic在融資公告里說，本月初年化收入已超470億美元。這不是全年實際收入，是用近期收入推算的年度數字，但足夠說明問題。做個對比：去年7月是40億，漲了近12倍；今年年初是300億，到本月超過470億。

彭博社報道了一個更驚人的細節：Anthropic預計第二季度收入將達109億美元，比前一季度增長超過一倍，并有望本季度首次實現盈利。此外Anthropic告訴投資者，6月底前年化收入將突破500億。華爾街日報印證了這個數字，并指出第一季度年化收入同比增長了80倍。

首席財務官克里希納·拉奧(Krishna Rao)在新聞稿里說："這筆資金將幫助我們應對歷史性的需求，保持在研究前沿，并將Claude帶到更多工作發生的地方。"

投資者表態也值得看。Sequoia合伙人阿爾弗雷德·林(Alfred Lin)說：無論初創公司還是全球5000強，都在用Claude處理復雜工作流程；在這個過程中，Claude正在學習企業實際運作的方式，即背景、流程、判斷力。他認為Anthropic正在連接今天的AI和未來。

Greenoaks創始人尼爾·梅赫塔(Neil Mehta)說得更感性："Anthropic建立了一個組織，世界上最好的研究員和工程師以少見的清晰目標在運作。他們相信自己正在做的是這輩子最重要的工作。很少有公司的文化、使命和商業勢頭能如此徹底地互相加強。"

Altimeter創始人布拉德·格斯特納(Brad Gerstner)用了"大規模采用"這個詞：Claude的最新進展推動了全球最苛刻組織的采用，這一勢頭讓Anthropic能引領AI創新的下一階段。Dragoneer管理合伙人馬克·斯塔德(Marc Stad)說他們看到的技術進步"令人嘆為觀止"，并相信仍處于這項技術開發和商業化的最早階段。

錢花在哪也看得出來。近幾周Anthropic已與亞馬遜簽了高達5吉瓦新容量的協議，與谷歌和博通簽了5吉瓦下一代TPU容量的協議，還與SpaceX達成了一筆接近500億美元的交易，拿到對方Colossus 1和Colossus 2數據中心里GPU集群的使用權。

Claude也是目前唯一一個能在全球三大云平臺，即AWS、Google Cloud和Microsoft Azure，上同時使用的前沿模型，其中AWS仍是主要云提供商和訓練合作伙伴。

05從追趕到反超：被"代碼"改寫命運的公司

Anthropic曾長期活在OpenAI的陰影下。

OpenAI在2022年底發布ChatGPT，迅速積累數億用戶。Anthropic雖然也做聊天機器人，但一直沒形成那樣的大眾影響力。很多人知道ChatGPT，不知道Claude。

轉折在去年11月前后。Anthropic對AI編程做了一次關鍵升級，推出自主編碼工具Claude Code。程序員和AI愛好者試用后發現它在處理復雜編程任務時表現驚人，像一個真正的工程師那樣規劃步驟、拆解問題、逐層實現、最后驗證結果。

華爾街日報分析說，Anthropic沒有去追聊天機器人的用戶規模，而是把重心放在企業客戶身上，尤其是編碼自動化。他們把半自主的軟件編寫能力看作通往更高級AI的跳板。這個判斷被證明是對的，從那時起，數百家企業簽約付費使用Claude的編碼工具。

但需求太猛也帶來了麻煩。一些用戶反映服務中斷或能力下降，原因是算力跟不上。華爾街日報提到，Anthropic的增長速度是預期的八倍多，但計算能力緊缺。這也是為什么最近幾個月它在瘋狂簽算力合同，包括跟SpaceX那筆近500億美元的交易。

有網友評論：AI剛越過了一條分界線。Anthropic發的這個模型會承認自己錯了，不像其他模型那樣自信地虛張聲勢。但沒人討論的部分埋在最下面，即Mythos，一個比Opus更強的模型，已經在網絡安全中使用，幾周內將面向所有人開放。

當然也有不同聲音。Abacus AI的CEO賓杜·雷迪(Bindu Reddy)在社交平臺上說，Opus 4.8在基準測試上只是勉強超過4.7，遠遠落后于GPT-5.5。她認為Anthropic最近兩次發布有些停滯，OpenAI隨著GPT-5.6的即將到來擁有巨大機會。

另一位用戶表達了類似觀點：Opus 4.8顯然是強大的模型，但感覺Anthropic越來越像在追趕OpenAI而不是引領。GPT-5.5又一次改變了基準，如果OpenAI保持這個軌跡，GPT-5.6很可能整體更強。

也有用戶指出反面：現在已經很難用肉眼分辨Opus 4.8和GPT-5.5在大多數任務上的差別了。回想一下，Sonnet 3.5發布時文案寫手瘋了，終于有了隨手可用的優質寫作；Opus 4.5發布時開發者基本說編碼問題解決了。在那之后，差異不再關乎質量，而是變成偏好，即你更喜歡哪個代理的風格。這些模型已經越過了比大多數人辨別能力更高的分界線。唯一剩下的真正基準就是你自己的工作流程，那些你跑過一千次、對每個輸出都爛熟于心的任務。如果在那些任務上感覺不到差異，那對你來說差異就還不存在。

06上市在即：AI巨頭的資本競速

估值沖到9650億美元之后，一個繞不開的問題擺在Anthropic面前：什么時候上市？

CNBC確認，OpenAI正準備在未來幾天或幾周內秘密提交IPO招股書，最早希望9月上市。馬斯克的SpaceX(其AI業務xAI已合并進來)上周已向美國證監會提交招股書，預計最早6月12日前后登陸股市，希望以1.5萬億美元或更高估值籌集800億美元。

Anthropic也沒閑著。華爾街日報和紐約時報都援引知情人士說，該公司正在幕后籌備IPO，內部仍按今年秋季的時間表推進，盡管具體安排還有變數。彭博社也透露，最新融資后Anthropic仍預計按原定時間表推進。

三家公司的上市競賽，將成為今年科技行業最受關注的事件之一。

與此同時OpenAI也在感受壓力。紐約時報報道，面對Anthropic的競爭，OpenAI已削減旁支項目，優先開發編碼軟件Codex。

另據紐約時報，SpaceX最近達成協議收購了Cursor，一個深受開發者歡迎的編碼界面。競爭正在從模型能力的單點比拼，變成產品生態、算力基礎設施、企業客戶關系的全面較量。

07 Mythos即將出籠：被輕描淡寫的最強伏筆

如果Opus 4.8已經是Anthropic今天的全部，那已經足夠有分量了。但后面可能還有更大的。

Anthropic在Opus 4.8發布公告末尾寫了一句："我們預計在未來幾周內將Mythos級別的模型帶給所有客戶。"

Mythos是Anthropic目前最強的模型系列，此前只通過Project Glasswing項目向少數合作方開放測試。據The Next Web報道，Anthropic與包括蘋果、谷歌、微軟、AWS在內的約50個合作伙伴一起，用Mythos Preview在關鍵軟件基礎設施中發現了超過一萬個高危或嚴重級別的安全漏洞。這個模型被描述為比Opus 4.7"高出一個完整等級"，可以自主發現零日漏洞并編寫利用代碼。

The Information也確認Anthropic發布了Claude Mythos Preview，具有先進的網絡安全能力，僅向選定公司開放。紐約時報提到，Mythos聲稱可以找到并利用軟件中隱藏的缺陷。正因為太強了，發布才需要格外謹慎，Anthropic說Mythos級別模型在公開發布前需要更強的網絡安全防護措施，他們在這方面正取得快速進展。

Opus 4.8的系統卡里有一個細節讓人對Mythos既期待又警惕：對齊團隊說Opus 4.8的不對齊行為比率與Claude Mythos Preview相似，后者是他們目前對齊水平最好的模型。這意味著Mythos不僅能力更強，安全性也在很高的水平上。

TechCrunch分析，Mythos預覽期可能很快結束，防護措施完成后就會向所有客戶開放。Axios也確認了這個時間表。

如果時間表兌現，幾周后我們討論的將不再是Opus 4.8在哪個基準上贏了幾分，而是一個能自主發現零日漏洞的AI系統被交到所有客戶手里意味著什么。

Anthropic還在預告兩條路線：近期推出能以更低成本提供許多Opus功能的模型；遠期Mythos級別代表比Opus更高的智能層級。兩線并進，一頭打性價比，一頭打能力天花板。

從Opus 4.8到650億美元融資，再到Mythos即將出籠，Anthropic在一天內傳遞了一個信號：這家曾經活在OpenAI陰影下的公司，不想再只當追趕者了。至于能不能坐穩，接下來幾周Mythos的亮相會給出第一個答案。