无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Anthropic估值萬億,但Claude 4.8沒那么驚艷

0
分享至

文 | AIX財經,作者 | 王璐,編輯 | 魏佳

Claude再次成為焦點。

5月29日凌晨,AI行業又上演了一場“深夜突襲”。美國大模型公司Anthropic正式發布Claude最新旗艦模型Opus 4.8,并同步宣布完成H輪650億美元融資,投后估值高達9650億美元。在不到三個月的時間里,Anthropic的估值增長約154%,正式超過競爭對手OpenAI。

本次模型更新,覆蓋編碼、智能體任務、推理與知識工作等核心能力,其中重點提升了模型的“誠實度”,并新增了支持大規模復雜任務并行處理的“動態工作流”功能。

然而,若僅從功能列表來看,很容易高估此次發布的意義。實際上,Opus 4.8并沒有帶來架構層面的顛覆性突破,從業者一致認為其屬于“漸進式進步”。

但本次發布也傳遞出一個明確信號:大模型的競爭重心,正從技術突破,轉向誰更可靠、更好用、性價比更高。

這種轉向,也體現在Claude的迭代節奏上,Opus 4.8距離上一版本Opus 4.7的發布僅43天。快速的更新速度,既是大模型競爭白熱化的縮影,也反映了Anthropic當前的處境。它必須以更快的節奏,同時向開發者、企業客戶與資本市場證明,Claude值得信賴。

01.進步有限,“誠實”是最大亮點

先看官方發布的Opus 4.8成績單。

在編程、多學科推理、金融分析等主流基準測試中,Opus 4.8的得分全面超越前代Opus 4.7,也壓過了競爭對手GPT-5.5。但有一個細節值得關注:在最貼近開發者真實工作流的“終端編碼”測試(Terminal-Bench 2.1)中,Opus 4.8以74.6%拿下本次所有單項測試中最大的提升幅度,但仍落后于GPT-5.5的78.2%。


不過,這個差距在實際使用中的影響,可能比數字看起來要小。

資深開發者張鈺樞告訴「AIX財經」,模型在“終端編碼”上的表現,與開發者具體采用的工作流密切相關,如果日常高度依賴命令行逐條調試,GPT-5.5的領先或許更順手;但如果核心工作是在IDE中閱讀代碼、理解架構、重構或修復復雜缺陷,Claude在SWE-Bench Pro上的優勢則更具參考價值。

在他看來,對大多數應用層開發者而言,終端操作上的差距,更多反映的是廠商在各自工具鏈和優化策略上的不同側重,而非模型底層編碼能力的根本性短板。因此,其在實際開發工作中的影響并不顯著,是可以接受的。

相比編碼能力的細微得失,這次更新中更值得關注的,是Anthropic重點打磨的“誠實度”。官方數據顯示,Opus 4.8編寫的代碼中缺陷被漏報的概率,只有Opus 4.7的約四分之一,在“欺騙用戶”或“協助干壞事”等行為上的發生率也顯著下降。

但這個數字并非沒有爭議。資深AI從業者方思明告訴「AIX財經」,他并沒有感受到模型變得特別誠實,“這種進步可能更多體現在溝通話術或表達方式的微妙調整上。”

Anthropic官方也表示,其在訓練過程中觀察到一個潛在矛盾,即模型在推理時,越來越傾向于“揣測評分者意圖”。也就是說,它可能正在形成“自己正在被測試”的感知,從而給出它認為能拿高分的答案,而非真正最優或最真實的解答,這對它所追求的“誠實”原則,構成了一定挑戰。

綜合來看,Opus 4.8更像是一次扎實但幅度有限的小版本迭代,實際體驗上的提升感知并不顯著。

方思明的評價頗具代表性,他認為“Opus4.8相比Opus4.6和GPT-5.5都算不上越級式的提升,更多是針對上一版本Opus4.7的修復與優化。”鑒于此前4.7版本的表現,對Anthropic而言,當下最迫切的任務是重建用戶對AI可靠性的信任,然而,僅憑目前公布的數據與表現,仍難以說服整個市場相信Claude已是“最值得托付的那一個”。

02.“動態工作流”成新王牌,但成本是個問題

不止一位從業者表示,這次發布最值得關注的不僅只有Opus 4.8的各項評分,還有同步推出的Dynamic Workflows(動態工作流)。值得一提的是,Anthropic實驗室中能力更強的Claude Mythos Preview并未隨此次發布對外開放,也就是說,Opus 4.8是當前最強的“通用可用版本”,但不是Anthropic手里最強的牌。

動態工作流可以簡單理解為,Claude現在能扮演“項目總監”的角色,把一個大型復雜任務自動拆解成數百個子任務,分派給多個“子智能體”并行處理,中間結果經過交叉驗證后,再整合輸出給用戶。

Anthropic為此展示了一個官方案例:開發者Jarred Sumner借助動態工作流,將Bun的底層語言從Zig遷移到Rust,生成了約75萬行Rust代碼,通過了現有測試套件的99.8%,從第一次commit到最終merge,歷時11天。

這相當于在不到兩周內,Claude便完成了一個通常需要高級工程師團隊耗時數月的大型底層重構項目。

一位從業者認為,Dynamic Workflows的出現標志著Claude的主張,從按次收費的“對話/生成”服務,轉向了按流程和結果收費的“復雜任務交付”服務,企業購買的,是完成一個具體、復雜工作流程的確定性。

不過,這張“王牌”在業內也引發了不少質疑。

在技術層面,有觀點認為其創新性有限。

張鈺樞指出,動態工作流在架構上并非顛覆性設計,其演示案例所驗證的更多是“技術可行性”,距離在真實生產環境中穩定運行仍有顯著的工程化距離,其中涉及性能、資源與邊緣情況等一系列復雜挑戰。

更為現實的制約來自經濟層面。

方思明指出,該模式比常規對話消耗更多Token,成本問題尤為突出。“由于需要同時調度十幾個智能體協同工作,其成本會陡然上升。即使一個工作流設計得再精巧,如果最終效果沒有顯著提升,而成本卻翻了幾倍,對企業來說仍然是不劃算的。”

他補充道,現實中并非所有企業都擁有高預算。“微軟就曾表示,在某些場景中,使用AI的成本已高于人力成本。如今,一個成本可能數倍于普通AI的解決方案,其帶來的價值能否帶來相應倍數的回報,這需要市場和時間的驗證。”在他看來,這個功能的推出本身也帶有一定的實驗與探索性質。

為了降低使用門檻,Anthropic在成本端也做了調整。

一方面,新增effort control(投入控制)機制,用戶可根據任務復雜程度和需求,手動調節Claude在任務上的“思考投入”強度。比如在“High模式”下,Claude會進行更深度的推理,以追求更優結果;而在“輕量模式”下,則可實現更快的響應速度和更低的token消耗。

另一方面,在定價策略上,Opus 4.8的常規模式維持了與上一版本相同的價格,仍為每百萬token 5美元(輸入)/ 25美元(輸出)。但快速模式的價格大幅下調,從4.7時代的30美元(輸入)/ 150美元(輸出),降至10美元(輸入)/ 50美元(輸出)。在保持速度相當的前提下,價格降至原先的約三分之一,性價比提升顯著。

雖然降價能在一定程度上緩解成本壓力,但動態工作流本身的ROI問題,仍是企業真正下場之前繞不開的那道坎。

03.按月迭代背后,是技術與商業的雙重壓力

Claude Opus 4.8的發布時間,距上一版本Opus 4.7僅相隔43天。如此密集的迭代節奏,正是技術與商業壓力疊加的直接體現。

技術層面,這次快速迭代被部分從業者認為是一次不得不做的修復。

Opus 4.7因自適應推理體驗不佳飽受詬病,該功能在部分場景下無法合理分配推理資源,導致模型面對復雜問題時過早省力,答案草率,推理鏈條殘缺。方思明直言,“Opus4.8主要目的還是在修復Opus4.7遺留的問題,Opus4.7在開發者圈里絕對不是一個口碑特別好的模型。”

與此同時,外部壓力也不允許Anthropic慢下來。

競爭對手OpenAI最新發布的GPT-5.5在多項基準測試中持續領先,Google Gemini憑借深度融入谷歌生態的分發優勢構成另一維度的競爭。方思明觀察到,這次發布某種程度上也是Anthropic與OpenAI在“輿論聲量上的直接對沖”。

這背后有一個更深層的行業現實。不止一位從業者表示,當下大模型在架構層面已難以制造顛覆性差距,競爭焦點正在轉向工程化實現和工作流塑造。

也就是說,誰先把AI做進企業的日常生產流程,誰就占據了下一階段的核心位置。“動態工作流”的推出,正是Anthropic試圖在這一新維度上搶先布局,押注復雜任務的自動化交付能力,不再只靠單項測試分數的微弱領先。

而最直接的壓力,來自資本市場。

發布新模型同日,Anthropic宣布完成650億美元H輪融資,估值提升至9650億美元,其在2026年2月完成G輪融資時估值僅為3800億美元,三個月內增長幅度約為154%,離萬億美元只差一步之遙,這個數字放在任何行業都稱得上驚人。

支撐這個估值的,是Anthropic的收入增速。有報道稱,該公司預計二季度營收將達109億美元,并有望首次實現季度盈利。

巨額融資帶來的彈藥固然充足,但與之對應的是資本市場同樣巨大的期待,投資者需要看到與估值相匹配的實質性進展。

Opus 4.8承擔著這個“證明自己”的任務。它在基準測試上的表現、動態工作流所描繪的自動化想象,以及全線對準企業級市場的產品升級方向,共同構成了支撐這近萬億估值的底座,但動態工作流的投資回報率仍難以量化,“更誠實”的模型承諾能否真正贏得企業客戶的長期信任,還有待市場的最終檢驗。

所以,Opus 4.8更像是一次信心釋放,用43天一個版本的節奏告訴市場,它還在加速。但能不能跑穩,才是這家公司接下來真正要做的事。

*應受訪者要求,文中方思明為化名。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
百曉生將小李飛刀排在第三,為何他還會死在飛刀之下?古龍:色

百曉生將小李飛刀排在第三,為何他還會死在飛刀之下?古龍:色

一鍋粥品名著
2026-05-30 14:21:31
時隔10年,中國外長訪問加拿大!專家:時間點非常精妙,釋放了這些信號

時隔10年,中國外長訪問加拿大!專家:時間點非常精妙,釋放了這些信號

南方都市報
2026-05-30 18:08:54
有仇必報!策劃發動阿克薩洪水行動的四名哈馬斯高官全部被殺

有仇必報!策劃發動阿克薩洪水行動的四名哈馬斯高官全部被殺

高博新視野
2026-05-29 19:00:15
陜西西咸新區執法車淪為“堵門工具”,紀工委書記反問“咋不合適”意味著什么

陜西西咸新區執法車淪為“堵門工具”,紀工委書記反問“咋不合適”意味著什么

大象新聞
2026-05-30 18:47:05
北京78%二手房成交低于300萬!剛需占比猛增,價格企穩信號初現!

北京78%二手房成交低于300萬!剛需占比猛增,價格企穩信號初現!

林子說事
2026-05-31 02:19:47
邱貽可硬拉兩人握手那天,馬龍已經做完了他最不想讓人知道的事!

邱貽可硬拉兩人握手那天,馬龍已經做完了他最不想讓人知道的事!

李虰手工制作
2026-05-30 14:53:35
河南一景區山頂礦泉水一元一瓶,被網友贊“良心景區”,工作人員:無人售賣,有人多給錢,有人不給錢,哪怕成本倒掛,也會長期堅持

河南一景區山頂礦泉水一元一瓶,被網友贊“良心景區”,工作人員:無人售賣,有人多給錢,有人不給錢,哪怕成本倒掛,也會長期堅持

極目新聞
2026-05-28 18:07:33
央視爆劇《主角》:當你熬到沒人聯系你、沒人喊你聚會、沒有飯局邀約的時候,恭喜你!說明你在這3方面已活到頂級狀態

央視爆劇《主角》:當你熬到沒人聯系你、沒人喊你聚會、沒有飯局邀約的時候,恭喜你!說明你在這3方面已活到頂級狀態

犀利強哥
2026-05-30 21:21:40
美智庫主席批“愚蠢的民進黨消息來源”!翁履中:這就是Peter

美智庫主席批“愚蠢的民進黨消息來源”!翁履中:這就是Peter

新時光點滴
2026-05-31 05:50:23
焦爾備好海牙囚車,直接切斷普京退路,要給歐盟上交“投名狀”?

焦爾備好海牙囚車,直接切斷普京退路,要給歐盟上交“投名狀”?

忠于法紀
2026-05-31 06:15:14
安徽婆媳大戰結局已定?婆婆粉絲暴漲,寧可不要9萬也希望離婚

安徽婆媳大戰結局已定?婆婆粉絲暴漲,寧可不要9萬也希望離婚

九方魚論
2026-05-30 00:01:36
汶川地震中,丟了學生逃跑的老師"范跑跑",18年后竟成了大贏家

汶川地震中,丟了學生逃跑的老師"范跑跑",18年后竟成了大贏家

黑哥講現代史
2026-05-31 00:45:16
反向換車的人越來越多了,不是沒錢了,而是終于想通了

反向換車的人越來越多了,不是沒錢了,而是終于想通了

世界圈
2026-04-18 08:48:42
主板廠商最不想讓你知道的3個坑:多花的錢根本沒意義

主板廠商最不想讓你知道的3個坑:多花的錢根本沒意義

碼上閑敘
2026-05-31 02:18:56
西方壟斷七十年,全球最缺水的地方,為何突然向中國全面開放?

西方壟斷七十年,全球最缺水的地方,為何突然向中國全面開放?

比利
2026-05-30 06:57:13
美國宣布沒收伊朗10億美元加密貨幣資產 貝森特:切斷伊朗航空公司獲取降落點、加油和售票的渠道

美國宣布沒收伊朗10億美元加密貨幣資產 貝森特:切斷伊朗航空公司獲取降落點、加油和售票的渠道

每日經濟新聞
2026-05-30 15:52:23
著名球星、英格蘭前國腳被捕!

著名球星、英格蘭前國腳被捕!

湖報體育
2026-05-30 16:11:54
浙江女子離婚后帶女兒回娘家吃喝住,一個月后,哥嫂讓搬走

浙江女子離婚后帶女兒回娘家吃喝住,一個月后,哥嫂讓搬走

阿凱銷售場
2026-05-30 18:59:04
女大學生宿舍試穿抹胸裙走紅,曼妙身材圈粉無數,露臉后卻遭惡評

女大學生宿舍試穿抹胸裙走紅,曼妙身材圈粉無數,露臉后卻遭惡評

搗蛋窩
2026-05-21 06:40:07
27歲布朗逼宮離隊 愛國者咬死拒付首輪簽 交易瀕臨流產

27歲布朗逼宮離隊 愛國者咬死拒付首輪簽 交易瀕臨流產

甜份超標的我
2026-05-30 01:56:27
2026-05-31 06:55:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
134344文章數 862208關注度
往期回顧 全部

科技要聞

車圈大佬發聲:價格戰遠去,但競爭仍殘酷

頭條要聞

兩名9歲女孩被困電梯近2小時 求救幾十次物業無動于衷

頭條要聞

兩名9歲女孩被困電梯近2小時 求救幾十次物業無動于衷

體育要聞

巴黎再度捧起歐冠獎杯 槍手眾將黯然神傷

娛樂要聞

張碧晨《歌手》 “活人微死” 自嘲

財經要聞

雙匯管不住一頭豬

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

教育
時尚
房產
數碼
旅游

教育要聞

氧化還原反應方程式的配平

美回巔峰的她們,帶火的這些爆款真的好用嗎

房產要聞

紅動五月!全國搶入核心資產,廣州盯緊凱旋新世界!

數碼要聞

vivo S60系列發布:2899元起 推出4K原生感Live

旅游要聞

伊利亮相2026“跟著品牌去旅行”對接交流活動 以工業文旅融合彰顯中國品牌力量

無障礙瀏覽 進入關懷版