網易首頁 > 網易號 > 正文 申請入駐

「海外版DeepSeek」來了!Claude降價80%引發AI地震,緩解“盼V4”焦慮

0
分享至



春節這兩天等待DeepSeek新版本的焦慮氣氛中,硅谷突然扔下了一顆AI炸彈。

Anthropic 突然宣布 Claude Sonnet 4.6 發布,平價用戶也能用上旗艦級 AI 能力。更勁爆的是,這個模型在保持 Sonnet 系列價格不變的情況下(輸入 百 萬 , 輸 出 15/百萬 token),性能已經逼近此前售價高昂的 Opus 4.6——如果以“性能/價格比”計算,相當于性價比暴漲 80%

這個打法,讓人立刻想起一年前 DeepSeek R1 的“降價風暴”:同樣的“性能不降、價格腰斬”,同樣的“免費用戶也能用旗艦款”。只不過這一次,發起降價的不是中國創業公司,而是硅谷明星獨角獸 Anthropic。

X 上的 AI 開發者 Poonam Soni ( @CodeByPoonam) 第一時間發推:“Breaking: Anthropic 剛剛發布 Claude Sonnet 4.6,配備 100 萬 token 上下文窗口,在 OSWorld 電腦操控基準測試中得分 72.5%, SWE-bench 代碼測試 79.6%, Opus 級性能貫穿編碼和推理全場景。”這條推文迅速引發關注。


人工智能分析指數 v4.0)的模型能力排行榜

從上圖也可以看到,Claude Sonnet 4.6以51 分位列榜單第 2 名,僅次于同公司的 Claude Opus 4.6(max),在 10 項專業評測中展現了非常均衡的綜合能力。

一、Claude Sonnet 4.6 到底有多強?用數據說話 1. 代碼能力:79.6%,逼近 Opus 旗艦水平

SWE-bench Verified這個“真實軟件工程問題解決率”的行業金標準測試中,Claude Sonnet 4.6 交出了驚人的成績單:

  • Sonnet 4.6: 79.6%

  • Opus 4.6(旗艦款): 80.8%

  • GPT-5.2: 80.0%

  • Sonnet 4.5(上一代): 77.2%

僅差 1.2 個百分點,但價格只有 Opus 的五分之一。這意味著對于絕大多數編程任務,Sonnet 4.6 已經可以完全替代 Opus,而成本直接砍掉 80%。

對比 DeepSeek V3.2:雖然后者在成本上更有優勢(完成同樣任務約 1.01 美元 vs Claude Sonnet 4.6 約 27 美元),但 Sonnet 在企業級穩定性、API 文檔完善度、以及與 AWS Bedrock 等云平臺的深度集成上,仍然是生產環境的首選。

2. 電腦操控能力:72.5%,16 個月暴漲 387%

OSWorld-Verified基準測試衡量 AI“像人類一樣操作電腦”的能力——點擊、輸入、導航應用、完成多步驟任務。Claude 在這個領域的進化速度堪稱恐怖:

  • 2024 年 10 月Claude Sonnet 3.5: 14.9%

  • 2026 年 2 月Claude Sonnet 4.6:72.5%

  • 增幅: 387% (16 個月內)

更關鍵的是,Sonnet 4.6 的 72.5% 得分僅比 Opus 4.6 的 72.7% 低 0.2 個百分點,而 GPT-5.2 在這個測試中只有 38.2%——Claude 幾乎是 GPT 的兩倍。

Pace 公司 CEO Jamie Cuffe 在給 VentureBeat 的聲明中透露:“Sonnet 4.6 在我們復雜的保險業電腦操控基準測試中得分94%,是所有 Claude 模型中最高的。它能在失敗后進行推理并自我糾正,這是我們之前從未見過的能力。”

3. 辦公生產力:1633 Elo,全場最佳

GDPval-AA Elo 辦公任務評分中,Claude Sonnet 4.6 不僅超越了所有競爭對手,甚至反超了自家旗艦 Opus:

  • Sonnet 4.6: 1633 Elo

  • Opus 4.6: 1606 Elo

  • GPT-5.2: 1462 Elo

  • Gemini 3 Pro: 1548 Elo

Finance Agent v1.1金融分析基準測試中,Sonnet 4.6 同樣領跑:

  • Sonnet 4.6: 63.3%

  • Opus 4.6: 60.1%

  • GPT-5.2: 59.0%

這意味著在實際的企業辦公場景(財務分析、數據處理、文檔整理)中,中檔價格的 Sonnet 4.6 已經是市場上最強的模型

4. 長文本推理:100 萬 token 上下文,真正能用

Anthropic 為 Sonnet 4.6 配備了100 萬 token 上下文窗口(beta),但更重要的是它在長文本中的推理能力。在Vending-Bench Arena評估中(測試 AI 能否長期運營一個模擬企業), Sonnet 4.6 展現出了顯著的“長期規劃能力”提升。

Twitter 用戶 Felipe Corrêa 評論道:“兩周內 Anthropic 發布兩次重大更新。Claude Sonnet 4.6 在編碼、智能體、長文本推理上都達到了前沿水平。在電腦操控基準測試中得分 94%。GPT、Gemini 與 Claude 的競爭從未如此激烈。”


5. 用戶偏好:70% 更愛 Sonnet 4.6,59% 認為它超越舊版 Opus

Anthropic 內部測試顯示:

  • 70% 的用戶更喜歡 Sonnet 4.6 而非上一代 Sonnet 4.5

  • 59% 的用戶認為 Sonnet 4.6 比舊版旗艦 Opus 4.5 更好用

這是 Claude 歷史上第一次出現“中檔型號性能超越舊旗艦”的情況。

二、“海外版 DeepSeek”?更像是硅谷的降維打擊

把 Claude Sonnet 4.6 稱為“海外版 DeepSeek”,本質上是在說:Anthropic 學會了 DeepSeek 的“性價比革命”打法

DeepSeek 教會硅谷的三件事

2025 年 1 月,DeepSeek R1 以“600 萬美元訓練成本”和“API 價格僅為 GPT-4o 十分之一”的姿態橫空出世,用“性能+開源+低價”的三重組合拳,直接打破了硅谷“高性能=高價格”的商業邏輯,高貴的 OpenAI o1 沒開的 Reasoning 時代,被 DeepSeek R1 開啟。

隨后的連鎖反應迅速蔓延:字節、騰訊、百度、阿里將大模型 API 價格下調 50%-90%, OpenAI 推出更便宜的 GPT-4o Turbo, Google 加速 Gemini Flash 系列推廣。

一位 AI 行業分析師在 2026 年初的報告中直言:“DeepSeek 的出現,阻止了 AI 訂閱費用飆升至三位數美元的趨勢,將高端 AI 推理能力的價格底線永久性地拉低了。”

Claude 的反擊:不降價,但提升性價比 80%

Anthropic 的策略更聰明:API 價格不變( 15),但性能直逼旗艦 Opus( 25)

維度

Claude Sonnet 4.6

Claude Opus 4.6

性價比優勢

API 價格

15

25

-40%

SWE-bench 代碼

79.6%

80.8%

僅差 1.2%

OSWorld 電腦操控

72.5%

72.7%

僅差 0.2%

辦公任務 Elo

1633

1606

反超

金融分析

63.3%

60.1%

反超綜合性價比

+80%

更重要的是,Anthropic 將 Sonnet 4.6 設為claude.ai和 Claude Cowork 的默認免費模型,全球數百萬免費用戶無需付費就能體驗到接近旗艦級的 AI 能力。

這一招,幾乎是對 DeepSeek“免費開放高性能模型”策略的完美復刻。

對比 DeepSeek:各有所長,但 Claude 更適合生產環境

維度

Claude Sonnet 4.6

DeepSeek V3.2

成本

(同樣編程任務)

~$27

~$1.01

性能穩定性

企業級,久經驗證

頻繁升級

API 文檔

完善,開發者友好

持續完善中

云平臺集成

AWS Bedrock 深度集成

第三方支持有限

企業支持

7×24 專業團隊

社區為主

開源

閉源

MIT 開源

結論:如果你是個人開發者或預算極度敏感的項目,DeepSeek 仍然是最佳選擇;但如果你需要在生產環境中部署 AI, Claude Sonnet 4.6 的穩定性、企業支持和云平臺集成,是 DeepSeek 短期內難以替代的。

Claude Cowork 引發的“SaaSpocalypse”:軟件行業的地震前兆

值得注意的是,就在 Claude Sonnet 4.6 發布前兩周,Anthropic 已經引發了一場行業震蕩。1 月 30 日,Anthropic 為 Claude Cowork 發布了 11 個新插件,涵蓋法律、金融、銷售、營銷、數據分析等領域,讓 AI 能夠自主完成原本需要專業軟件的復雜任務。

市場反應堪稱“血洗”

  • 單日蒸發 2850 億美元:Salesforce、Adobe、Workday、ServiceNow 等企業軟件巨頭股價暴跌 6%-8%。

  • 印度 IT 股全線崩盤:Infosys 跌 7.89%、TCS 跌 6.29%、Wipro 跌 4.52%, Nifty IT 指數單日暴跌 6.84%。

  • Jefferies 交易員命名“SaaSpocalypse”:市場情緒從“AI 幫助這些公司”轉向“AI 取代這些公司”。

Claude Sonnet 4.6 會加劇這場危機嗎?答案是肯定的。Sonnet 4.6 的性能提升+價格下降,意味著原本只有大企業才能負擔的 AI 自動化能力,現在中小企業甚至個人開發者都能用上。當 AI 能以更低成本完成原本需要 Salesforce、DocuSign、Adobe 的工作時,傳統 SaaS 的“訂閱費+功能鎖定”商業模式將面臨根本性挑戰。

正如《財富》雜志所言:“Opus 4.6 的多智能體協作功能,可能對 Salesforce、Microsoft、Workday 等 SaaS 巨頭構成最大威脅——它們一直試圖讓客戶升級到自己的 AI 智能體平臺,但 Claude 已經搶先一步。”

三、不用再等 DeepSeek V4 了?現在就是最好的窗口期

就在 Claude Sonnet 4.6 發布的同一周,中文 AI 社區卻陷入了“期盼 V4”的焦慮:

  • 2 月 14 日: DeepSeek 官方宣布支持 100 萬 token 上下文,但用戶發現模型“變冷淡了”——回復變短、風格變干,“DeepSeek 被指變冷淡了”沖上微博熱搜 。

  • 2 月 16 日:疑似 DeepSeek V4 基準測試泄露,SWE-bench 得分 83.7%,超越 Claude Opus 4.5 和 GPT-5.2,傳言春節期間發布 。

  • 2 月 18 日: V4 仍未上線,官方無明確時間表

這種“等待”的焦慮,恰恰給了 Claude Sonnet 4.6 一個絕佳的市場窗口:

  • 對于普通用戶:與其苦等 V4,不如現在就用上 Sonnet 4.6,穩定性和易用性已驗證。

  • 對于企業客戶: Claude 的企業級支持、數據安全保障、AWS Bedrock 集成,是開源模型短期內難以替代的。

  • 對于開發者: API 穩定性和文檔完善度,遠超“灰度測試+頻繁調整”的 DeepSeek。

一位 AI 產品經理在社交媒體上直言:“DeepSeek 教會了硅谷如何做性價比,但 Claude 證明了閉源商業模型依然可以在‘性價比戰爭’中活下來——只要你愿意放下身段,真正把價格打下來。”

寫在最后:AI 降價戰的最大贏家是每一個普通用戶

這場由 DeepSeek 引發、Claude 接力的“AI 降價地震”,本質上是在用“降維打擊”的方式,把 AI 能力從少數人的特權,變成所有人的基礎設施:

  • 一年前,能用上 GPT-4 級別 AI 的只有付費用戶;現在,普通用戶就能用上接近 Opus 級別的 Claude。

  • 一年前,中小企業的 AI 預算動輒數萬美元;現在,幾百美元就能跑通完整的 AI 工作流

  • 一年前,“高性能=高價格”是行業共識;現在,性價比成為核心競爭力

AI 技術的迭代速度,已經快到“等待”本身就是一種成本。DeepSeek V4 可能下周就來,也可能再等一個月;但 Claude Sonnet 4.6 現在就能用,而且有免費渠道。

現在就開始用 AI 解決實際問題——無論是寫代碼、做分析、還是自動化辦公。當然母公司 Anthropic 的對華態度,使得國內團隊使用 Claude 的場景,可能僅限出海項目,這是遠不如擁抱開源精神的 DeepSeek 的地方。

總而言之,這場“AI 地震”已經蔓延開來。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
就在剛剛!廣東德比賽前傳來3大壞消息,杜鋒這回真笑不出來了

就在剛剛!廣東德比賽前傳來3大壞消息,杜鋒這回真笑不出來了

林子說事
2026-04-26 11:16:05
內娛第一刀,批量斬頂流

內娛第一刀,批量斬頂流

最人物
2026-04-25 14:39:41
姚安娜喜提華為Pura X Max 網友:又美又颯

姚安娜喜提華為Pura X Max 網友:又美又颯

快科技
2026-04-25 23:16:13
河北偷狗女子社會性死亡:人被拘了,名聲臭了,更惡心的還在后面

河北偷狗女子社會性死亡:人被拘了,名聲臭了,更惡心的還在后面

社會日日鮮
2026-04-25 19:02:51
山姆“爆雷”,3億中產炸了!

山姆“爆雷”,3億中產炸了!

新零售參考Pro
2026-04-23 16:31:50
誰給的勇氣?廣州隊季后賽門票,遠超其他球隊 CBA最貴

誰給的勇氣?廣州隊季后賽門票,遠超其他球隊 CBA最貴

體育哲人
2026-04-26 09:44:15
自制“飯卡手機”涌入閑魚!二手最低148塊,運行iOS系統

自制“飯卡手機”涌入閑魚!二手最低148塊,運行iOS系統

閑搞機
2026-04-26 11:00:09
千年難遇的美人,太漂亮了,沒有一點毛病,太完美了

千年難遇的美人,太漂亮了,沒有一點毛病,太完美了

情感大頭說說
2026-04-24 12:46:24
皇室獨苗悠仁19歲選妃,4大條件層層篩選,第4條直接勸退所有人

皇室獨苗悠仁19歲選妃,4大條件層層篩選,第4條直接勸退所有人

z千年歷史老號
2026-04-24 11:37:07
利好!29歲趙心童有望沖到世界第1:特魯姆普被扣50萬鎊 都怪沙特

利好!29歲趙心童有望沖到世界第1:特魯姆普被扣50萬鎊 都怪沙特

風過鄉
2026-04-26 08:18:40
葉新萍被查實!科室1.3億收入賬上只剩5964萬,舉報人懸賞一套房

葉新萍被查實!科室1.3億收入賬上只剩5964萬,舉報人懸賞一套房

阿萊美食匯
2026-04-26 13:54:12
史上最大規模化債,已經開始!堅持了30年的信仰,進入倒計時

史上最大規模化債,已經開始!堅持了30年的信仰,進入倒計時

律法刑道
2026-04-26 08:44:05
陳奕迅女兒陳康堤承認與香港網球一哥黃澤林戀愛:是家人介紹的

陳奕迅女兒陳康堤承認與香港網球一哥黃澤林戀愛:是家人介紹的

懂球帝
2026-04-25 16:34:10
廣州7歲男童無法走路說話,被當腦癱治療多年,父母翻病歷發現其出生時顱骨骨折疑在醫院摔傷,醫院否認,一文梳理關鍵時間線

廣州7歲男童無法走路說話,被當腦癱治療多年,父母翻病歷發現其出生時顱骨骨折疑在醫院摔傷,醫院否認,一文梳理關鍵時間線

大象新聞
2026-04-25 16:49:18
白宮新聞秘書萊維特承認脫離特朗普“團隊”后,二人互動中已顯現出關系緊張跡象

白宮新聞秘書萊維特承認脫離特朗普“團隊”后,二人互動中已顯現出關系緊張跡象

熱心市民小黃
2026-04-26 14:50:51
俞敏洪回應東方甄選主播集體離職:是平臺的損失

俞敏洪回應東方甄選主播集體離職:是平臺的損失

澎湃新聞
2026-04-26 09:40:29
慘勝背后暗流涌動!阿森納1-0紐卡重回榜首,球迷為何集體憤怒?

慘勝背后暗流涌動!阿森納1-0紐卡重回榜首,球迷為何集體憤怒?

落夜足球
2026-04-26 14:04:10
黃一鳴回應:孩子100%是王思聰的,不排斥和老頭交往,八十歲也行

黃一鳴回應:孩子100%是王思聰的,不排斥和老頭交往,八十歲也行

奇思妙想草葉君
2026-04-24 19:44:03
蔣萬安發出強硬警告,"中國臺灣省"走向國際,10國選擇明智應對

蔣萬安發出強硬警告,"中國臺灣省"走向國際,10國選擇明智應對

流史歲月
2026-04-25 10:19:34
替補43分!多森姆季后賽大爆發,火箭沒交易輸麻?

替補43分!多森姆季后賽大爆發,火箭沒交易輸麻?

籃球實錄
2026-04-26 14:57:26
2026-04-26 15:20:49
鯨選AI incentive-icons
鯨選AI
最新AI產品化與商業化案例速遞
152文章數 38關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

特朗普2年內遭遇4次刺殺威脅 第一個任期也曾險遭襲擊

頭條要聞

特朗普2年內遭遇4次刺殺威脅 第一個任期也曾險遭襲擊

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《八千里路云和月》大結局意難平

財經要聞

DeepSeek V4背后,梁文鋒的轉身

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

教育
手機
家居
藝術
時尚

教育要聞

麻省理工公開課19:吉爾伯特教授線性代數課-

手機要聞

vivo Y600 Pro手機現身中國電信終端產品庫,4月27日發布

家居要聞

自然肌理 溫潤美學

藝術要聞

鄭麗文訪問清華附中引發熱議,蔣中正信札字跡真實性遭質疑

IU的臉,真的有自己的時間線

無障礙瀏覽 進入關懷版