網易首頁 > 網易號 > 正文申請入駐

剛剛，Claude Opus 4.7突然發布：不是最強，但奧特曼又得失眠

2026-04-17 01:35:26　來源: 愛范兒

廣東舉報

分享至

今年 Anthropic 的勢頭異常兇猛。

不僅熱度居高不下，口碑也持續攀升，穩坐 AI 圈「頂流」的交椅。現在幾乎每天醒來，都能看到他們準點推送的新產品或新功能。久而久之，大家也從興奮變成了「是你，果然又是你」的默契感。

而就在剛剛，萬眾期待的 Claude Opus 4.7 也正式發布，依舊是熟悉的配方，熟悉的高分選手。

有趣的是，Anthropic 在公告里非常坦誠，甚至帶著點驕傲：「這并非我們最強大的模型。」那個傳說強得可怕的 Claude Mythos Preview 依然還在藏。

但就是這個并非最強的 Opus 4.7，卻依舊引發了極大的關注。因為它解決了一個比聰明更重要的痛點：靠譜。不是那種你說什么它就做什么的靠譜，而是當你提出一個愚蠢的方案時，它敢于反駁你，并自己把坑填上的靠譜。

當靠譜成為比聰明更稀缺的品質

基準測試結果顯示，在業界公認最硬核的 SWE-bench Pro 上，4.7 從前代的 53.4% 直接拉到 64.3%，單代升級漲了近 11 個百分點，把 GPT-5.4（57.7%）和 Gemini 3.1 Pro（54.2%）都甩在了身后。

視覺推理的 CharXiv 基準從 69.1% 跳到 82.1%，對應的是它新獲得的 2576 像素長邊識別能力——清晰度是前代的 3 倍以上。

這不只是「看得更清楚」這么簡單。更高的分辨率直接帶動了輸出質量的連鎖提升：生成界面、制作幻燈片、排版文檔，細節精度也全面提升。

工具調用規模化評測 MCP-Atlas 上，4.7 跑出 77.3%，超過 GPT-5.4 的 68.1% 和 Gemini 的 73.9%。法律 AI 平臺 Harvey 測試中，4.7 在 BigLaw 基準上拿下 90.9%，正確區分了歷來是前沿模型死穴的「轉讓條款」與「控制權變更條款」。

不過，4.7 也并非全然遙遙領先，在 Agentic search 評測 BrowseComp 上，4.7 反而從前代的 83.7% 下降到了 79.3%，被 GPT-5.4（89.3%）和 Gemini（85.9%）超越。

這個退步并非偶然。一個遇到缺失信息會直接報錯、不肯亂編答案的 Agent，在以「是否給出答案」為評判標準的基準上，天然會吃虧。

而數據之外，更值得關注的問題是：這種「靠譜」，在真實工作里到底意味著什么？

過去一年，業界對代碼大模型的期待，普遍還停留在「寫個函數、找個 Bug」的層面，但 Claude 4.7 在早期測試里，展現出了一種截然不同的氣質。

知名云端開發平臺 Replit 的負責人這樣描述：「它在技術討論中會反駁我，幫我做出更好的決定。它真的感覺像一個更好的同事。」

它不再一味地「唯命是從」，也不再為了交差而胡編亂造。在數據科學平臺 Hex 的測試里，4.7 遇到缺失數據時會直接報錯，而不是像前代那樣塞一個「看似合理但完全錯誤」的備選值。Hex 團隊甚至直言：「低消耗狀態下的 4.7，等同于中等消耗狀態下的 4.6。」

這種「拒絕順從」的特質，恰恰是高級軟件工程里最稀缺的東西。

當然，凡事有兩面。為舊模型寫的 prompt，到了 4.7 手里可能會產生意想不到的結果。那些過去被模型「意會」掉的模糊指令，4.7 會一字一字地字面執行。這也意味著越懂得清楚表達需求的人，越能從 4.7 這里拿到好結果。

光會「頂嘴」還不夠，遇到挫折就罷工的 AI 同樣不是好同事。4.7 的另一個大的變化，是任務韌性。

以往大模型在多步任務中遇到工具調用失敗，往往直接停機報錯。Notion 團隊測試發現，4.7 的工具錯誤率降到了原來的三分之一，更關鍵的是，它能在工具鏈崩潰時自己繞過障礙，繼續把任務跑完。

當 AI 停止諂媚，真正的生產力才開始爆發。

Anthropic 公布的一個極端案例里，4.7 在沒有任何人類干預的情況下，從零構建了一個完整的 Rust 文本轉語音引擎——寫神經網絡模型、SIMD 內核和瀏覽器演示，還自己把輸出喂給語音識別器做驗證，連測試都一并完成了。

前端框架巨頭 Vercel 還發現了一個過去從未有過的行為：4.7 會在開始寫系統級代碼之前，先自己進行數學證明。這已經超出了寫代碼的范疇，進入了嚴謹工程設計的領域。

雇傭 AI「資深專家」的代價

為了驗證它在細節上的處理能力，我設定了三個前端交互場景，評判標準只有一個：細節是否敷衍，一眼便知。

第一個場景，是讓它做一個俯視視角的黑膠唱片機界面，其難點在于「金屬光澤」與「呼吸光暈」的呈現。4.7 并沒有用廉價的色彩漸變敷衍了事，而是通過復雜的 CSS 樣式疊加，逼真地還原了金屬質感。

第二個場景是只用 CSS，不用 JavaScript 做一個老式電風扇。面對這個限制嚴格的題目，一些模型會悄悄違規使用 JS，但 4.7 遵守了規則。它用純 CSS 做出了風扇的立體結構，低中高三檔過渡流暢，底座透視和陰影的處理也真有一點實物感，它在規則允許的范圍內找到了很好的解決辦法。

第三個場景是做一個復古磁帶隨身聽，帶有錄像帶那種老舊的噪點效果。磁帶轉動的細節也是有的。

當然，變聰明是有代價的。Opus 4.7 現已在所有 Claude 產品和 API、Amazon Bedrock、Google Cloud 的 Vertex AI 以及 Microsoft Foundry 平臺上推出。

基礎定價維持在每百萬輸入 5 美元、輸出 25 美元不變。但 4.7 引入了全新分詞器，同樣的文本會拆分出比原來多 1.0 到 1.35 倍的 Token。

疊加上它在高強度任務中本身就傾向于「多想一會兒」，實際消耗幾乎必然上升。

此外，Anthropic 在原有的難度選項之上，加入了全新的 xhigh（超高）級別。在這個級別下，面對復雜難題，Claude 4.7 會消耗更多的 Token，花更多的時間去「思考」。Claude Code 已經把所有套餐的默認 effort level 直接拉到了 xhigh。

Anthropic 用行動告訴所有人，對于真正的編碼任務，省著用不如想清楚。

為了匹配這種工作流，Claude Code 順勢推出了兩個殺手級功能：

/ultrareview（深度審查）：開啟一個專門的審查會話，像一個極其挑剔的資深 Reviewer 一樣，通讀所有代碼更改，精準標記出深層的架構設計缺陷和 Bug。Pro 和 Max 用戶可以免費試用三次。

Auto Mode（自動模式）擴展到 Max 用戶：一種介于「逐項授權」和「跳過所有權限」之間的新權限模式。Claude 會在你授權的范圍內自主做決策，既能跑完漫長無聊的任務，又比完全放權更安全。

為了防止這個「太能思考」的 AI 把賬戶余額刷爆，API 端還推出了「任務預算」（Task Budgets）功能公測版，讓開發者可以顯式規劃 Claude 在長任務中的 Token 支出優先級。

當然，4.7 并不是 Anthropic 手里最強的牌。

那個更強的 Claude Mythos Preview，本月剛以「Project Glasswing」的名義，小范圍開放給了一批企業用于網絡安全研究。Mythos 沒有公開發布，原因則是因為它的網絡攻防能力太強，Anthropic 覺得還沒想清楚怎么安全地推給所有人。

4.7 本身也做了主動取舍，訓練階段就壓低了網絡攻防能力，內置自動攔截機制，碰到高風險請求直接擋掉。有合規需求的安全研究人員，可以通過官方渠道單獨申請。

不急著把最強的牌打出去，和不停地往桌上加新牌，背后是同一套邏輯。實際上，Anthropic 真正的護城河，是交付節奏本身。

在今年 2 月 1 日至 3 月 24 日，短短 52 天里，Anthropic 一共更新了 74 款產品，平均不到兩天一個。Cowork、插件……這些動作扎扎實實地擊中了職場辦公的痛點。

如今的 Claude 生態，早就超越了單純的「聊天機器人」。對于那些渴望將 AI 深度嵌入實際工作流的團隊而言，這種穩定、高頻且可預期的更新節奏，才是最讓人感到踏實的定心丸。

今天發布的 Claude 4.7，是這條鏈條上最新的一塊壓艙石。而那個 Mythos Preview，遲早也會來。到那時候，我們現在覺得已經很能打的 4.7，可能只是個開端。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

字節養的“蝦”與1500億賬本背后

鈦媒體APP 2026-04-25 16:44:18
0 跟貼 0
Agent中的“愛馬仕”來啦：100k+ Star 的開源AI Agent ，正在偷偷給自己升級

鈦媒體APP 2026-04-23 09:27:15
0 跟貼 0

Anthropic實驗火了！Claude替人類做了186筆買賣，用Opus能多賺70%

新智元 2026-04-25 19:04:24
1 跟貼 1

DeepSeek-V4報告亮了！V4發布延遲的秘密，終于曝光了

新智元 2026-04-25 13:42:06
33 跟貼 33
GPT5.5深夜炸場，這次OpenAI又行了

虎嗅APP 2026-04-25 05:47:05
7 跟貼 7

Epoch AI萬人調研：老板不訂閱，AI就是擺設！

新智元 2026-04-26 09:04:03
0 跟貼 0

GPT image-2爆火后，設計師的天塌了嗎？

鈦媒體APP 2026-04-26 09:12:11
9 跟貼 9
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

Token消耗砍半！神州數碼端出“養蝦”三件套，專治AI打工人

雷科技 2026-04-25 22:18:36
0 跟貼 0
AI驅動、六大系統升級，問界守擂高端市場

經濟觀察報 2026-04-26 09:58:05
0 跟貼 0
對話 Momenta CEO曹旭東：自動駕駛是物理AI的序章

鈦媒體APP 2026-04-26 10:16:13
0 跟貼 0
爸爸為了哄兒子，用照片換臉生成奧特曼，兒子的拳頭成亮點！

搞笑生活君 2026-04-24 16:27:44
1 跟貼 1
“手搓”應用全民化，大廠打響新一輪卡位戰

鈦媒體APP 2026-04-24 17:23:25
8 跟貼 8
馬斯克vs奧特曼終極決戰！不要1870億，把OpenAI還給我

新智元 2026-04-25 13:40:32
48 跟貼 48
我在Word里用Claude替換了Copilot：一周后回不去了

賽博蘭博 2026-04-24 10:54:32
0 跟貼 0
烏克蘭前線士兵骨瘦如柴照片披露被指最長斷糧17天

澎湃新聞 2026-04-25 14:48:31
27907 跟貼 27907
第一輛是躲避電動車，第二輛的操作看不懂，網友：抬腿是做個標記

阿爾卡得生活 2026-04-25 08:34:39
0 跟貼 0
狗子第一眼沒認出來主人，在她褲腿上做了標記后瞬間反悔，網友：感覺它試圖張嘴說話解釋

河南都市頻道 2026-04-23 11:08:17
8 跟貼 8
蘇超最新積分榜出爐！

無錫博報 2026-04-25 21:51:59
110 跟貼 110
鬼手想點誰就點誰？LaSM讓GUI智能體把注意力「收回來」

機器之心Pro 2026-04-07 14:27:35
0 跟貼 0
半掛模型玩具車買菜，要是超重了怎么辦，雷軍都不敢這么設計！

宇宙搞笑生活 2026-04-23 14:10:00
4 跟貼 4
小孩哥騎車分心沒看路，下一秒路邊停好的電動車尾箱被撞壞

樂動向前 2026-04-23 18:16:00
0 跟貼 0
蘋果不講武德！iPhone18 屏幕偷偷縮水，強逼用戶買Pro版？

極果酷玩 2026-04-23 12:53:41
12 跟貼 12
一道叫"愛"的題目，怎么突然難住了所有人？

晚風也遺憾 2026-04-23 10:17:52
0 跟貼 0
霹靂15嚇壞印度！電視臺專門訪談，專家直呼這破壞了空戰規則！

曉哲舞蹈課 2026-04-25 13:38:31
10 跟貼 10
美國富豪非洲打獵被5頭大象踩死

看看新聞Knews 2026-04-25 19:38:18
3800 跟貼 3800
美能源出口創新高二戰以來首次接近成為原油凈出口國

紅星新聞 2026-04-25 12:32:20
8722 跟貼 8722
不會寫代碼的文科生耗時一月，用AI靈光做應用軟件賺了三萬元

星視頻 2026-04-22 15:21:34
0 跟貼 0
小時候看電影感受單純，長大后再看心境轉變，前后感覺大不同

冰心說影 2026-04-23 09:41:38
2 跟貼 2
誰說工科生只會寫代碼？

中國網資訊 2026-04-22 10:15:39
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
內地旅客買6000港元蟲草磨粉后結賬竟變成7.1萬

看看新聞Knews 2026-04-25 19:24:12
2957 跟貼 2957
賴清德竄訪斯威士蘭失敗背后的三重邏輯

井芹仁小菜 2026-04-26 02:57:51
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
救人的哥走了50余輛出租車自發送行

極目新聞 2026-04-25 15:18:34
2521 跟貼 2521
一鍵生成PPT和科研繪圖，北大開源Paper2Any，全流程可編輯

機器之心Pro 2026-01-04 17:32:26
4 跟貼 4
奧特曼和達里奧的十年恩怨，如何走到全面開戰？

量子位 2026-04-06 05:39:19
0 跟貼 0
小奧特曼騎車“失控”電動車尾箱慘遭“襲擊”

焦點視訊 2026-04-24 11:35:52
0 跟貼 0
當視頻難以被表征1

機器之心Pro 2026-03-03 17:21:59
0 跟貼 0
花唄、白條、月付等面臨重大調整

第一財經資訊 2026-04-25 12:45:38
201 跟貼 201

愛范兒

消費科技第一媒體

38766文章數 2601559關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

家居

旅游

手機

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

剛剛，Claude Opus 4.7突然發布：不是最強，但奧特曼又得失眠

漲價浪潮下，DeepSeek推動AI“價格戰”

牛彈琴：伊朗放了美國人鴿子 特朗普被氣壞了

牛彈琴：伊朗放了美國人鴿子 特朗普被氣壞了

那一刻開始，兩支球隊的命運悄然改變了

《我們的爸爸2》第一季完美爸爸翻車了

90%訂單消失，中東旺季沒了

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

云游中國｜逛世界風箏都 留學生探秘中國傳統文化

自然肌理 溫潤美學

打卡淄博：從千年文脈到市井煙火

停更一年憋大招！小米大折疊攜玄戒O3回歸，系統也是新的

牛彈琴：伊朗放了美國人鴿子特朗普被氣壞了

牛彈琴：伊朗放了美國人鴿子特朗普被氣壞了

2026款樂道L90亮相北京車展樂道L80正式官宣

云游中國｜逛世界風箏都留學生探秘中國傳統文化

自然肌理溫潤美學