網易首頁 > 網易號 > 正文 申請入駐

Opus 4.7 發布,Claude Code 之父傳授使用心得:模型升級只是開始,開發方式才是關鍵

0
分享至


翻譯 | Tina

Anthropic 最新模型 Claude Opus 4.7 已正式全面上線。

相較于 Opus 4.6,Opus 4.7 在高級軟件工程任務上更進一步,尤其是在高難度任務上的提升更明顯。Anthropic 表示,它處理長任務更穩定,執行指令更精確,也會在返回結果前先做驗證。


此前 Anthropic 發布了 Project Glasswing,討論 AI 模型在網絡安全領域的風險與價值,并明確表示 Claude Mythos Preview 將限制發布范圍,同時優先在能力較弱的模型上測試新的安全機制。

Opus 4.7 是首個承擔這一角色的模型:其網絡安全能力不及 Mythos Preview。對于有正當網絡安全需求的專業人士(如漏洞研究、滲透測試、紅隊演練),Anthropic 同時推出了 Cyber Verification Program,供申請參與。

Opus 4.7 價格與 Opus 4.6 保持一致:輸入每百萬 tokens 5 美元,輸出每百萬 tokens 25 美元。開發者可通過 Claude API 使用模型名稱 claude-opus-4-7。

真正讓 Opus 4.7 和上一代拉開差距的,還是下面這些更具體的測試表現。

在指令遵循方面,Opus 4.7 有顯著提升。這也帶來一個變化:過去為舊模型編寫的 prompt,有時會出現結果偏差,因為舊模型可能會模糊理解甚至忽略部分指令,而 Opus 4.7 會更嚴格、逐字執行。因此,用戶需要相應地重新調優 prompt 和 harness。

在多模態能力上,Opus 4.7 的視覺能力顯著增強。它可以處理長邊最高 2576 像素(約 375 萬像素)的圖像,是此前 Claude 模型的三倍以上。這使得依賴細節視覺信息的應用成為可能,例如讀取復雜截圖的電腦操作代理、從復雜圖表中提取數據,以及需要像素級精度參考的任務。

在實際業務能力方面,除在 Finance Agent 評測中達到當前最優表現外,內部測試也顯示,Opus 4.7 在金融分析任務上優于 Opus 4.6,能夠生成更嚴謹的分析模型、更專業的展示內容,并在多任務之間實現更緊密的協同。

在記憶能力上,Opus 4.7 更善于利用基于文件系統的記憶機制,能夠在跨會話的長周期任務中記住關鍵信息,并據此推進后續任務,從而減少前期上下文輸入的負擔。


除模型本身外,本次還同步發布了多項更新:

首先是更細粒度的推理強度控制。Opus 4.7 新增 xhigh(“超高”)檔位,介于 high 和 max 之間,使用戶可以在復雜問題上更靈活地權衡推理深度與延遲。在 Claude Code 中,默認推理強度已提升至 xhigh。對于編碼和 agent 場景,建議從 high 或 xhigh 開始測試。

在 Claude 平臺(API)方面,除支持更高分辨率圖像外,還推出了 task budgets(任務預算,公測中),用于控制 token 消耗,從而在長任務中更合理地分配資源。

在 Claude Code 中,新增了 /ultrareview 命令,可開啟專門的代碼審查會話,自動讀取變更內容并識別潛在 bug 和設計問題,接近資深工程師的審查能力。Pro 和 Max 用戶可獲得三次免費體驗。此外,auto mode 也已擴展至 Max 用戶,該模式允許 Claude 代替用戶做出部分決策,從而減少中斷,更順暢地執行長任務,同時風險低于完全跳過權限控制。

另外,從 Opus 4.6 遷移至 4.7 時,有兩個與 token 使用相關的變化需要關注。首先,Opus 4.7 使用了新的 tokenizer,在文本處理上更高效,但同一輸入可能會映射為更多 token(約增加 1.0–1.35 倍,取決于內容類型)。其次,在更高推理強度下,尤其是在 agent 多輪任務的后期階段,模型會進行更多推理,從而生成更多輸出 token。這提升了復雜任務的可靠性,但也帶來更高的 token 消耗。

用戶可以通過調整 effort 參數、設置任務預算,或在 prompt 中要求更簡潔的輸出,來控制 token 使用。內部測試顯示,總體效果是正向的:在一項內部編碼評測中,各個推理強度檔位下的 token 使用效率均有所提升。不過,仍建議在真實業務流量中進行實際測量。同時,Anthropic 也提供了遷移指南,幫助用戶從 Opus 4.6 平滑升級到 Opus 4.7。


Claude Code 之父的使用心得

Boris Cherny(Claude Code 作者)在連續幾周內部使用 Opus 4.7 后,給出了一組更偏“實戰側”的使用心得。整體感受很直接:生產力明顯提升,同時也需要相應調整使用方式。

他總結了幾個關鍵點:

首先是Auto mode(自動模式)。

Opus 4.7 非常擅長處理復雜、長時間運行的任務,比如深度研究、代碼重構、復雜功能開發,或者反復迭代直到達到性能指標。過去要么需要全程盯著模型運行,要么只能使用 --dangerously-skip-permissions 這種風險較高的方式。

現在的自動模式提供了一個更安全的替代方案。在這個模式下,權限請求會被轉交給一個基于模型的分類器判斷是否安全執行,如果判定安全,就會自動放行。

這帶來的變化不只是“可以不盯著看了”,更重要的是可以并行運行多個 Claude。一個任務跑起來之后,可以直接切去處理下一個 Claude。對于 Max、Teams 和 Enterprise 用戶,Opus 4.7 已支持該模式,在 CLI 中可以通過 Shift + Tab 進入,或在桌面端、VSCode 的下拉菜單中選擇。


第二是/fewer-permission-prompts 這個新 skill。

它會掃描整個會話歷史,找出那些其實是安全的、但卻反復觸發權限提示的 bash 或 MCP 命令,然后推薦加入到 allowlist 中。

這個功能本質是在幫你“整理權限策略”,減少無意義的打斷。如果不使用 auto mode,這個 skill 會非常實用。

第三是Recaps(回顧)。

這是一個看起來簡單但很實用的功能:為每個 agent 生成一段簡短總結,說明“剛剛做了什么”和“接下來要做什么”。

在處理長時間運行的任務時,隔幾分鐘甚至幾小時再回來,這個功能能快速幫你恢復上下文。


第四是Focus mode(專注模式)。

CLI 里新增的這個模式會隱藏所有中間過程,只保留最終結果。

Boris 的說法是:模型已經進化到一個階段,大多數情況下可以信任它會執行正確的命令、做出正確的修改,所以只需要看最終結果即可。通過 /focus 可以隨時開關。


第五是調整 effort(推理強度)。

Opus 4.7 不再依賴固定的 thinking budget,而是改用自適應思考機制。想控制模型“想多少”,主要靠 effort 參數來調節。低 effort 響應更快、token 消耗更低,高 effort 則能換來更強的能力和更深的推理。

按照 Boris 的個人用法,大多數任務使用 xhigh,最難的任務才會上 max。需要注意的是,max 只對當前 session 生效,其他 effort 檔位則會延續到后續 session。用戶可以通過 /effort 來調整。


第六,也是他特別強調的一點:一定要給 Claude 一個“驗證自己”的手段。

這一點一直可以把 Claude 的效果提升 2–3 倍,在 4.7 上更重要。驗證方式會根據任務類型有所不同:做后端時,要讓 Claude 能啟動服務并完成端到端測試;做前端時,可以通過 Claude 的 Chromium 擴展讓它直接控制瀏覽器;如果是桌面應用,則可以使用 computer use。

他現在很多 prompt 會寫成類似“Claude 做某件事 /go”。這個 /go skill 會讓 Claude 自動完成一整套流程:先通過 bash、瀏覽器或 computer use 做端到端自測,然后運行 /simplify skill,最后直接提交 PR。

對于長時間運行的任務來說,驗證機制的意義在于,當你再次回到這個任務時,可以確認代碼是確實可用的,而不是停留在一個“看起來已經完成”的狀態。

他最后的意思是,Opus 4.7 的提升是明顯的,但變化不只在模型本身,也在使用方式上。你如果還是沿用舊 workflow,當然也能感受到它比上一代更強;但只有把工作方式一起調過來,真正利用它“能跑更久、agent 性更強”的特點,這一代的差距才會被真正拉開。

參考資料:

https://www.anthropic.com/news/claude-opus-4-7

https://x.com/bcherny/status/2044847858634064115

會議推薦

QCon 全球軟件開發大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節跳動、小米、百度等一線科技企業與創新團隊的技術專家,圍繞 AI 工程化、系統架構與研發模式演進展開深入探討。更多詳情可掃碼或聯系票務經理 18514549229 進行咨詢。

今日薦文

你也「在看」嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
對越反擊戰中爬回國的戰士,未殺一敵,卻被國家副主席親授一等功

對越反擊戰中爬回國的戰士,未殺一敵,卻被國家副主席親授一等功

興趣知識
2026-04-24 15:09:50
CBA最新消息!鄢手騏或離開遼寧男籃,李祥波合同到期

CBA最新消息!鄢手騏或離開遼寧男籃,李祥波合同到期

體壇瞎白話
2026-05-07 08:29:41
新加坡總理哭了,無人同情!當初對中國有多狂妄,現在就多狼狽!

新加坡總理哭了,無人同情!當初對中國有多狂妄,現在就多狼狽!

混沌錄
2026-05-06 23:33:12
張萌在上海時裝周上一個雙手托胸的動作,照片炸了全網。

張萌在上海時裝周上一個雙手托胸的動作,照片炸了全網。

阿廢冷眼觀察所
2026-05-06 02:00:26
放棄 5000 萬萊奧!曼聯撿大漏,鎖定周薪僅 1 萬鎊邊鋒

放棄 5000 萬萊奧!曼聯撿大漏,鎖定周薪僅 1 萬鎊邊鋒

一隅非生
2026-05-07 07:59:48
NBA官方聲明:87歲老鷹前老板特德-特納逝世 是CNN創始人

NBA官方聲明:87歲老鷹前老板特德-特納逝世 是CNN創始人

醉臥浮生
2026-05-07 09:09:32
申京再遭打擊!場均20+9+6仍不被認可?最被高估球員榜,他排第一

申京再遭打擊!場均20+9+6仍不被認可?最被高估球員榜,他排第一

熊哥愛籃球
2026-05-07 12:38:28
毀三觀!體壇 4 大丑聞曝光:貪財好色、婚內出軌,比娛樂圈還亂

毀三觀!體壇 4 大丑聞曝光:貪財好色、婚內出軌,比娛樂圈還亂

橙星文娛
2026-04-27 16:46:45
瓦倫丁賽后哭了:歐洲20年沒人認識,想來中國,粉絲只在乎我平安

瓦倫丁賽后哭了:歐洲20年沒人認識,想來中國,粉絲只在乎我平安

樂悠悠娛樂
2026-05-06 11:25:33
迪冪孟扎想給孩子上戶口!少女媽和金主的X關系!

迪冪孟扎想給孩子上戶口!少女媽和金主的X關系!

八卦瘋叔
2026-05-07 13:06:52
炸場!吳宜澤局間抽煙調整,18-17絕殺墨菲,這口煙價值連城

炸場!吳宜澤局間抽煙調整,18-17絕殺墨菲,這口煙價值連城

劉哥談體育
2026-05-07 00:56:12
1958年毛澤東視察濟南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

1958年毛澤東視察濟南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

史海孤雁
2026-05-05 17:07:19
特朗普態度180度轉變,連贊中國三句,日本被冷落

特朗普態度180度轉變,連贊中國三句,日本被冷落

白哥全球事
2026-05-07 11:44:29
新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

呼吸科大夫胡洋
2026-02-22 11:39:12
全靠內鬼,105噸假黃金騙了253億

全靠內鬼,105噸假黃金騙了253億

大貓財經Pro
2026-05-06 18:44:18
調查發現:那些常年喝中藥的人,到70歲后,大多變成了這樣!

調查發現:那些常年喝中藥的人,到70歲后,大多變成了這樣!

芹姐說生活
2026-05-06 14:04:20
哈馬斯新領導人剛上位,以色列“見面禮”:炸死其兒子

哈馬斯新領導人剛上位,以色列“見面禮”:炸死其兒子

桂系007
2026-05-07 03:49:12
30國都打不倒一個俄羅斯?最大的靠山出現了,連老美都垂涎三尺!

30國都打不倒一個俄羅斯?最大的靠山出現了,連老美都垂涎三尺!

杰絲聊古今
2026-05-02 10:00:14
8級大風+暴雨!冷空氣返場?新臺風生成!接下來廣東天氣→

8級大風+暴雨!冷空氣返場?新臺風生成!接下來廣東天氣→

江門高新
2026-05-07 12:06:12
繼子照顧病重養母 13年,臨終給繼子5萬親兒2套房,繼子取款愣了

繼子照顧病重養母 13年,臨終給繼子5萬親兒2套房,繼子取款愣了

蘭姐說故事
2025-04-19 10:00:11
2026-05-07 13:43:00
AI前線 incentive-icons
AI前線
面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
1476文章數 149關注度
往期回顧 全部

科技要聞

凌晨突發!馬斯克租22萬塊GPU給“死敵”

頭條要聞

北京三位女大學生青海自駕游2死1傷 傷者一審獲刑4年

頭條要聞

北京三位女大學生青海自駕游2死1傷 傷者一審獲刑4年

體育要聞

阿森納巴黎會師歐冠決賽!5月31日開戰

娛樂要聞

小S阿雅重返大S母校,翻看大S畢業照

財經要聞

特朗普:美伊“很有可能”達成協議

汽車要聞

理想為什么不做轎車,有了解釋……

態度原創

時尚
手機
教育
藝術
房產

“白色闊腿褲”今年夏天又火了!這樣穿時髦又高級

手機要聞

消息稱三星正研發MH1全息屏,蘋果Spatial iPhone將首發

教育要聞

高考倒計時30天,華南理工楊中民校長向您發出誠摯邀約!

藝術要聞

這位老教授筆下的青年,活力滿滿

房產要聞

五一海南樓市,太淡了!

無障礙瀏覽 進入關懷版