![]()
Claude 模型有兩個老問題:一個是愛封號,另一個是貴。
前者,在過去一周,很多 Claude 用戶已經(jīng)見識過了。社交平臺上關(guān)于 Anthropic 風(fēng)控的討論越來越離奇,從鎖 IP、異地登錄觸發(fā)審查,到「不要隨便打開 Anthropic 發(fā)來的郵件」的提醒,理由是郵件打開位置可能被用于判斷賬號所在地。
傳聞細節(jié)仍有待核實,但 Claude 頻繁封號已不爭的事實。昨天一覺醒來,我也發(fā)現(xiàn)第五個 Claude 賬號也被封了。
至于后者,Anthropic 也給出了最新答案。
![]()
就在剛剛,Claude Sonnet 5 正式發(fā)布。按照官方說法,Sonnet 5 是目前最具 agent 能力的 Sonnet 模型,可以制定計劃,調(diào)用瀏覽器和終端等工具,并在更復(fù)雜的任務(wù)中自主執(zhí)行。
從產(chǎn)品定位看,Anthropic 想把過去更多屬于 Opus 高端模型的能力,下放到更常用、價格更低的 Sonnet 產(chǎn)品線上。Claude 這次升級,核心并不只是模型變強,也是在重新權(quán)衡「好用」與「用得起」之間的關(guān)系。
Sonnet 5 發(fā)布,但卻是便宜版 Opus
眾所周知,在 Claude 的產(chǎn)品線里,中杯 Sonnet 本來就是 Claude 走向開發(fā)者社區(qū)的關(guān)鍵入口。
Claude 3.5 Sonnet、3.6 Sonnet 和 3.7 Sonnet 曾讓很多人第一次認真把 Claude 用進寫代碼、調(diào)用工具和處理長任務(wù)的工作流里。對不少開發(fā)者來說,AI agent 時代最早的體感,正是從 Sonnet 級模型開始的。
但過去一年,Anthropic 最明顯的能力提升集中在 Opus 高端模型上。
Opus 更強,也更貴。Sonnet 仍然是主力選擇,但在復(fù)雜任務(wù)、長時間執(zhí)行、工具調(diào)用和高難度推理上,和 Opus 的差距被逐漸拉開。
Sonnet 5 要解決的,正是這個落差難題。
Anthropic 稱,Sonnet 5 在推理、工具調(diào)用、編程和知識工作等方面,相比 Sonnet 4.6 有明顯提升,整體能力接近 Opus 4.8,但價格更低。官方給出的定位也很明確:Opus 4.8 仍然適合追求更高準確率的任務(wù),Sonnet 5 則提供一個成本更低、能力更接近高端模型的選擇。
![]()
▲ 官方博客 https://www.anthropic.com/news/claude-sonnet-5
事實上,根據(jù)我的體驗,Sonnet 5 表現(xiàn)也并未有肉眼可見的進步,反倒給我一種是打著 Agent 原生模型的旗號,卻是為了省算力而急匆匆發(fā)布的即視感。
![]()
從價格看,Anthropic 這次給了一個首發(fā)窗口期。
即日起到 2026 年 8 月 31 日,Claude Sonnet 5 在 API 上的輸入價格為每百萬 tokens 2 美元,輸出價格為每百萬 tokens 10 美元。9 月 1 日后,標準價格恢復(fù)到輸入每百萬 tokens 3 美元、輸出每百萬 tokens 15 美元。
![]()
▲API 價格 https://platform.claude.com/docs/en/about-claude/pricing
作為對比,Opus 4.8 的價格是輸入每百萬 tokens 5 美元、輸出每百萬 tokens 25 美元。這個差價,正是 Anthropic 想讓開發(fā)者從 Opus 試驗,轉(zhuǎn)向 Sonnet 規(guī)模化部署的關(guān)鍵。
不過,Sonnet 5 的便宜并不完全等于,該花的賬單會有一個斷崖式的下降。
Anthropic 悄摸摸地在腳注中提到,Sonnet 5 使用了更新后的 tokenizer,同樣一段輸入文本可能會產(chǎn)生更多 tokens,大約是原來的 1.0 到 1.35 倍,具體取決于內(nèi)容類型。
![]()
也就是說,開發(fā)者不能只看每百萬 tokens 的標價,還要看真實任務(wù)里的 token 消耗、緩存命中率和輸出長度。
Anthropic 反復(fù)強調(diào)「成本和性能曲線」,原因也在這里。Sonnet 5 的重點,不是把 Opus 完全替換掉,而是讓更多任務(wù)在更低成本下獲得接近 Opus 的 agent 能力。
![]()
對普通用戶來說,Claude Sonnet 5 從今天起面向所有套餐開放,成為 Free 和 Pro 用戶的默認模型,Max、Team 和 Enterprise 用戶也可以使用。同時,它也進入 Claude Code 和 Claude Platform,開發(fā)者可以通過 claude-sonnet-5 調(diào)用。
能力之外,安全也是 Anthropic 這次發(fā)布的重點。
官方稱,Sonnet 5 相比 Sonnet 4.6 更擅長拒絕惡意請求,也更能抵抗 prompt injection 攻擊,幻覺和迎合傾向也更低。在自動化行為審計中,Sonnet 5 的不良行為率低于 Sonnet 4.6,但仍高于 Opus 4.8 和 Claude Mythos Preview。
![]()
網(wǎng)絡(luò)安全能力方面,Anthropic 表示并沒有專門訓(xùn)練 Sonnet 5 做高風(fēng)險網(wǎng)絡(luò)安全任務(wù)。它能完成一些常規(guī)、無害的網(wǎng)絡(luò)安全工作,但在危險能力評測中,明顯弱于 Opus 4.8 和 Mythos 5。
以 Firefox 147 漏洞利用評測為例,Sonnet 4.6 和 Sonnet 5 都沒有成功寫出完整可運行的 exploit,Sonnet 5 只是在部分成功率上略高于 Sonnet 4.6。Anthropic 認為,這更多來自模型通用能力提升,而非針對網(wǎng)絡(luò)攻擊能力做了專門訓(xùn)練。
![]()
因此,Sonnet 5 默認啟用了網(wǎng)絡(luò)安全防護機制,用于實時識別和攔截危險用途。不過 Anthropic 判斷 Sonnet 5 的整體網(wǎng)絡(luò)安全風(fēng)險較低,所以防護強度低于 Fable 5。
放在產(chǎn)品線上看,Sonnet 5 是一次常規(guī)升級。放在 Anthropic 眼下的時間點看,它更像是一張遞給開發(fā)者、企業(yè)客戶和 IPO 市場的答卷。
不只想寫代碼,Anthropic 也要用 Claude 講一個更大的故事
同一天,Anthropic 還發(fā)布了另一款產(chǎn)品:Claude Science。
和 Sonnet 5 面向開發(fā)者、企業(yè)用戶的模型升級不同,Claude Science 瞄準的是科學(xué)研究場景。按照 Anthropic 的說法,它是一個面向科學(xué)家的 AI workbench,可以把研究人員日常使用的工具、數(shù)據(jù)庫、計算資源和論文寫作流程放進同一個環(huán)境里。
科學(xué)研究里有大量瑣碎工作。
研究人員要查 PubMed,要寫 Jupyter Notebook,要跑 R,要連接集群終端,還要處理各種數(shù)據(jù)庫、文件格式和數(shù)據(jù)管線。
![]()
▲ https://www.anthropic.com/news/claude-science-ai-workbench
Claude Science 想做的,就是把這些分散工具整合起來,讓科學(xué)家可以在一個會話里完成文獻分析、多步驟研究、圖表生成、手稿修改和計算任務(wù)。
幫忙寫代碼只是它的一個核心亮點,Anthropic 強調(diào),Claude Science 生成的結(jié)果會帶有可審計歷史,包括圖表背后的代碼、運行環(huán)境、自然語言說明和完整消息記錄。研究人員可以檢查一個結(jié)果是怎么來的,也可以在幾個月后重新復(fù)現(xiàn)。
它還能原生渲染 3D 蛋白結(jié)構(gòu)、基因組瀏覽器軌道、化學(xué)結(jié)構(gòu)等科學(xué)對象,并支持用戶用自然語言修改圖表,比如去掉網(wǎng)格線,或者把坐標軸改成對數(shù)尺度。
在算力層面,Claude Science 可以連接研究人員已有的本地電腦、Linux 機器、HPC 集群登錄節(jié)點,也可以調(diào)用 Modal 之類的按需算力。它會先擬定計劃,在訪問新資源前請求確認,再提交計算任務(wù)。
![]()
對涉及大規(guī)模數(shù)據(jù)和敏感數(shù)據(jù)的科研場景來說,一個關(guān)鍵賣點是數(shù)據(jù)可以留在實驗室已有基礎(chǔ)設(shè)施上,只有每一步分析所需的上下文會發(fā)送給 Claude。
Anthropic 還為 Claude Science 預(yù)置了 60 多個科學(xué)技能和連接器,覆蓋基因組學(xué)、單細胞、蛋白質(zhì)組學(xué)、結(jié)構(gòu)生物學(xué)、化學(xué)信息學(xué)等方向。它可以連接 UniProt、PDB、Ensembl、Reactome、ClinVar、ChEMBL、GEO 等數(shù)據(jù)庫,也能使用 NVIDIA BioNeMo Agent Toolkit,調(diào)用 Evo 2、Boltz-2、OpenFold3 等生命科學(xué)模型和庫。
具體而言,UCSF Brain Tumor Center 的 Stephen Francis 則用它加速膠質(zhì)瘤分子流行病學(xué)研究,稱部分分析時間被壓縮到原來的十分之一左右。
![]()
目前,Claude Science 已以 beta 形式開放給 Claude Pro、Max、Team 和 Enterprise 用戶,支持 macOS 和 Linux。Team 和 Enterprise 用戶需要管理員啟用。
Anthropic 還會支持最多 50 個 Claude Science AI for Science 項目,每個項目最高提供 3 萬美元 credits,Modal 也會為部分項目提供最高 2000 美元算力支持,申請截止到 2026 年 7 月 15 日。
而 Sonnet 5 也好、Claude Science 也罷,一個面向開發(fā)者和企業(yè)生產(chǎn)流程,一個面向科研、生命科學(xué)和醫(yī)療相關(guān)研究。
它們在不同方向上發(fā)力,但最終匯聚到同一個目標:Anthropic 不想只證明 Claude 會聊天、會寫代碼,還要證明 Claude 可以進入長期、復(fù)雜、專業(yè)、付費意愿更強的工作場景。
這恰逢 Anthropic 的 IPO 故事逐步清晰之際。
6 月初,Anthropic 已經(jīng)秘密提交 IPO 招股書草案,正式進入上市準備階段。市場對 Anthropic 的期待,已經(jīng)被融資和收入增長推得很高。
![]()
今年 2 月,Anthropic 以約 3800 億美元估值完成 300 億美元融資,年化收入約 140 億美元。到 5 月底,Anthropic 又完成 650 億美元 Series H 融資,投后估值達到 9650 億美元,Altimeter Capital、Sequoia Capital 等機構(gòu)參與領(lǐng)投。
與此同時,市場消息稱 Anthropic 的收入運行率已經(jīng)突破 470 億美元。這樣的增長速度很驚人,也意味著公眾市場會用更嚴格的標準審視它。
對 Anthropic 來說,IPO 敘事不能只停留在 Claude 很強。投資人真正關(guān)心的是:強模型能不能變成穩(wěn)定收入;高收入背后的毛利率能不能站住;近萬億美元估值,能不能由企業(yè)客戶、訂單、API 使用量和專業(yè)場景長期支撐。
![]()
Claude Science 則把這個問題推向更專業(yè)的場景。科研機構(gòu)、藥企、醫(yī)療研究團隊、大學(xué)實驗室,都是 AI 公司爭奪的高價值客戶。它們對模型能力、可審計性、數(shù)據(jù)安全和可復(fù)現(xiàn)性要求更高。
至于回到用戶這一側(cè),Claude 的處境其實有點尷尬:好用,但還沒有好用到可以無腦依賴;昂貴,又還沒有貴到讓人徹底放棄。
更麻煩的是,它已經(jīng)開始承載越來越多不該被輕易拿走的東西:幾年的對話、項目里的文檔、調(diào)好的提示詞、寫作偏好、Claude Code 里的工作流,以及各種長期積累下來的上下文。
![]()
必須承認,Claude 本來就沒有正式面向國內(nèi)用戶開放,但問題在于,封號、誤判、郵件定位、申訴低效,這一整套奇葩操作放在任何主流商業(yè)服務(wù)里都顯得匪夷所思。
一個用戶可以理解平臺有規(guī)則,卻很難理解自己付了費、搭了工作流、沉淀了數(shù)據(jù)之后,賬號命運還要像抽盲盒一樣交給一套看不見的 AI 風(fēng)控系統(tǒng)。
Anthropic 當(dāng)然可以說自己在做更安全的 AI,只是用戶發(fā)現(xiàn)自己沉淀的數(shù)字資產(chǎn)可能被誤傷,被一兩封輕飄飄郵件帶走時,所謂「負責(zé)任的 AI」,就很難只靠所謂安全的系統(tǒng)卡來解釋。
Claude 讓人看見 AI 的能力上限,但殊不知,平臺的下限也同樣重要。猶高談責(zé)任,真無恥之尤也。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.