萬億AI巨頭Anthropic,攜帶兩款最強AI模型來炸場了!
就在今天,Claude Fable 5和Claude Mythos 5同步上線。
兩者都擁有相同的能力,但是Fable 5設有嚴格的安全限制。
![]()
一時間,所有人都在討論這兩款模型的性能。
尤其在生命科學和醫學領域,Fable 5和Mythos 5實現了質的飛躍!
它能自主進行藥物設計流程,在全程無人介入的狀態下,為14個蛋白質靶點完成藥物設計,其中 64%的靶點都得到了優質候選化合物。
藥物研發部分環節,兩款模型直接實現了10倍提升。
不止如此,Mythos 5僅用一周時間,自主訓練基因組學大模型,性能超過Science發表的同類研究!
在各類醫療類測評榜單中,Mythos 5也直接霸榜,超越了GPT5.5等一眾模型。
以上,Anthropic聲稱擁有最好的生物學模型,科學家們紛紛想要去驗證時,卻直接傻眼了。
因為,一旦你問AI有關生物學和化學的知識,它會瞬間退回到之前的Clude Opus4.8,甚至僅僅出現“癌癥”兩個字都會被屏蔽。
![]()
給出的理由當然是,“出于安全性考慮”。
甚至,Clude能夠根據以往的上下文識別到身份,如果是一名生物學家,連打個招呼都不行,只有隱身模式才能正常對話。
![]()
也就是說,如果你從事生物學、醫學、化學乃至數學研究,Fable5和Mythos 5根本不歡迎你。
這直接引發了生物學家的集體震怒!
有科學家甚至痛批,盡管口口聲聲表明為了人類安全,但Anthropic現在表現得像整個AI世界中最大的反派。
![]()
Anthropic是真的不愿意把提供給科學家嗎?為什么又要花精力進行測試呢?
Clue給出的說法是,不久后將僅面向部分生物學研究人員開放,解除相關限制,直至更廣泛的可信訪問計劃推出。
不過這一說法并沒有得到科學家們的理解。
要知道,Anthropic可是非常愿意把模型開放給企業,尤其是有錢有數據的跨國藥企。
前不久,跨國藥企賽諾菲和Anthropic達成合作協議,全面部署Claude人工智能系統,包括從研發到銷售的所有職能部門。
也就是說,普通用戶得到了“安全版本”,企業得到了增強版本,但對科學貢獻最大的生物學家們,卻被擋在了AI的大門外。
![]()
藥物研發提效10倍,命中率高達64%
作為通用大模型,Fable 5和Mythos 5在生命科學領域能做到的事情,甚至超越了一眾專屬模型。
據相關研發團隊測試,Mythos 5模型能夠大幅提升蛋白質藥物設計的工作效率,可將藥物設計部分環節的工作效率提升約十倍。
并且,該模型僅依托蛋白質設計與生物信息學工具即可全自動運行,全程無需人工操作干預。
從選靶點、跑設計到失敗自糾錯一氣呵成,14個藥物靶點中,有9個靶點被認定為優質候選藥物靶點,命中率高達64.3%,在通用大模型中已經是非常不錯的表現。
![]()
這些靶點覆蓋免疫檢查點、生長因子與受體信號傳導、神經退行性疾病、肌肉疾病等主流研究方向,同時還能攻克大量結構復雜、研發難度極高的特殊靶點。
不僅如此,Mythos5還是首款可穩定產出全新、具備科研價值分子生物學假設的AI模型。
為驗證其能力,研發團隊將其與同系列的Opus模型開展盲法對照測試,結果顯示,科研研究人員在近80%的場景中,更認可Mythos 5提出的科研假設。
有些假設已經得到了實驗驗證。
例如,AI提出的一項關于大腸桿菌蛋白作用新機制的假設,也得到了外部獨立實驗室的研究佐證,充分驗證了模型假設的科學性與可靠性。
更令人驚艷的,是在基因組學研究領域。
Mythos5僅用一周多的時間,就在極少人工干預的情況下,自主收集了138個物種、幾百萬個細胞的數據,自己設計并訓練了一個機器學習模型。
甚至,這款訓練出的模型,超越了近期發在Science上的同類研究。
參數規模僅為同類模型的百分之一,但綜合性能更優。據相關研究成果,將在未來數月內正式對外發表。
![]()
多項醫療領域基準測,強到可怕
不僅如此,Mythos 5還在多個醫療任務中,表現非常優秀。
HealthBench 是OpenAI推出的專業評測基準,包含5000組真實的患者多輪對話。
在該測試中,Mythos 5的得分達到62.7%,超越了GPT-5.5的56.5%。
![]()
HealthBench Professional同樣是OpenAI打造的評測基準,專門針對醫生專業工作任務開展能力測評。
測試結果顯示,Mythos 5得分66.0%,大幅領先GPT-5.5的51.8%,在專業醫療任務處理上優勢明顯。
![]()
HealthAdminBench 是斯坦福大學推出的計算機評測基準,主要用于測評各類醫療行政工作的完成能力,涵蓋醫療預授權、理賠駁回與申訴等常見場景。
Fable 5在該基準中取得51.9%的成績。
![]()
不少醫生和醫學家希望看到更多更全面的測評,然而相關醫學能力也并沒有完全開放。
![]()
自家研究打臉,模型好不如數據好
更有意思的是,Anthropic自己最近發的一篇內部研究,專門研究了一眾AI生物智能體。
該研究涵蓋Claude Sonnet 4、Opus 4.7、Biomni OSS、Edison Analysis、以及GPT-5.5等頂級模型做了一個病毒序列檢索測試。
任務聽起來很簡單:從NCBI Virus數據庫里找到符合條件的病毒序列。
結果呢?同一模型、同一問題、跑三次,返回的結果數分別是106條、15條、5條,而標準答案是266條。
用這三組錯誤數據去推算埃博拉疫情的起源時間,分別得到2014年1月和離譜的1922年,相差近百年。
研究人員最后的結論非常扎心:問題不在模型夠不夠強,而在于NCBI Virus這類數據庫壓根兒就不是為AI設計的。
然而,一旦給模型接上gget virus的確定性工具層,所有模型的準確率立刻從百分之二三十飆到90%以上。
![]()
這意味著什么?
這等于變相承認,模型本身在真實生物數據面前遠不夠可靠。
而那些真正解決問題的,像gget virus這種打通數據基礎設施的工具,反而不是Anthropic宣傳的重點。
所以,Anthropic明明知道問題在哪里,卻選擇用一個傲慢的封禁來替代本該做的基建工程,安全限制從來不是萬能遮羞布。
![]()
引發眾怒,AI封鎖權力歸誰?
Clude Fable 5之所以引發眾怒是情有可原的。
Anthropic最精妙之處,它向大眾不斷輸出其“為了人類安全”的理念,成功打造成了一套高利潤的商業模式。
更關鍵的是,這個安全的邊界可以靈活調整。
真正的出于生物安全考慮是,讓AI區分提問意圖、專業背景等,而不是一刀切到連“癌癥”這個詞都屏蔽。
AI之所以存在,是因為它建立在人類積累的知識之上。
AlphaFold2就是最直觀的例子。
這項技術革新了生物研究領域,成為AI賦能生物學的里程碑,更是斬獲諾貝爾化學獎的重要成果。
而它的底層數據基礎,是過去幾十年里,無數科學家對蛋白質結構的探索與研究,是全球科研人員共同積累的成果。
因此當DeepMind宣布將新一代AlphaFold3閉源時,同樣遭到了科學界的大規模抵制,生物學家們聯名呼吁,才讓DeepMind逐漸放開限制。
不過,該模型至今沒有完全開源,最關鍵的訓練權重依舊沒有公開。
而原本AI應該是消除不平等的工具,但現在已經掌握在少數人手中。
后續平臺可能會推出身份認證機制,僅對認證的專業科研人員開放受限內容和核心權限。
但這也無法掩蓋當下的核心隱患。
這次事件已經給所有人敲響了警鐘:AI的核心管控權、技術封鎖權,完全掌握在各大科技公司手中。
但這些大公司永遠有權力將任何AI能力封鎖起來,以各種各樣的名義。
而誰來約束這種權力,仍然沒有答案。
—The End—
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.