![]()
編輯丨coisini
去年十月,Anthropic 推出了 Claude 生命科學版 ——Claude for Life Sciences,旨在讓 Claude 成為生命科學領域工作者更得力的合作伙伴。
之后,Anthropic 投入大量資源,致力于將 Claude 打造為最適合科研工作的模型。最新推出的 Claude Opus 4.5 在圖表解析、計算生物學和蛋白質理解等基準測試中均取得顯著進步。
Anthropic 與學術界及產業界研究人員密切合作,致力于精準把握科學家如何運用人工智能加速科研進程。
![]()
研究人員已開發出定制化系統,將 Claude 的應用場景拓展到文獻綜述或代碼輔助等基礎任務之外。簡而言之,Claude 正在重塑科學家的研究模式,推動科研領域邁向全新的科學洞察與發現。
Anthropic 最近列舉了一些知名實驗室采用 Claude 加速科研進程的例子。
Biomni:
集成數百種工具與數據庫的通用生物醫學智能體
生物學研究的一大瓶頸在于工具碎片化:現有數百個數據庫、軟件包和實驗方案,研究人員需要耗費大量時間在不同平臺間進行選擇和掌握。在理想情況下,這些時間本應用于實驗操作、數據解析或探索新課題。
斯坦福大學研發的智能 AI 平臺 Biomni,將數百種工具、軟件包和數據集整合進統一系統,由 Claude 驅動的智能體可在其中自主調度。研究人員使用自然語言提出需求,Biomni 會自動匹配合適資源。該系統能夠提出假設、設計實驗方案,并在超過 25 個生物學子領域執行分析任務。
以全基因組關聯分析(GWAS)為例,這種研究旨在尋找與特定性狀或疾病相關的基因變異。
基因組掃描相對簡單,耗時環節在于數據解析與意義解讀:基因組數據格式雜亂需要深度清洗;研究人員必須控制混雜因素并處理缺失數據;發現「命中信號」后,還需解析其生物學意義 —— 定位鄰近基因、確定其表達細胞類型、推測影響的生物通路等。每個步驟都可能涉及不同工具、不同文件格式和大量人工決策。這種繁瑣過程使得單次 GWAS 分析常需數月時間,而在 Biomni 的初期試驗中,僅需 20 分鐘。
Biomni 團隊已通過多領域案例驗證系統可靠性:在分子克隆實驗設計中,盲評顯示其方案與擁有五年以上經驗的博士后水平相當;處理 30 名受試者超過 450 份可穿戴設備數據僅用 35 分鐘,而專家完成相同任務預計需三周;分析 33.6 萬個人類胚胎組織單細胞基因活性數據時,系統不僅驗證了已知調控關系,更發現了研究人員未曾關聯到胚胎發育過程的新轉錄因子。
Biomni 并非完美系統,因此設置了防護機制以監測 Claude 是否偏離正軌。它也不能解決所有問題,但當其能力不足時,專家可將方法論編碼為技能 —— 教智能體模仿專家解決問題的思路而非任其自由發揮。
Biomni 代表了一種通用型解決方案,而其他實驗室正在構建更專精的系統,以攻克特定研究流程中的瓶頸。
Cheeseman 實驗室:
大規模基因敲除實驗解讀自動化
當科學家需要了解基因功能時,常用方法是將其從細胞或生物體中移除并觀察產生的異常。CRISPR 基因編輯技術使大規模精準敲除成為可能,但其應用仍受限制:實驗室產生的數據量遠超分析處理能力。
這正是麻省理工學院 Whitehead 研究所 Iain Cheeseman 實驗室面臨的挑戰。他們使用 CRISPR 技術對數千萬人類細胞進行數千種基因敲除,通過顯微成像記錄每個細胞的變化。
但解讀基因簇的意義 —— 探究聚類原因、尋找共同特征、判斷屬于已知生物學關系還是新發現 —— 仍然需要專家逐基因查閱文獻。這個過程極其緩慢:單次篩選可能產生數百個基因簇,由于時間、精力和專業知識限制,大多數簇從未被深入探究。
多年來 Cheeseman 親自承擔所有解讀工作。他估計自己大約能記住 5000 個基因功能,但有效分析這些數據仍需數百小時。為加速這一進程,博士生 Matteo Di Bernardo 著手構建能自動化 Cheeseman 工作模式的系統。通過深入解析 Cheeseman 的解讀方法論 —— 數據源選擇、模式識別標準、發現價值判斷 —— 他們最終創建了由 Claude 驅動的 MozzareLLM 系統。
該系統接收基因簇數據后,會執行 Cheeseman 式的專家分析:識別潛在共享生物過程、標注研究充分與欠缺的基因、突出值得跟進的目標。這不僅極大加速了研究進程,還幫助他們獲得額外的重要生物學發現。在開發 MozzareLLM 的過程中,Di Bernardo 測試了多種 AI 模型。Claude 的表現始終優于其他模型。
Lundberg 實驗室:
測試 AI 主導的基因研究目標假設生成
Cheeseman 實驗室采用的光學混合篩選技術可在單次實驗中敲除數千基因,其瓶頸在于結果解讀。但并非所有細胞類型都適用混合篩選方法。斯坦福大學 Lundberg 實驗室等研究團隊進行的是規模較小、目標集中的篩選實驗,他們的瓶頸出現在更前端:如何確定需要靶向的基因。
由于單次聚焦篩選成本可能超過 2 萬美元且隨規模增加,實驗室通常僅選擇數百個最可能關聯特定條件的基因。傳統流程需要研究生和博士后團隊逐條添加候選基因并附簡要理由或文獻鏈接。這是基于文獻調研、專業知識和直覺的「經驗猜謎游戲」,受限于人類認知帶寬,且依賴已有研究成果和在場人員記憶,難免存在疏漏。
Lundberg 實驗室正運用 Claude 顛覆這種方法。他們的系統不再追問「基于已有研究我們能做出哪些推測」,轉而探索「基于分子特性應該研究什么」。
團隊構建了細胞內所有已知分子(蛋白質、RNA、DNA)的關聯圖譜,標注蛋白質相互作用、基因編碼關系和結構相似性。隨后向 Claude 提出目標 —— 例如尋找調控特定細胞結構或過程的基因 ——Claude 通過遍歷分子關系圖譜,依據生物學特性與關聯度篩選候選基因。
該實驗室正在開展驗證實驗,將對比人類專家與 Claude 的表現。若該方法驗證有效,團隊預期它將成為聚焦擾動篩選的標準前置步驟。實驗室無需再依賴直覺博弈或當代研究中盛行的暴力篩選,而是基于信息做出精準靶向決策。
原文鏈接:https://www.anthropic.com/news/accelerating-scientific-research
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.