網易首頁 > 網易號 > 正文申請入駐

OpenAI 發布首個生命科學模型 GPT-Rosalind

2026-04-17 17:45:20　來源: 賽博禪心

北京舉報

分享至

PRODUCT

今天，OpenAI 發布了 GPT-Rosalind，定位是面向生物學、藥物發現和轉化醫學的前沿推理模型

這是 OpenAI 推出的第一個生命科學方向專用模型，名字取自英國化學家 Rosalind Franklin，她當年的 X 射線衍射圖像是 DNA 雙螺旋結構被發現的關鍵證據

Codex 里的 GPT-Rosalind，模型選擇器在右下

GPT-Rosalind 現在以 research preview 形式開放，需要走 OpenAI 的 trusted access 流程，目前只對美國境內合規的 Enterprise 客戶開放。模型同時進 ChatGPT、Codex 和 API 三個入口

OpenAI 同步發了一個 Life Sciences 研究插件，免費給所有人用，能連超過 50 個科學工具和數據庫。這個插件不需要走 trusted access，普通的 GPT 主線模型也能調用

OpenAI 在通用大模型路徑之外，開了一條領域專精模型的產品線，GPT-Rosalind 是第一站

這個模型在做什么

GPT-Rosalind 不走通用對話模型微調的路子，OpenAI 把它定義為「生命科學系列」的第一個模型。強項集中在四類工作

→ 跨分子、蛋白、基因、通路和疾病相關生物學的推理

→ 多步驟的科研工作流，比如文獻綜述、序列到功能解釋、實驗規劃、數據分析

→ 調用專業數據庫和計算工具

→ 綜合外部信息，提出后續實驗設計

這些能力對應的是科研人員日常最耗時的一段，在大量文獻、數據庫、實驗數據和不斷迭代的假設之間反復切換。OpenAI 給出的判斷是，目前一款新藥從靶點發現到上市平均要 10 到 15 年，前期工作的效率每改善一點，整個鏈條都會受益

模型給出靶點取舍建議后，接著設計 96 孔板驗證實驗

Benchmark 怎么打的

OpenAI 公布了幾個公開 benchmark 上的成績

BixBench 是面向生物信息學和數據分析真實任務的 benchmark，GPT-Rosalind 拿了 0.751 的通過率，在已發布成績的模型里領先

LABBench2 覆蓋文獻檢索、數據庫訪問、序列處理、實驗方案設計等研究任務。GPT-Rosalind 在 11 項里有 6 項超過 GPT-5.4，提升最大的是 CloningQA，要求端到端設計分子克隆所需的 DNA 和酶試劑

跟 Dyno Therapeutics 的合作評估是這次最值得看的一組數。Dyno 是做 AI 設計基因療法的公司，他們用未發表、未污染的 RNA 序列測試模型在「序列到功能預測」和「序列生成」上的表現，對照的是 57 位 AI-bio 領域人類專家的歷史成績

模型在 Codex 應用里跑，best-of-ten 提交結果

→ 預測任務排名超過人類專家的 第 95 百分位

→ 序列生成任務排名約人類專家的 第 84 百分位

未發表數據這條很關鍵，它排除了模型背誦訓練集的可能

那個免費插件

Life Sciences 研究插件已經放在 GitHub 上，今天就能用

Life Sciences 研究插件，六個研究方向 + 50 多個工具源

插件是一組模塊化的 skill，覆蓋人類遺傳學、功能基因組學、蛋白結構、生物化學、臨床證據和公開數據集六個常見研究方向。背后接的是超過 50 個公開的多組學數據庫、文獻源和生物學工具，給科研人員一個可重復使用的起點，蛋白結構查詢、序列搜索、文獻綜述、公開數據集發現這些動作不用每次重新搭

不在 trusted access 里的用戶也能用這個插件，只是后端會走 OpenAI 主線模型，不是 Rosalind。Enterprise 用戶走 Rosalind，可以拿到更深的生物學推理

誰在用

OpenAI 列出的合作客戶跨制藥、生物技術、研究機構和基礎設施供應商

Amgen、Novo Nordisk、Moderna、Thermo Fisher Scientific、Oracle Health and Life Sciences、NVIDIA、Allen Institute、Benchling、UCSF School of Pharmacy

幾個高管在公告里給了表態

Amgen 的 AI 與數據高級副總裁 Sean Bruich 說這次合作能讓公司用更先進的能力去加速藥物送達患者的速度
Moderna CEO Stéphane Bancel 強調模型能在復雜生物證據之間做推理，把洞見轉化成實驗流程
NVIDIA 醫療與生命科學副總裁 Kimberly Powell 把這件事描述為「領域推理 + 加速計算」的合流
Allen Institute 的 CTO Andy Hickl 說 Rosalind 讓數據查找和對齊這些手工步驟，在 agentic workflow 里更一致、更可重復
Los Alamos National Laboratory 也在聯合 OpenAI 在做 AI 引導的蛋白和催化劑設計，包括讓 AI 系統在保留或改進關鍵功能的前提下修改生物結構

為什么是 trusted access

這是這次發布里另一條值得停下來看的線

OpenAI 沒有把 GPT-Rosalind 放到 ChatGPT Plus 或 API 公開層。trusted access 流程要求申請機構滿足三條，從事有清晰公共健康收益的合法科研、維持治理與防濫用控制、把訪問權限收斂在受控的合規環境里。模型本身也加了 enterprise-grade 的安全和訪問管理控制，OpenAI 可以在 onboarding 或后續階段額外索取信息

OpenAI Life Sciences 產品負責人 Yunyun Wang 在媒體簡報里給的解釋是，限制訪問是為了在最大化使用價值的同時把誤用風險壓住

研究方向負責人 Joy Jiao 強調這套模型不用來替代科學家，目標是幫研究人員加速最耗時和分析密集的環節，最終的判斷和驗證仍然要科學家來做

幾條結構性的事

講完產品本身，幾個值得單獨標記的點

OpenAI 把 GPT-Rosalind 定義成「生命科學系列」的第一個，后續會有一條序列化的模型線展開。從架構上看，行業正在從「越大越通用」往「按領域做專門 reasoning 模型」走。OpenAI 之前在代碼、視覺上做過類似的事，這次輪到生物

研究 preview 階段使用 Rosalind 不消耗已有的 credits 和 token，OpenAI 說后續會公布定價和擴大可用范圍的細節

普通用戶和 VC 當下能立即上手的是那個免費插件。Rosalind 模型本身要有合規的科研使命才能拿到

參考材料

OpenAI 官方公告

https://openai.com/index/introducing-gpt-rosalind/

Life Sciences 研究插件 GitHub

https://github.com/openai/plugins/tree/main/plugins/life-science-research

trusted access 申請入口

https://openai.com/form/life-sciences-access

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.