PRODUCT
今天,OpenAI 發布了 GPT-Rosalind,定位是面向生物學、藥物發現和轉化醫學的前沿推理模型
這是 OpenAI 推出的第一個生命科學方向專用模型,名字取自英國化學家 Rosalind Franklin,她當年的 X 射線衍射圖像是 DNA 雙螺旋結構被發現的關鍵證據
Codex 里的 GPT-Rosalind,模型選擇器在右下
GPT-Rosalind 現在以 research preview 形式開放,需要走 OpenAI 的 trusted access 流程,目前只對美國境內合規的 Enterprise 客戶開放。模型同時進 ChatGPT、Codex 和 API 三個入口
OpenAI 同步發了一個 Life Sciences 研究插件,免費給所有人用,能連超過 50 個科學工具和數據庫。這個插件不需要走 trusted access,普通的 GPT 主線模型也能調用
OpenAI 在通用大模型路徑之外,開了一條領域專精模型的產品線,GPT-Rosalind 是第一站
這個模型在做什么
GPT-Rosalind 不走通用對話模型微調的路子,OpenAI 把它定義為「生命科學系列」的第一個模型。強項集中在四類工作
→ 跨分子、蛋白、基因、通路和疾病相關生物學的推理
→ 多步驟的科研工作流,比如文獻綜述、序列到功能解釋、實驗規劃、數據分析
→ 調用專業數據庫和計算工具
→ 綜合外部信息,提出后續實驗設計
這些能力對應的是科研人員日常最耗時的一段,在大量文獻、數據庫、實驗數據和不斷迭代的假設之間反復切換。OpenAI 給出的判斷是,目前一款新藥從靶點發現到上市平均要 10 到 15 年,前期工作的效率每改善一點,整個鏈條都會受益
模型給出靶點取舍建議后,接著設計 96 孔板驗證實驗
Benchmark 怎么打的
OpenAI 公布了幾個公開 benchmark 上的成績
BixBench 是面向生物信息學和數據分析真實任務的 benchmark,GPT-Rosalind 拿了 0.751 的通過率,在已發布成績的模型里領先
LABBench2 覆蓋文獻檢索、數據庫訪問、序列處理、實驗方案設計等研究任務。GPT-Rosalind 在 11 項里有 6 項超過 GPT-5.4,提升最大的是 CloningQA,要求端到端設計分子克隆所需的 DNA 和酶試劑
跟 Dyno Therapeutics 的合作評估是這次最值得看的一組數。Dyno 是做 AI 設計基因療法的公司,他們用未發表、未污染的 RNA 序列測試模型在「序列到功能預測」和「序列生成」上的表現,對照的是 57 位 AI-bio 領域人類專家的歷史成績
模型在 Codex 應用里跑,best-of-ten 提交結果
→ 預測任務排名超過人類專家的 第 95 百分位
→ 序列生成任務排名約人類專家的 第 84 百分位
未發表數據這條很關鍵,它排除了模型背誦訓練集的可能
那個免費插件
Life Sciences 研究插件已經放在 GitHub 上,今天就能用
![]()
Life Sciences 研究插件,六個研究方向 + 50 多個工具源
插件是一組模塊化的 skill,覆蓋人類遺傳學、功能基因組學、蛋白結構、生物化學、臨床證據和公開數據集六個常見研究方向。背后接的是超過 50 個公開的多組學數據庫、文獻源和生物學工具,給科研人員一個可重復使用的起點,蛋白結構查詢、序列搜索、文獻綜述、公開數據集發現這些動作不用每次重新搭
不在 trusted access 里的用戶也能用這個插件,只是后端會走 OpenAI 主線模型,不是 Rosalind。Enterprise 用戶走 Rosalind,可以拿到更深的生物學推理
誰在用
OpenAI 列出的合作客戶跨制藥、生物技術、研究機構和基礎設施供應商
Amgen、Novo Nordisk、Moderna、Thermo Fisher Scientific、Oracle Health and Life Sciences、NVIDIA、Allen Institute、Benchling、UCSF School of Pharmacy
幾個高管在公告里給了表態
Amgen 的 AI 與數據高級副總裁 Sean Bruich 說這次合作能讓公司用更先進的能力去加速藥物送達患者的速度
Moderna CEO Stéphane Bancel 強調模型能在復雜生物證據之間做推理,把洞見轉化成實驗流程
NVIDIA 醫療與生命科學副總裁 Kimberly Powell 把這件事描述為「領域推理 + 加速計算」的合流
Allen Institute 的 CTO Andy Hickl 說 Rosalind 讓數據查找和對齊這些手工步驟,在 agentic workflow 里更一致、更可重復
Los Alamos National Laboratory 也在聯合 OpenAI 在做 AI 引導的蛋白和催化劑設計,包括讓 AI 系統在保留或改進關鍵功能的前提下修改生物結構
為什么是 trusted access
這是這次發布里另一條值得停下來看的線
OpenAI 沒有把 GPT-Rosalind 放到 ChatGPT Plus 或 API 公開層。trusted access 流程要求申請機構滿足三條,從事有清晰公共健康收益的合法科研、維持治理與防濫用控制、把訪問權限收斂在受控的合規環境里。模型本身也加了 enterprise-grade 的安全和訪問管理控制,OpenAI 可以在 onboarding 或后續階段額外索取信息
OpenAI Life Sciences 產品負責人 Yunyun Wang 在媒體簡報里給的解釋是,限制訪問是為了在最大化使用價值的同時把誤用風險壓住
研究方向負責人 Joy Jiao 強調這套模型不用來替代科學家,目標是幫研究人員加速最耗時和分析密集的環節,最終的判斷和驗證仍然要科學家來做
幾條結構性的事
講完產品本身,幾個值得單獨標記的點
OpenAI 把 GPT-Rosalind 定義成「生命科學系列」的第一個,后續會有一條序列化的模型線展開。從架構上看,行業正在從「越大越通用」往「按領域做專門 reasoning 模型」走。OpenAI 之前在代碼、視覺上做過類似的事,這次輪到生物
研究 preview 階段使用 Rosalind 不消耗已有的 credits 和 token,OpenAI 說后續會公布定價和擴大可用范圍的細節
普通用戶和 VC 當下能立即上手的是那個免費插件。Rosalind 模型本身要有合規的科研使命才能拿到
參考材料
OpenAI 官方公告
https://openai.com/index/introducing-gpt-rosalind/
Life Sciences 研究插件 GitHub
https://github.com/openai/plugins/tree/main/plugins/life-science-research
trusted access 申請入口
https://openai.com/form/life-sciences-access
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.