![]()
編輯丨%
2026 年 4 月 16 日,為支持生物學、藥物發(fā)現(xiàn)和轉(zhuǎn)化醫(yī)學研究,OpenAI 推出了他們專門打造的前沿推理模型 GPT-Rosalind。生命科學模型系列針對科學工作流程進行了優(yōu)化,結(jié)合了工具的改進與對化學、蛋白質(zhì)工程和基因組學的深入理解。
在美國,從靶點發(fā)現(xiàn)到新藥獲得監(jiān)管批準,平均大約需要 10~15 年時間。生命科學的進步不僅受限于基礎(chǔ)科學的難度,還受限于研究工作流程本身的復雜性。科學家必須跨越大量文獻、專業(yè)數(shù)據(jù)庫、實驗數(shù)據(jù)和不斷演變的假設(shè),以產(chǎn)生和評估新想法。這些工作流程通常耗時、分散且難以擴展。
OpenAI 相信先進的人工智能系統(tǒng)可以幫助研究人員更快地完成這些工作流程——不僅通過提高現(xiàn)有工作效率,還幫助科學家探索更多可能性,揭示可能被忽視的聯(lián)系,并更早得出更好的假設(shè)。
通過支持證據(jù)綜合、假設(shè)生成、實驗規(guī)劃及其他多步驟研究任務(wù),該模型旨在幫助研究人員加速早期發(fā)現(xiàn)階段。隨著時間推移,這些系統(tǒng)可以幫助生命科學組織發(fā)現(xiàn)原本不可能實現(xiàn)的突破,成功率也會大幅提升。
GPT-Rosalind 現(xiàn)已作為研究預(yù)覽版,通過團隊的可信訪問計劃,在 ChatGPT、Codex 及 API 中向合格客戶開放。此外,更有可免費訪問的生命科學研究插件,幫助科學家將模型連接到 50 多個科學工具和數(shù)據(jù)源。
![]()
圖示:看看 GPT-Rosalind 套件如何轉(zhuǎn)化為可衡量的研究工作流程改進。
性能與評估
團隊評估了 GPT-Rosalind 在科學發(fā)現(xiàn)和工業(yè)研究基礎(chǔ)上的多項能力。這些評估衡量了跨科學子領(lǐng)域的核心推理,包括化學反應(yīng)機制;蛋白質(zhì)結(jié)構(gòu)、突變效應(yīng)和相互作用;以及 DNA 序列的系統(tǒng)發(fā)育解釋。
他們還通過解讀實驗結(jié)果、識別專家相關(guān)模式,并綜合外部信息評估模型是否能支持真實的研究工作流程,設(shè)計后續(xù)實驗。最后,他們測試模型是否能夠選擇并使用合適的計算工具、數(shù)據(jù)庫和領(lǐng)域特定能力來增強推理。綜合來看,這些評估顯示了科學研究全過程的進展,表明他們更有效地幫助研究人員完成具有挑戰(zhàn)性的發(fā)現(xiàn)任務(wù)。
![]()
圖示:GPT-Rosalind 提升核心生物和化學基準。
此外,團隊提供了部分可供參考的提示詞,分別對應(yīng)了有機化學、蛋白質(zhì)理解、基因組學、實驗設(shè)計與分析、工具使用等方面。
![]()
圖示:工具使用相關(guān)的提示詞。
行業(yè)評估
OpenAI 團隊通過一系列公開基準測試評估了 GPT-Rosalind。在 BixBench 基準測試中,該基準以真實世界生物信息學和數(shù)據(jù)分析為核心,GPT-Rosalind 在已發(fā)布評分模型中取得了領(lǐng)先表現(xiàn)。
![]()
圖示:GPT-Rosalind 在 BixBench 上表現(xiàn)出的領(lǐng)先性能。
在 LABBench2 這一衡量文獻檢索、數(shù)據(jù)庫訪問、序列操作和協(xié)議設(shè)計等多種研究任務(wù)表現(xiàn)的基準測試中,GPT-Rosalind 在 11 項任務(wù)中有 6 項優(yōu)于 GPT-5.4。最顯著的改進來自 CloningQA,它要求為分子克隆協(xié)議設(shè)計 DNA 和酶試劑的端到端。
此外,團隊還與 Dyno Therapeutics(在 AI 設(shè)計基因療法領(lǐng)域具有先驅(qū)性) 合作,利用未發(fā)表、未受污染的序列,在 RNA 序列到功能預(yù)測和生成任務(wù)中評估該模型。該表現(xiàn)與 57 項人工智能-生物領(lǐng)域人類專家的歷史評分進行了比較。并在 Codex 應(yīng)用中直接評估時,預(yù)測任務(wù)排名超過人類專家的第 95 百分位,序列生成任務(wù)中人類專家的排名約為第 84 百分位。
這些評估為科學家每天依賴的,用于產(chǎn)生證據(jù)、分析復雜數(shù)據(jù)并朝向可辯護的生物學結(jié)論邁進的工作流程,提供了有意義的表現(xiàn)信號。
連接科學家所用的工具
科學家可采用 OpenAI 團隊開發(fā)的,適用于 Codex 的新生命科學研究插件。該軟件包包含一套廣泛的模塊化技能,適用于大多數(shù)常見的研究工作流程,旨在幫助用戶跨越人類遺傳學、功能基因組學、蛋白質(zhì)結(jié)構(gòu)、生物化學、臨床證據(jù)及公共研究發(fā)現(xiàn)等領(lǐng)域工作。
https://github.com/openai/plugins/tree/main/plugins/life-science-research
這些技能作為協(xié)調(diào)層,幫助科學家更有效地處理寬泛、模糊且多步驟的問題。它們提供50多個公共多組學數(shù)據(jù)庫、文獻來源和生物學工具的訪問,并為蛋白質(zhì)結(jié)構(gòu)查找、序列搜索、文獻綜述和公開數(shù)據(jù)集發(fā)現(xiàn)等常見可重復工作流程提供靈活的起點。
入門操作與未來
研究組織可通過相關(guān)的資格認證和安全審核流程申請訪問權(quán)限。
https://openai.com/form/life-sciences-access/
在研究預(yù)覽期間,使用該模型不會消耗現(xiàn)有的信用點或代幣——但會受到濫用保護措施的影響。隨著項目擴展,團隊后續(xù)將分享更多價格和供應(yīng)信息。
生命科學模型旨在幫助科學組織在需要技術(shù)能力和運營控制的環(huán)境中,更快地完成更高質(zhì)量的工作。
這是 OpenAI 生命科學系列首個模型的發(fā)布,他們認為這是構(gòu)建能夠加速科學發(fā)現(xiàn)的人工智能的長期承諾的開始,這些人工智能能夠加速從人類健康到更廣泛的生物研究等對社會極為重要的領(lǐng)域。團隊將繼續(xù)改進模型的生物學推理,擴大對工具密集和遠景研究流程的支持,并與領(lǐng)先科學機構(gòu)緊密合作,評估其現(xiàn)實世界影響。
團隊同樣在探索人工智能引導的蛋白質(zhì)和催化劑設(shè)計,包括人工智能系統(tǒng)在保留或改善關(guān)鍵功能特性的同時修改生物結(jié)構(gòu)的能力。隨著時間推移,他們預(yù)計這些系統(tǒng)將成為越來越有能力的發(fā)現(xiàn)伙伴——幫助科學家更快地從問題走向證據(jù),從證據(jù)到洞察,從洞察到患者新療法。
https://openai.com/index/introducing-gpt-rosalind/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.