Cancer Cell：復(fù)旦大學(xué)高強/吳英成團隊領(lǐng)銜，推出開源腫瘤免疫（OpenIO）路線圖，目標(biāo)直指AI原生免疫治療

2026-07-02 16:23:06　來源: 生物世界

上海舉報

分享至

撰文丨王聰

編輯丨王多魚

排版丨水成文

免疫檢查點抑制劑、CAR-T 細胞療法等癌癥免疫治療，已實現(xiàn)傳統(tǒng)化療或靶向藥物難以達到的持久緩解，重塑了多種血液系統(tǒng)惡性腫瘤及部分實體瘤的治療格局。然而，一個尷尬的事實是——同樣的免疫治療，對一個患者有效，對另一個患者可能完全沒用，還可能帶來嚴重的副作用。

這一挑戰(zhàn)源于免疫系統(tǒng)本身作為復(fù)雜自適應(yīng)系統(tǒng)的特性，其由多種細胞群體與物理微環(huán)境之間高維且隨機的相互作用所調(diào)控。因此，依賴線性相關(guān)性的傳統(tǒng)生物標(biāo)志物往往無法捕捉免疫反應(yīng)的非線性依賴背景。這導(dǎo)致我們雖然已積累了海量的測序數(shù)據(jù)，卻常常讀不懂這背后的機制。

要克服這些局限性，必須從描述性和回顧性分析轉(zhuǎn)向預(yù)測性和機制性建模。盡管免疫學(xué)依賴于假設(shè)驅(qū)動的低通量實驗，而人工智能（AI）卻有望解析高維模式和潛在邏輯。諸如 scGPT 和 Evo 等模型已證明，通過從現(xiàn)有數(shù)據(jù)中學(xué)習(xí)，能夠?qū)崿F(xiàn)對未知生物領(lǐng)域的外，構(gòu)建預(yù)測性虛擬細胞（Virtual Cell）也已成為下一代計算生物學(xué)的關(guān)鍵前沿。

近日，復(fù)旦大學(xué)附屬中山醫(yī)院高強教授、上海交通大學(xué)溥淵未來技術(shù)學(xué)院/臨港實驗室鄭雙佳研究員、復(fù)旦大學(xué)附屬中山醫(yī)院/斯坦福大學(xué)吳英成博士、西湖大學(xué)郭天南教授、復(fù)旦大學(xué)/上海人工智能實驗室孫思琦研究員、普林斯頓大學(xué)張載熙博士、浙江大學(xué)/良渚實驗室郭國驥教授、同濟大學(xué)劉琦教授、華東師范大學(xué)葉海峰教授、上海人工智能實驗室白磊研究員、字節(jié)跳動 Seed鄭在翔博士等，在Cancer Cell發(fā)表了題為：OpenIO: An open framework for AI-native immunotherapy 的文章，提出了開源腫瘤免疫（Open Immune Oncology，OpenIO），這是一個融合生成式人工智能與組學(xué)技術(shù)以推動精準(zhǔn)腫瘤學(xué)發(fā)展的框架。通過利用生物學(xué)的縮放定律和基礎(chǔ)模型，目標(biāo)是將免疫治療從經(jīng)驗性篩選轉(zhuǎn)變?yōu)榛?AI 的理性化治療干預(yù)設(shè)計。簡單來說，就是讓 AI 不僅能夠“讀懂”免疫系統(tǒng)，還能“設(shè)計”出更精準(zhǔn)的癌癥免疫治療方案。

給生物學(xué)“分詞”：AI 理解免疫的第一步

要讓 AI 處理生物學(xué)數(shù)據(jù)，首先得解決“語言不通”的問題。

OpenIO提出了“生物學(xué)分詞”（Tokenization of Biology）的概念：把單個細胞的轉(zhuǎn)錄組狀態(tài)看作一個“詞元”（Token），把組織微環(huán)境看作一段“上下文窗口”，基因就像字母，基因程序像短語，而細胞就像句子。

和傳統(tǒng)自然語言處理不同，這里的“詞”既有離散信息（比如細胞類型），也有連續(xù)信息（比如基因表達量、空間坐標(biāo)）。通過這種混合分詞方式，就能用 Transformer 架構(gòu)訓(xùn)練通用免疫學(xué)習(xí)器——它可以補全被掩蓋的基因序列，從 RNA 預(yù)測蛋白豐度，甚至推斷出缺失的空間坐標(biāo)。本質(zhì)上，這是給 AI 一本“免疫詞典”，讓它學(xué)會免疫系統(tǒng)的“語法”。

免疫學(xué)也有“Scaling Law”？數(shù)據(jù)越多，智能越強

大模型領(lǐng)域有個著名現(xiàn)象——模型性能隨參數(shù)規(guī)模和訓(xùn)練數(shù)據(jù)量的增加而提升，即“縮放定律”（Scaling Law）。OpenIO團隊大膽假設(shè)：免疫系統(tǒng)也存在類似的縮放定律——當(dāng)用于訓(xùn)練的“細胞 Token”多樣性足夠高、質(zhì)量足夠好時，模型的預(yù)測能力會實現(xiàn)質(zhì)的飛躍。

當(dāng)然，生物學(xué)數(shù)據(jù)和文本數(shù)據(jù)有本質(zhì)區(qū)別：它更嘈雜、隨機性更強，而且不同醫(yī)院的檢測標(biāo)準(zhǔn)不統(tǒng)一，容易引入“批次效應(yīng)”。所以 OpenIO 特別強調(diào)數(shù)據(jù)質(zhì)量、多樣性和多模態(tài)對齊——

規(guī)模縮放：從百萬級細胞擴展到十億甚至萬億級細胞，覆蓋不同組織、疾病狀態(tài)和干預(yù)手段，模型有望學(xué)會細胞身份識別、調(diào)控回路解析，甚至擾動響應(yīng)預(yù)測。
多樣性縮放：免疫受體庫（TCR/BCR）的理論可能性高達 101? 種，極度稀疏。但團隊認為，隨著覆蓋的序列空間增加，模型會從“死記硬背”轉(zhuǎn)向“抽象推理”，真正掌握抗原結(jié)合的物理規(guī)則。
模態(tài)縮放：把 DNA/RNA 序列、蛋白質(zhì)三維結(jié)構(gòu)、臨床縱向數(shù)據(jù)對齊融合，打破單組學(xué)模型的瓶頸。比如，僅憑批量基因表達數(shù)據(jù)，就能預(yù)測腫瘤的空間組織結(jié)構(gòu)，判斷它是“冷腫瘤”（免疫排斥）還是“熱腫瘤”（免疫浸潤）。

三大基礎(chǔ)模型：構(gòu)建免疫系統(tǒng)的“數(shù)字底座”

基于上述思路，OpenIO計劃打造三類核心基礎(chǔ)模型，構(gòu)成免疫智能的基石——

1、免疫語言模型

類似 IgLM 這樣的模型，將在數(shù)億條免疫受體序列上訓(xùn)練，學(xué)習(xí) V(D)J 重排和體細胞高頻突變的統(tǒng)計規(guī)律。未來不僅能“讀取”免疫組庫，還能“書寫”——從頭設(shè)計自然界不存在的抗體序列。

2、抗原呈遞模型

靶點找不準(zhǔn)，武器再好也沒用。這類模型將整合基因組、蛋白組、結(jié)構(gòu)信息，從體細胞突變到 MHC 結(jié)合再到 T 細胞識別，全鏈條預(yù)測抗原呈遞概率和免疫原性。相比現(xiàn)有工具只模擬單一環(huán)節(jié)，它能給出更全面的評估。

3、微環(huán)境世界模型

腫瘤微環(huán)境是免疫細胞作戰(zhàn)的“戰(zhàn)場”。OpenIO 提出用多智能體強化學(xué)習(xí)構(gòu)建“微環(huán)境世界模型”：每個細胞都是一個智能體，其決策由自身基因調(diào)控網(wǎng)絡(luò)驅(qū)動。模型不需要完美復(fù)刻生物學(xué)細節(jié)，而是學(xué)習(xí)空間動力學(xué)的統(tǒng)計生成規(guī)則，支持在計算機中模擬各種干預(yù)手段的效果。

OpenIO 框架、架構(gòu)及生態(tài)系統(tǒng)的概述

生成式免疫治療：從“大海撈針”到“按需設(shè)計”

傳統(tǒng)藥物研發(fā)大多是“篩選”：從海量天然分子里碰運氣找苗頭化合物。OpenIO 的目標(biāo)是“生成”：用 AI 直接設(shè)計所需的治療分子。

為了衡量進展，OpenIO 團隊提出了一個新指標(biāo)：生成產(chǎn)率（Generative Yield）——臨床候選分子中，通過計算設(shè)計而非生物篩選的比例。目前這個數(shù)值不到 1%，而 OpenIO 希望把它變成行業(yè)新標(biāo)桿。

具體能設(shè)計什么？

抗體：覆蓋單鏈抗體、納米抗體、復(fù)雜融合蛋白等多種格式，同時優(yōu)化結(jié)合力、溶解度、穩(wěn)定性和低免疫原性。

CAR-T：針對實體瘤“脫靶毒性”難題，設(shè)計能執(zhí)行布爾邏輯的 CAR 回路——比如“抗原 A 存在且抗原 B 存在”時才激活，大幅降低誤傷正常組織的風(fēng)險。

合成細胞因子：IL-2、IL-12 這些細胞因子的抗腫瘤效果強，但毒性太大。AI 可以設(shè)計出“偏好性結(jié)合”的超級細胞因子，只激活腫瘤部位的免疫反應(yīng)，避開全身毒性；或者設(shè)計成僅在腫瘤微環(huán)境的酸性 pH 下才激活的“智能因子”。

可編程遞送載體：用生成式方法設(shè)計自組裝蛋白納米顆粒、病毒載體，精準(zhǔn)靶向淋巴器官或腫瘤核心，繞過肝臟代謝，減少系統(tǒng)性副作用。

更重要的是，OpenIO 強調(diào)“閉環(huán)驗證”：AI 設(shè)計完分子，自動指令機器人濕實驗室合成、測試，再把結(jié)果反饋回模型迭代優(yōu)化。該團隊已經(jīng)開發(fā)了“元生”（OriGene）多智能體系統(tǒng)，能夠自主發(fā)現(xiàn)肝癌、結(jié)直腸癌的治療靶點，證明了這條路徑的可行性。

“第二我”：你的數(shù)字免疫孿生

如果醫(yī)生手里有一個你的“數(shù)字分身”，能在計算機里預(yù)演各種治療方案的效果，那該多好？

OpenIO的最終目標(biāo)之一，就是構(gòu)建“第二我”（Second Me）——高保真的數(shù)字免疫孿生體，這不是靜態(tài)快照，而是動態(tài)可運行的仿真環(huán)境。

在患者接受臨床試驗或昂貴治療前，他們的數(shù)字孿生可以經(jīng)歷成千上萬次“虛擬臨床試驗”：微調(diào)免疫參數(shù)，模擬不同治療下的腫瘤縮小情況、T 細胞耗竭風(fēng)險、細胞因子風(fēng)暴概率。這不僅能幫醫(yī)生選方案，還能在新試驗啟動前，就篩選出最可能獲益的患者群體，優(yōu)化試驗設(shè)計。

開源開放：不做技術(shù)孤島

為了避免“重復(fù)造輪子”，也為了加速全球協(xié)作，OpenIO承諾全面開源——

公開非專利的抗體序列，作為通用實驗對照；
發(fā)布針對 EGFR、HER2 等高價值腫瘤抗原的結(jié)合分子庫，支持抗體偶聯(lián)藥物、雙特異性抗體等新藥研發(fā)；
共享診斷抗體序列和標(biāo)準(zhǔn)化實驗流程，讓全球不同隊列的數(shù)據(jù)可比、結(jié)果可重復(fù)。

該項目已經(jīng)規(guī)劃了清晰的三年路線圖：

2026 年（第一階段）：建立 ImmunoBank 標(biāo)準(zhǔn)流程，上線首批聯(lián)邦學(xué)習(xí)節(jié)點，開源免疫基礎(chǔ)模型和免疫動力學(xué)世界模型，建立公開評測基準(zhǔn)。

2027 年（第二階段）：發(fā)布 AI 設(shè)計的生物制劑，并在一種癌癥（例如肝細胞癌）中開展首次完全由 AI 設(shè)計的生物制劑人體試驗（需通過臨床前驗證和監(jiān)管審批）。

2028年（第三階段）：實現(xiàn)“自進化實驗室”——AI 智能體自主提出假說、設(shè)計 CAR-T/TCR-T 結(jié)構(gòu)、指揮機器人完成實驗；在部分臨床試驗中，為患者同步提供數(shù)字孿生模擬報告，輔助治療決策；推動新型候選免疫療法的計算設(shè)計/優(yōu)化成為行業(yè)常態(tài)。

從“讀”免疫到“寫”免疫

OpenIO的愿景，是把癌癥免疫治療從一門“經(jīng)驗性學(xué)科”，轉(zhuǎn)變?yōu)椤?strong>理性工程學(xué)”。但這條路并不輕松：需要解決 AI 幻覺問題（區(qū)分真實發(fā)現(xiàn)和計算虛構(gòu)）、統(tǒng)一多中心數(shù)據(jù)的異質(zhì)性、克服人群代表性偏差（例如特定族裔、性別免疫差異），更要跨越藥物研發(fā)、監(jiān)管審批和臨床驗證的重重關(guān)卡。

文中提出的這些時間表是“愿景目標(biāo)”而非確定性預(yù)言。但方向已經(jīng)明確：當(dāng) AI 學(xué)會了免疫系統(tǒng)的運行邏輯，當(dāng)數(shù)字孿生能預(yù)演治療結(jié)局，當(dāng)開源社區(qū)共同迭代算法和試劑，我們離“精準(zhǔn)設(shè)計每一次免疫攻擊”的時代，就更近了一步。

從閱讀免疫組庫的復(fù)雜密碼，到書寫下一代精準(zhǔn)生物制劑的代碼——這就是 OpenIO 想做的事。而這一切的起點，是一個開放框架，和全球科學(xué)家的共同參與。

https://www.cell.com/cancer-cell/abstract/S1535-6108(26)00289-8

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.