![]()
撰文丨王聰
編輯丨王多魚
排版丨水成文
免疫檢查點抑制劑、CAR-T 細胞療法等癌癥免疫治療,已實現(xiàn)傳統(tǒng)化療或靶向藥物難以達到的持久緩解,重塑了多種血液系統(tǒng)惡性腫瘤及部分實體瘤的治療格局。然而,一個尷尬的事實是——同樣的免疫治療,對一個患者有效,對另一個患者可能完全沒用,還可能帶來嚴重的副作用。
這一挑戰(zhàn)源于免疫系統(tǒng)本身作為復(fù)雜自適應(yīng)系統(tǒng)的特性,其由多種細胞群體與物理微環(huán)境之間高維且隨機的相互作用所調(diào)控。因此,依賴線性相關(guān)性的傳統(tǒng)生物標(biāo)志物往往無法捕捉免疫反應(yīng)的非線性依賴背景。這導(dǎo)致我們雖然已積累了海量的測序數(shù)據(jù),卻常常讀不懂這背后的機制。
要克服這些局限性,必須從描述性和回顧性分析轉(zhuǎn)向預(yù)測性和機制性建模。盡管免疫學(xué)依賴于假設(shè)驅(qū)動的低通量實驗,而人工智能(AI)卻有望解析高維模式和潛在邏輯。諸如 scGPT 和 Evo 等模型已證明,通過從現(xiàn)有數(shù)據(jù)中學(xué)習(xí),能夠?qū)崿F(xiàn)對未知生物領(lǐng)域的外,構(gòu)建預(yù)測性虛擬細胞(Virtual Cell)也已成為下一代計算生物學(xué)的關(guān)鍵前沿。
近日,復(fù)旦大學(xué)附屬中山醫(yī)院高強教授、上海交通大學(xué)溥淵未來技術(shù)學(xué)院/臨港實驗室鄭雙佳研究員、復(fù)旦大學(xué)附屬中山醫(yī)院/斯坦福大學(xué)吳英成博士、西湖大學(xué)郭天南教授、復(fù)旦大學(xué)/上海人工智能實驗室孫思琦研究員、普林斯頓大學(xué)張載熙博士、浙江大學(xué)/良渚實驗室郭國驥教授、同濟大學(xué)劉琦教授、華東師范大學(xué)葉海峰教授、上海人工智能實驗室白磊研究員、字節(jié)跳動 Seed鄭在翔博士等,在Cancer Cell發(fā)表了題為:OpenIO: An open framework for AI-native immunotherapy 的文章,提出了開源腫瘤免疫(Open Immune Oncology,OpenIO),這是一個融合生成式人工智能與組學(xué)技術(shù)以推動精準(zhǔn)腫瘤學(xué)發(fā)展的框架。通過利用生物學(xué)的縮放定律和基礎(chǔ)模型,目標(biāo)是將免疫治療從經(jīng)驗性篩選轉(zhuǎn)變?yōu)榛?AI 的理性化治療干預(yù)設(shè)計。簡單來說,就是讓 AI 不僅能夠“讀懂”免疫系統(tǒng),還能“設(shè)計”出更精準(zhǔn)的癌癥免疫治療方案。
![]()
給生物學(xué)“分詞”:AI 理解免疫的第一步
要讓 AI 處理生物學(xué)數(shù)據(jù),首先得解決“語言不通”的問題。
OpenIO提出了“生物學(xué)分詞”(Tokenization of Biology)的概念:把單個細胞的轉(zhuǎn)錄組狀態(tài)看作一個“詞元”(Token),把組織微環(huán)境看作一段“上下文窗口”,基因就像字母,基因程序像短語,而細胞就像句子。
和傳統(tǒng)自然語言處理不同,這里的“詞”既有離散信息(比如細胞類型),也有連續(xù)信息(比如基因表達量、空間坐標(biāo))。通過這種混合分詞方式,就能用 Transformer 架構(gòu)訓(xùn)練通用免疫學(xué)習(xí)器——它可以補全被掩蓋的基因序列,從 RNA 預(yù)測蛋白豐度,甚至推斷出缺失的空間坐標(biāo)。本質(zhì)上,這是給 AI 一本“免疫詞典”,讓它學(xué)會免疫系統(tǒng)的“語法”。
免疫學(xué)也有“Scaling Law”?數(shù)據(jù)越多,智能越強
大模型領(lǐng)域有個著名現(xiàn)象——模型性能隨參數(shù)規(guī)模和訓(xùn)練數(shù)據(jù)量的增加而提升,即“縮放定律”(Scaling Law)。OpenIO團隊大膽假設(shè):免疫系統(tǒng)也存在類似的縮放定律——當(dāng)用于訓(xùn)練的“細胞 Token”多樣性足夠高、質(zhì)量足夠好時,模型的預(yù)測能力會實現(xiàn)質(zhì)的飛躍。
當(dāng)然,生物學(xué)數(shù)據(jù)和文本數(shù)據(jù)有本質(zhì)區(qū)別:它更嘈雜、隨機性更強,而且不同醫(yī)院的檢測標(biāo)準(zhǔn)不統(tǒng)一,容易引入“批次效應(yīng)”。所以 OpenIO 特別強調(diào)數(shù)據(jù)質(zhì)量、多樣性和多模態(tài)對齊——
規(guī)模縮放:從百萬級細胞擴展到十億甚至萬億級細胞,覆蓋不同組織、疾病狀態(tài)和干預(yù)手段,模型有望學(xué)會細胞身份識別、調(diào)控回路解析,甚至擾動響應(yīng)預(yù)測。
多樣性縮放:免疫受體庫(TCR/BCR)的理論可能性高達 101? 種,極度稀疏。但團隊認為,隨著覆蓋的序列空間增加,模型會從“死記硬背”轉(zhuǎn)向“抽象推理”,真正掌握抗原結(jié)合的物理規(guī)則。
模態(tài)縮放:把 DNA/RNA 序列、蛋白質(zhì)三維結(jié)構(gòu)、臨床縱向數(shù)據(jù)對齊融合,打破單組學(xué)模型的瓶頸。比如,僅憑批量基因表達數(shù)據(jù),就能預(yù)測腫瘤的空間組織結(jié)構(gòu),判斷它是“冷腫瘤”(免疫排斥)還是“熱腫瘤”(免疫浸潤)。
三大基礎(chǔ)模型:構(gòu)建免疫系統(tǒng)的“數(shù)字底座”
基于上述思路,OpenIO計劃打造三類核心基礎(chǔ)模型,構(gòu)成免疫智能的基石——
1、免疫語言模型
類似 IgLM 這樣的模型,將在數(shù)億條免疫受體序列上訓(xùn)練,學(xué)習(xí) V(D)J 重排和體細胞高頻突變的統(tǒng)計規(guī)律。未來不僅能“讀取”免疫組庫,還能“書寫”——從頭設(shè)計自然界不存在的抗體序列。
2、抗原呈遞模型
靶點找不準(zhǔn),武器再好也沒用。這類模型將整合基因組、蛋白組、結(jié)構(gòu)信息,從體細胞突變到 MHC 結(jié)合再到 T 細胞識別,全鏈條預(yù)測抗原呈遞概率和免疫原性。相比現(xiàn)有工具只模擬單一環(huán)節(jié),它能給出更全面的評估。
3、微環(huán)境世界模型
腫瘤微環(huán)境是免疫細胞作戰(zhàn)的“戰(zhàn)場”。OpenIO 提出用多智能體強化學(xué)習(xí)構(gòu)建“微環(huán)境世界模型”:每個細胞都是一個智能體,其決策由自身基因調(diào)控網(wǎng)絡(luò)驅(qū)動。模型不需要完美復(fù)刻生物學(xué)細節(jié),而是學(xué)習(xí)空間動力學(xué)的統(tǒng)計生成規(guī)則,支持在計算機中模擬各種干預(yù)手段的效果。
![]()
OpenIO 框架、架構(gòu)及生態(tài)系統(tǒng)的概述
生成式免疫治療:從“大海撈針”到“按需設(shè)計”
傳統(tǒng)藥物研發(fā)大多是“篩選”:從海量天然分子里碰運氣找苗頭化合物。OpenIO 的目標(biāo)是“生成”:用 AI 直接設(shè)計所需的治療分子。
為了衡量進展,OpenIO 團隊提出了一個新指標(biāo):生成產(chǎn)率(Generative Yield)——臨床候選分子中,通過計算設(shè)計而非生物篩選的比例。目前這個數(shù)值不到 1%,而 OpenIO 希望把它變成行業(yè)新標(biāo)桿。
具體能設(shè)計什么?
抗體:覆蓋單鏈抗體、納米抗體、復(fù)雜融合蛋白等多種格式,同時優(yōu)化結(jié)合力、溶解度、穩(wěn)定性和低免疫原性。
CAR-T:針對實體瘤“脫靶毒性”難題,設(shè)計能執(zhí)行布爾邏輯的 CAR 回路——比如“抗原 A 存在且抗原 B 存在”時才激活,大幅降低誤傷正常組織的風(fēng)險。
合成細胞因子:IL-2、IL-12 這些細胞因子的抗腫瘤效果強,但毒性太大。AI 可以設(shè)計出“偏好性結(jié)合”的超級細胞因子,只激活腫瘤部位的免疫反應(yīng),避開全身毒性;或者設(shè)計成僅在腫瘤微環(huán)境的酸性 pH 下才激活的“智能因子”。
可編程遞送載體:用生成式方法設(shè)計自組裝蛋白納米顆粒、病毒載體,精準(zhǔn)靶向淋巴器官或腫瘤核心,繞過肝臟代謝,減少系統(tǒng)性副作用。
更重要的是,OpenIO 強調(diào)“閉環(huán)驗證”:AI 設(shè)計完分子,自動指令機器人濕實驗室合成、測試,再把結(jié)果反饋回模型迭代優(yōu)化。該團隊已經(jīng)開發(fā)了“元生”(OriGene)多智能體系統(tǒng),能夠自主發(fā)現(xiàn)肝癌、結(jié)直腸癌的治療靶點,證明了這條路徑的可行性。
“第二我”:你的數(shù)字免疫孿生
如果醫(yī)生手里有一個你的“數(shù)字分身”,能在計算機里預(yù)演各種治療方案的效果,那該多好?
OpenIO的最終目標(biāo)之一,就是構(gòu)建“第二我”(Second Me)——高保真的數(shù)字免疫孿生體,這不是靜態(tài)快照,而是動態(tài)可運行的仿真環(huán)境。
在患者接受臨床試驗或昂貴治療前,他們的數(shù)字孿生可以經(jīng)歷成千上萬次“虛擬臨床試驗”:微調(diào)免疫參數(shù),模擬不同治療下的腫瘤縮小情況、T 細胞耗竭風(fēng)險、細胞因子風(fēng)暴概率。這不僅能幫醫(yī)生選方案,還能在新試驗啟動前,就篩選出最可能獲益的患者群體,優(yōu)化試驗設(shè)計。
開源開放:不做技術(shù)孤島
為了避免“重復(fù)造輪子”,也為了加速全球協(xié)作,OpenIO承諾全面開源——
公開非專利的抗體序列,作為通用實驗對照;
發(fā)布針對 EGFR、HER2 等高價值腫瘤抗原的結(jié)合分子庫,支持抗體偶聯(lián)藥物、雙特異性抗體等新藥研發(fā);
共享診斷抗體序列和標(biāo)準(zhǔn)化實驗流程,讓全球不同隊列的數(shù)據(jù)可比、結(jié)果可重復(fù)。
該項目已經(jīng)規(guī)劃了清晰的三年路線圖:
2026 年(第一階段):建立 ImmunoBank 標(biāo)準(zhǔn)流程,上線首批聯(lián)邦學(xué)習(xí)節(jié)點,開源免疫基礎(chǔ)模型和免疫動力學(xué)世界模型,建立公開評測基準(zhǔn)。
2027 年(第二階段):發(fā)布 AI 設(shè)計的生物制劑,并在一種癌癥(例如肝細胞癌)中開展首次完全由 AI 設(shè)計的生物制劑人體試驗(需通過臨床前驗證和監(jiān)管審批)。
2028年(第三階段):實現(xiàn)“自進化實驗室”——AI 智能體自主提出假說、設(shè)計 CAR-T/TCR-T 結(jié)構(gòu)、指揮機器人完成實驗;在部分臨床試驗中,為患者同步提供數(shù)字孿生模擬報告,輔助治療決策;推動新型候選免疫療法的計算設(shè)計/優(yōu)化成為行業(yè)常態(tài)。
從“讀”免疫到“寫”免疫
OpenIO的愿景,是把癌癥免疫治療從一門“經(jīng)驗性學(xué)科”,轉(zhuǎn)變?yōu)椤?strong>理性工程學(xué)”。但這條路并不輕松:需要解決 AI 幻覺問題(區(qū)分真實發(fā)現(xiàn)和計算虛構(gòu))、統(tǒng)一多中心數(shù)據(jù)的異質(zhì)性、克服人群代表性偏差(例如特定族裔、性別免疫差異),更要跨越藥物研發(fā)、監(jiān)管審批和臨床驗證的重重關(guān)卡。
文中提出的這些時間表是“愿景目標(biāo)”而非確定性預(yù)言。但方向已經(jīng)明確:當(dāng) AI 學(xué)會了免疫系統(tǒng)的運行邏輯,當(dāng)數(shù)字孿生能預(yù)演治療結(jié)局,當(dāng)開源社區(qū)共同迭代算法和試劑,我們離“精準(zhǔn)設(shè)計每一次免疫攻擊”的時代,就更近了一步。
從閱讀免疫組庫的復(fù)雜密碼,到書寫下一代精準(zhǔn)生物制劑的代碼——這就是 OpenIO 想做的事。而這一切的起點,是一個開放框架,和全球科學(xué)家的共同參與。
https://www.cell.com/cancer-cell/abstract/S1535-6108(26)00289-8
![]()
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.