撰文丨王聰
編輯丨王多魚
排版丨水成文
![]()
早在 1957 年,英國發育生物學家康拉德·沃丁頓(Conrad Waddington)就曾提出,胚胎的發育過程,就像是無數顆小球從溝壑縱橫的山坡上滾滾動,隨著發育的進行,這些小球會經過不同的分叉,最終落入各自的谷底,成為神經元、肌肉細胞或免疫細胞等。這就是后來著名的“發育景觀”概念,奠定了我們理解細胞命運的基本框架。
一直以來,科學家們都希望能夠像天氣預報一樣預測細胞命運。細胞命運的轉變由調控回路所驅動,然而,RNA 速率(RNA Velocity)模型,在描述細胞動態時未明確考慮基因調控相互作用,這限制了對機制的理解;而基因調控網絡(GRN)推斷,則在很大程度上忽略了生物系統的動態特性。這導致了基因調控與細胞動態之間的脫節。
2026 年 5 月 11 日,亥姆霍茲慕尼黑中心計算健康研究中心計算生物學研究所Fabian J. Theis團隊與牛津大學Tatjana Sauka-Spengler團隊合作(汪偉旭博士及武漢大學胡致遠教授為論文共同第一作者),在國際頂尖學術期刊Cell上發表了題為:RegVelo: Gene-regulatory-informed dynamics of single cells 的研究論文。
該研究推出了一個端到端生成式框架——RegVelo(Regulatory Velocity),其作為一個可操作的“虛擬細胞”,能夠同時推斷基因調控網絡與細胞發育動態。研究團隊將 RegVelo 應用于斑馬魚神經嵴發育研究,并利用全長 Smart-seq3 以及共享的基因表達和染色質可及性測量數據,描繪了命運決定背后的調控程序。通過計算機模擬擾動,并通過 CRISPR-Cas9 基因敲除和單細胞 Perturb-seq 驗證,確定了 tfec 是色素細胞形成的早期驅動因子,而 elf1 是色素細胞命運的調控因子。
這些結果表明,RegVelo構建了一個連接基因調控與細胞命運決定的定量框架,對于發育障礙、腫瘤生長及再生醫學等具有重要意義。
![]()
傳統方法的局限:只見樹木不見森林
要理解這項研究的價值,我們先來看看當前單細胞生物學研究中面臨的挑戰。科學家們已經能夠通過單細胞 RNA 測序技術觀察每個細胞的基因表達狀態,就像給每個細胞拍了一張“基因快照”。基于這些快照,他們開發了兩種主要方法來推測細胞的發育軌跡:
RNA 速率(RNA Velocity)模型:通過比較未剪接和已剪接的 mRNA 比例,預測細胞即將發生的變化。但這種方法需要假設基因之間相互獨立(忽略了基因之間的調控關系)且轉錄速率恒定。
基因調控網絡(GRN)推斷:分析基因之間的調控關系,但通常不考慮細胞狀態的動態變化。
這就好比前者只觀察車輛行駛的速度和方向,卻不關心交通規則;后者只注重交通規則,卻不看車輛實際如何行駛。兩者都只能看到問題的一部分。
RegVelo 的突破:打造“數字細胞實驗室”
在這項最新研究中,研究團隊開發了RegVelo(RegulatoryVelocity),其巧妙地將 RNA 速率與基因調控網絡這兩種視角融合在一起,創建了一個端到端生成式框架,能夠同時推斷基因調控網絡和細胞發育動態。RegVelo 的技術核心相當精妙,它采用貝葉斯深度生成模型,將未剪接的和已剪接的 RNA 讀數作為輸入,通過神經網絡學習細胞的低維表示。更重要的是,它通過一個基因調控網絡引導的神經網絡,將轉錄建模為一個受調控和時間依賴的過程,通過建模這種調控關系,RegVelo 能夠更真實地反映生物系統的復雜性。
RegVelo 就像在計算機中構建了一個“虛擬細胞”,這個虛擬細胞不僅包含基因表達數據,還內置了基因之間的調控規則。讓研究人員能夠在這個虛擬環境中進行各種“實驗操作”——
模擬基因敲除:關閉某個基因,觀察細胞命運如何改變;
預測發育軌跡:基于當前狀態,預測細胞未來的分化方向;
識別關鍵調控因子:找出決定細胞命運的關鍵基因。
實際應用:從理論到驗證
研究團隊在多個生物系統中驗證了 RegVelo 的有效性。在細胞周期數據集中,RegVelo 不僅準確推斷出了細胞周期進展方向,還識別出了關鍵的調控因子,例如 TGIF1 和 ETV1,以及它們調控的細胞周期相關基因。
最令人印象深刻的是在斑馬魚神經嵴發育研究中的應用,神經嵴細胞是脊椎動物胚胎中的多能干細胞,能夠分化為多種細胞類型,包括色素細胞、神經元等。通過 RegVelo 分析,研究團隊預測了細胞命運啟動:識別出了哪些細胞正在向特定命運“傾斜”;發現了關鍵驅動基因:確定了 tfec 是色素細胞形成的早期轉錄驅動因子;識別了新的調控因子:發現 elf1 是色素細胞命運的調控因子。
這些預測隨后通過 CRISPR-Cas9 基因敲除和單細胞 Perturb-seq 實驗得到了驗證,顯示出與實驗觀察的高度一致性。
![]()
虛擬細胞的未來:從觀察到預測
RegVelo 的推出,標志著單細胞生物學從描述性科學向預測性科學的轉變。傳統上,科學家們只能觀察細胞發生了什么;現在,他們可以在計算機中模擬“如果...會怎樣”的場景。
這種計算機上的“虛擬細胞”方法具有多重意義——
加速發現:在濕實驗之前進行計算機模擬,可以優先考慮最有希望的實驗方向;
降低成本:減少不必要的動物實驗和試劑消耗;
深入理解:提供機制性見解,而不僅僅是相關性觀察;
個性化醫療:未來可能用于預測患者細胞對治療的反應。
RegVelo不僅僅是一個新的計算工具,它代表了一種研究范式的轉變——將細胞視為一個可編程、可模擬的數字實體,在計算機上測試各種調控假設,再進行濕實驗驗證,從而大大加速生物學發現速度。該技術的潛力遠不止于發育生物學;在癌癥研究中,它可以幫助理解腫瘤細胞的異質性和演化路徑;在再生醫學中,它可以指導細胞重編程;在藥物篩選中,它可以預測化合物對細胞狀態的影響...
最后,研究團隊表示,虛擬細胞領域目前存在兩條主流路徑:一條是以 scGPT、Geneformer 為代表的單細胞基礎模型(foundation model),通過在海量轉錄組數據上預訓練 Transformer,學習基因表達的統計規律,在擾動響應預測等任務上展現出一定的泛化能力;另一條則是以 RegVelo 為代表的動力學建模路線,將生物物理機制顯式編碼進模型結構,賦予預測以可解釋的因果含義。
未來真正意義上的“虛擬細胞”,需要將 AI 的模式識別能力與機制模型的因果嚴謹性相結合——前者擅長從數據分布中提取規律,后者擅長在反事實干預下給出可信預測。然而,無論模型架構如何精巧,AI for Science 的研究價值最終必須落腳于實驗上可穩健證偽的預測: 計算不能只停留預測和簡單的下游任務的方法比較,而應當經過嚴格的體內實驗檢驗,在可證偽的框架下積累對生物學因果機制的理解。
論文鏈接:
https://www.cell.com/cell/fulltext/S0092-8674(26)00457-5
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.