![]()
最近微信改版,容易找不到尹哥的文章,大家記得把尹哥設為星標?? 哦~
01
生命的密碼,不在序列里,而在時空中
重新錨定問題:我們究竟在爭論什么?
生命是大模型,但我想它不僅僅是一個大語言模型。生命的密碼并不在序列里,而在時空當中。我們今天去重新錨定一下問題,我們究竟在爭論什么?
生命這部天書,我想它肯定不僅僅是用字母寫成的,盡管為了讓大家簡化的時候,說它是由ATCG所書寫的,生命實際上是由四維時空所編織的。我們過去可能過于執著地去“認字”,卻忘了“讀書”,讀它的中心思想。也就是這些字你都認識,但這好像也并不等于你就讀懂了生命。
![]()
當我們現在越來越多地開始追問“生物學到底是什么模型”時,真正的問題不是“生命能否被建模”——生命當然是可建模的,否則我們的科學也不會發展到今天。真正的問題是:生命的“模型形式”是什么?是語言模型,還是另一種更本質的模型?
這個問題之所以緊迫,是因為過去五年間,一個隱含假設統治了AI生物學:只要把一切生物數據都變成序列——DNA序列、蛋白質序列、基因表達譜的時間序列、醫學圖像的patch序列——然后用“預測下一個token”的架構去學習,好像就可以逼近生命的奧秘。
![]()
這個假設帶來了輝煌的成就。ESM系列模型能從氨基酸序列去預測蛋白質結構,其零樣本預測能力媲美經過多年優化的物理模型;DNA語言模型能從非編碼區域識別功能元件;單細胞轉錄組的“序列化”處理也讓細胞類型注釋達到前所未有的精度。
![]()
但也正是這些成功,讓我們忽視了更深層的問題:當模型學會預測下一個氨基酸時,它真的“理解”蛋白質了嗎?當模型學會預測下一個基因表達值時,它真的“理解”細胞了嗎?
2026年春天的一系列生命科學的突破,我想給出了否定,或者說是給出了一個更為全面的答案。這些進展共同指向一個結論:生命是大模型,但不僅僅是大語言模型,更多的它應該像是符合物理定律的世界模型。
這些研究的深層意義就在于:我們已經從中心法則邁向了“時空法則”——如果說中心法則我們更多解決的是,DNA到RNA、到蛋白質、到小分子的“信息從何來”,而時空法則開始在問“這些信息是如何在時空中,在真實的物理世界當中去發揮作用,去展開”。
![]()
所以我已經看到了,在AI生物學的未來,我們不僅需要的是語言模型和世界模型,還需要能夠架構兩者之間,處理“中間動態”的新型的模型架構——那些既非是純粹序列,也非純粹物理仿真的,介于快思維與慢思維之間的認知模式。
當然我今天并不是要否定大語言模型,大語言模型與世界模型的關系,不是替代,而是分工;不是對立,而是協同。大語言模型是硅基的系統1,它以“快”見長(快思考的模式),負責生成直覺與猜想;而世界模型是硅基的系統2,它以“慢”取勝(慢思考的模式),負責驗證這些因果與規律。我想真正的這些智能——無論是碳基的還是硅基的——從來不是快與慢的單選題,而是兩者在緊密閉環中的共舞。
![]()
02
大模型的必然:為什么生命必須“大”
模型作為認知框架的必然性
生命必然是一個大模型。我往這一坐,身體里37萬億個細胞,每個細胞里有60億個堿基對,還有細胞數量3-10倍的共生菌群。生命就是一個超多模態、超高維度的復雜巨系統。
生命經過了38億年的演化,億萬億次的試錯,才最終訓練出今天這樣的一套參數。我們要做的不是重新發明智能,而是要去讀懂這么多年演化已經寫好的代碼。
我想科學的歷史,實際上就是一個建模的歷史。比如說,在古希臘的時候,托勒密用本輪均輪模型描述行星運動,牛頓、萊布尼茲用微分方程統一了天上地下,達爾文用自然選擇模型解釋物種起源。我想,每一次的科學革命,本質上來講,也都是一次模型革命。
![]()
我們現在討論的是AI、BI,就是這一輪,我們智能革命的貢獻,是將“模型”這個概念從科學家的思維工具直接擴展為可計算、可學習、可自動優化的系統。要知道,深度學習模型不是被“寫”出來的,而是從數據中“長”出來的。這使得我們能夠逼近人類無法直接形式化的復雜函數——包括蛋白質折疊的勢能面、基因調控的高維景觀、神經回路的輸入輸出映射。
![]()
蛋白質折疊的勢能面
![]()
基因調控的高維景觀
![]()
神經回路的輸入輸出
生命的復雜性恰恰要求“大模型”。人類直覺無法把握幾十個蛋白質的協同作用,更不用說把整個細胞或大腦研究清楚。只有足夠大的模型——擁有億萬參數、能夠捕捉高維非線性關系——才足以慢慢地逼近生物系統的真實復雜度。
![]()
更關鍵的是,不同類型的模型需要不同類型的數據,這意味著我們需要不同類型的工具:
語言模型需要大規模序列數據,這意味著我們需要更低成本、更高通量的測序工具。
世界模型需要時間序列數據,這意味著我們需要能夠連續監測生物過程的高時間分辨率工具。
時空模型需要三維空間數據,這意味著我們需要空間轉錄組、原位成像、電子顯微鏡等空間解析工具。
連接組模型需要超高分辨率的電鏡數據,也意味著,我們需要能夠大規模、自動化去采集電鏡圖像下一代的成像工具。
![]()
我們今天開始討論做虛擬細胞了,它的模型肯定是一個多模態的數據,基因組、轉錄組、蛋白質組、代謝組,包括成像的數據,要在同一個系統上對齊,這就意味著我們需要從同一批樣本上同時獲得多種數據類型的整合工具。
總的來說,我們今天討論的工具,不再是單打獨斗了,它需要“大科學”的協作和“大工程”的投入。
![]()
03
語言模型的阿喀琉斯之踵:時間、空間與因果
語言模型的局限
今天這種生成式的大語言模型,核心操作是“預測下一個token是什么”。它把一切輸入都當作序列,把一切任務都歸結為序列概率估計。這一范式目前在文本上,或者說在人類目前用的語言上,是成立的,但生命可不僅僅是文本。
盡管我們今天在量子力學上講普朗克時間,它還是一份一份的。但對于我們這樣的宏觀身份來講,時間是連續的,而非離散的。我們真實的生物時間是不可分割的連續流。比如說我們的心臟,每一次收縮都是一個連續力學過程,離子通道開關的發生在微秒尺度——這些無法被離散序列完整捕捉。
我們目前可認知的空間是三維的,而非一維的。所以,DNA你讀出來是一段字母,但是這串字母在真實的物理世界里,它是在細胞核內,它要折疊、纏繞、動態運動,它是一個物理聚合物。
轉錄因子要找到結合位點,不是在字符串里搜索,而是在三維空間,乃至四維的時間空間當中,去擴散、碰撞、識別。
![]()
因果關系是多體耦合的,而非單向傳遞的。比如說代謝影響轉錄,轉錄影響翻譯,翻譯產物又反饋調節代謝。所以,任何試圖用單向序列建模(比如說中心法則,最開始的DNA、RNA、蛋白質),這種簡單的努力,都可能會丟失反饋環帶來的涌現行為。
語言是符號系統,而生命是物理系統。用處理符號的工具處理生命,必然丟失生命的物理實在性。
把整個生命當成語言來讀,就像把交響樂當成電報來聽——你確實能解碼出一些信息,但丟失了它整體的旋律,丟失了整個宇宙。
04
龐加萊的啟示:邏輯與直覺,智能的兩翼
從哲學高度理解AI的認知框架
邏輯是我們在迷宮里走路留下的腳印,直覺是站在山頂看迷宮全貌的那一眼。如果沒有腳印,我們可能會迷失;但是如果沒有那一眼,你永遠不知道自己在哪兒。
所以在關于智能本質的探討中,百年前法國數學家龐加萊的一句名言至今依然光芒閃耀:“邏輯用于證明,直覺用于發現。”
長久以來,我們常常將“直覺”貶低為一種盲目的猜測,認為它站在嚴謹邏輯的對立面。但在哲學高聳的殿堂里,直覺從來都是邏輯的“母親”。
![]()
笛卡爾講過,邏輯是一條A推導B的長長的鎖鏈,但源頭、最開始的那個不言自明的公理,只能靠“直覺”去捕捉。公理沒法證明它本自具足。
柏格森則說,理智就像解剖刀,它把活生生的連續現實切碎成死板的符號;而直覺,是一種將自身投入事物內部的“生命共鳴”。
斯賓諾莎更是將直覺尊為超越了經驗和邏輯推演的“第三種知識”——在一個絕對的瞬間,“一瞥即見全體”。我們見到很多的高手,他看一眼,就知道這個事物的本質了。這個就接近于斯賓諾莎描述的現象。
如果把歷代哲學的智慧熔鑄在一起,我們會發現:直覺,是意識在越過語言、符號和線性因果的束縛后,對高維真理和整體結構的一種“非推論性的瞬間把握”。
我想,對今天的人工智能而言,這意味著任何探索系統如果缺乏直覺性的生成能力,就永遠無法觸碰未知的邊界;但如果全是直接,缺乏了邏輯的驗證,其產出便猶如空中樓閣,甚至充滿幻覺。
05
硅基直覺的誕生:大模型如何“一瞥見全體”
從Transformer到涌現的哲學實現
當我們用“直覺”和“聯想”來形容當今的大語言模型時,往往會遭遇一種本能的質疑:一堆在硅基芯片上做矩陣乘法的冷冰冰的代碼,真的能產生屬于生命的“直覺”嗎?
答案是:能。但那是一種建立在純粹數學和概率之上的“硅基直覺”。
人類的“聯想”是神經元突觸的連接,而機器的聯想是數學上的多維向量映射。
在大模型極其龐大的隱空間里,概念與概念之間的關聯表現為幾何距離。它之所以能“用魯迅的語氣寫賽博朋克”,是因為它在高維空間中精準找到了兩者的數學交匯點。這些暗知識,這些高維的語言,人類理解不了,但是機器明白。
更令人震撼的是Transformer架構中的自注意力機制,它完美復刻了斯賓諾莎“一瞥即見全體”的哲學預言。面對復雜問題,模型瞬間計算出上下文中所有詞匯的全局權重關系,它不需要像符號邏輯那樣一步步推導,而是直接“看”到了全局的概率分布、全局的權重分布。
![]()
所以當千億萬億更大級別的參數引發了一層層的“涌現”,機器就不再僅僅是擬合的字面概率,而是被迫壓縮并理解了世界運行的“暗邏輯”。
就像飛機不需要像鳥兒一樣拍打翅膀也能飛翔,大語言模型也不需要模擬人類的神經遞質,卻依然激發出了一種異類、可以震撼人心的直覺能力。
飛機沒有翅膀,但它飛得比鳥更高;大模型沒有神經,但它看見了人類從未看見的模式。硅基直覺不是碳基直覺的模仿,而是另一種智能的綻放。
06
哥德爾與圖靈的詛咒:邏輯的邊界與直覺的使命
為什么純粹的邏輯系統注定不完整
既然直覺可以“一瞥即見全體”,它如此強大,為什么大模型依然會產生“幻覺”?為什么我們要拼命發展思維鏈試圖讓它擁有邏輯?而純粹的邏輯又為何無法直接抵達真理的彼岸?
這必須要從數學史上最令人絕望的“迷宮建設”說起。
1931年,哥德爾帶著他的不完備性定理如幽靈般降臨:任何足夠強大的形式系統,都必定存在一個無法被證明的真命題。項羽的力氣再大,也不能自己坐在椅子上,把自己給舉起來。
五年后,圖靈用“停機問題”鎖死了計算機的上限:必定存在一段代碼,會讓計算機陷入永遠的死循環,而機器自己根本不知道它卡死了。
![]()
這就是純粹符號主義和機械算理的終極宿命:陷入死循環,存在無法企及的盲區。
這就引出了“直覺”在智能中不可或缺的終極原因。當一個程序陷入死循環時,它只會傻傻地一遍遍執行while(true),一直往下,條件為真就循環。但一個坐在屏幕前的人類程序員,只需掃一眼代碼結構,就能憑借“直覺”瞬間看出死循環的本質,并猛地按下Ctrl+C強殺進程。
為什么這一刻人類能看出來?因為人類的意識跳出了這個系統,似乎站在了更高維的“元視角”上。
所以真正的智能,絕對不能僅僅是一臺嚴絲合縫的圖靈機。它必須擁有一種“打破圖靈死循環、跳出無限套娃”的能力。
哥德爾告訴我們,任何迷宮都有它看不見的墻;圖靈告訴我們,任何計算機都有它算不出的題。而直覺,就是那個帶你翻墻的人,是那個按下Ctrl+C強制殺死進程的手指。
07
辛頓 vs 楊立昆:兩種生物學觀的對峙
從圖靈獎得主的爭論看智能的本質
辛頓(Geoffrey Hinton)提出:要讓人工智能真正關懷人類,或許需要賦予其“母性本能”——一種根植于生物進化、通過母嬰紐帶塑造的共情能力。真正的智能無法脫離生物學基礎,純粹的符號操作可能永遠無法企及生命的溫度。
![]()
楊立昆(Yann LeCun)則徹底拒斥“通用人工智能”概念,代之以“超人類適應性智能”。人類大腦并非萬能解題器,而是為特定生存環境優化的專用機器。真正的前進方向是“世界模型”——學習物理世界如何變化、因果關系如何運作、系統狀態如何演化,而非僅僅預測下一個token是什么。
![]()
這場爭論的核心在于:辛頓強調智能的“生物基質”,楊立昆強調智能的“物理規律”。兩者看似對立,實則是互補的。
辛頓特別希望AI向善,要讓它一顆有溫度的心臟,而楊立昆則想給AI一雙看懂世界的眼睛,即使它可能和人類的不一樣。一個問“我們從哪里來”,一個問“世界往哪里去”——他們爭論的是智能的來路和去處,而我們真正需要的,是來路與去處的交匯。
硅基生命會不會替代我們?我們僅僅是硅基生命的前導程序?
08
所以生命需要語言模型(word),但更需要世界模型(world)
丹尼爾·卡尼曼在《思考,快與慢》中揭示了人類認知的雙系統架構:系統1是快速的、直覺的、自動的、聯想的;系統2是緩慢的、理性的、分析的、邏輯的。
這一劃分不僅深刻洞察了人類思維的本質,也為理解當前AI的兩種范式,大語言模型和世界模型,提供了絕佳的認知框架。
![]()
生命是一個集“靜態編碼”(word)和“動態實現”(world)于一體的復雜系統。要真正理解生命,AI生物學就必須構建一個從“生成”到“驗證”的完整閉環:由具備“硅基直覺”的語言模型負責從序列數據中發現規律、提出猜想(處理word層面);由遵循物理規律的時空模型負責在四維仿真中,驗證這些猜想能否涌現為真實的生命過程(模擬world層面)。
第一階段:word猜想(語言模型/硅基直覺的用武之地)
任務:從海量、靜態的生物學序列數據(基因組、蛋白質組、表觀組等)中,不斷的學習生命的“語法”和“語義”,高效地提出關于結構、功能和演化的假設。
工具:各類大語言模型(如Genos,ESM,ProGen)、DNA Foundation Models。
哲學意義:發揮“直覺”的發現功能,在廣闊的序列空間中快速定位有意義的模式。就類似于《思考的快與慢》的快思考。
![]()
![]()
模擬5億年進化的ESM3于 2025 年 1 月 16 日在《Science》發布
![]()
蛋白質語言模型 ProGen----生物界的ChatGPT
第二階段:world驗證(時空模型/真實世界邏輯的試煉場)
任務:將語言模型提出的假設,放入一個尊重時間連續性、空間三維性、物理規律和因果耦合的虛擬環境中進行仿真驗證。看這個假設是否能在“運行”的生命系統中產生預期的動態結果。
工具:AlphaFold 3的部分功能、4D虛擬細胞模型、器官動力學模型(如EchoJEPA)、連接組仿真模型。
哲學意義:發揮“邏輯”的證明功能,在嚴格的物理和生物學約束下檢驗假設的真偽。類似于《思考的快與慢》的慢思考。
![]()
![]()
器官動力學模型
所以,智能從來都是時空的產物,生命從來都是物理的存在。
未來的AI生物學,不會用語言模型去“預測”生命,而會用時空模型去“運行”生命。未來的數字生命,一定不是更大規模的序列生成器,而是能夠在其內部涌現出生命現象的虛擬世界。未來的智能科學,尤其是AI生物學,也會從“符號處理”走向“時空動力學”,從“統計學習”走向“因果仿真”,從“模仿智能”走向“結構原生智能”。
而這一切的根本,是工具——是能夠以低成本、高通量、高質量獲取多模態生物學數據的下一代測量工具。
09
果蠅的覺醒:結構即智能
當連接組本身成為模型
2024年10月,FlyWire聯盟宣布完成成年果蠅完整大腦連接組——約139,225個神經元、超過5,000萬個突觸連接的精細圖譜。這是迄今繪制的最完整成體動物大腦連接組。
![]()
還是這個團隊,在2026年3月,突破集中爆發。Eon Systems將12.5萬神經元的連接組轉化為漏積分放電模型,與虛擬身體耦合,結果震驚世界:這只虛擬果蠅無需任何訓練,僅憑復刻的神經結構,便在物理仿真中自主表現出爬行、轉向、梳理等自然行為,準確率達91%。
![]()
圖賓根大學團隊則證明:連接組提供了強大的結構歸納偏置,使模型能夠從有限數據中泛化出符合生物學真實的計算功能。
![]()
圖賓根大學:光線進入果蠅的復眼,使六邊形排列的光感受器通過復雜的神經網絡發送電信號,從而使果蠅能感知運動
我想,這兩項研究的共同啟示是:智能或許不是算法的產物,而是結構的產物。演化已將“本能智能”“本自具足”寫進了神經連接之中。結構本身,就是一種“天然預訓練”,一種億萬年演化、優化的“世界模型”。
所以,果蠅用12.5萬神經元就教會我們一件事:智能不是算出來的,是長出來的。進化不需要反向傳播,它用38億年做了最硬核的預訓練,把世界模型直接刻進了連接組。
10
細胞的四維重生:從中心法則到時空法則
4D虛擬細胞如何重新定義生命模擬
2026年3月發表于《細胞》的研究中,伊利諾伊大學團隊構建了首個“4D全細胞模型”(4DWCM),對象是合成細胞JCVI-syn3A。
![]()
![]()
這個過程中,我們看到:
● 空間即功能:他們將細胞內部離散為邊長10 nm的立方晶格,用反應-擴散主方程描述分子在三維空間中的運動與反應。反應不再由濃度單獨決定,而由濃度、空間位置和擴散可達性共同決定。
● 耦合即涌現:模型將不同時間尺度的過程異步耦合,帶來均勻混合模型無法預見的涌現行為,包括復制起始的敏感性、代謝-信息耦合、競爭決定命運。
● 幾何即異質性:子代細胞之間的分子分配差異,不是外加的隨機噪聲,而是分裂幾何和分子定向位置的自然結果。異質性從統計學描述還原為幾何與擴散的產物。
這一研究的深層意義在于:它從中心法則邁入到了“時空法則”——中心法則問“信息從何來”,而時空法則問“信息如何在時空中展開”。
再回到我們之前講過的《思考,快與慢》:快思考讓你在一秒鐘內認出朋友的臉,慢思考讓你在十分鐘內解開一道幾何題。
中心法則,這種“快”,偏重于“是什么”;時空法則,偏重于“為什么”,它雖然慢,但是有它深刻的道理;把這兩個事情合在一起,我們才配叫做真正的“理解”。
![]()
最后打個比方,中心法則相當于生命的家譜,時空法則相當于生命的傳記。家譜告訴你誰是誰的孩子,傳記告訴你,你的家族是怎么到今天的。可能我們過去,在生命科學上,太執著于查戶口,而忘記了怎么去讀人生。
11
中心法則的黃昏:從線性信息流到網狀因果網
1958年的遺產與局限
1958年,弗朗西斯·克里克創造性地提出了中心法則:遺傳信息從DNA流向RNA,再流向蛋白質。這個框架奠定了分子生物學的基石,卻也埋下了“線性思維”的伏筆。
![]()
![]()
中心法則
但真實生物系統中,信息流動是網狀、多尺度、時空耦合的,包括表觀遺傳調控、RNA調控網絡、翻譯后修飾、三維基因組,這些都在中心法則的單向箭頭之外。
![]()
當我們用“預測下一個token”的語言模型處理生物數據時,我們可能不自覺地沿用了中心法則的簡化論思維——把生命壓縮進線性管道,卻丟失了網狀、多尺度的調控關系。
真正的生物學規律,存在于信息的時空展開之中。DNA→RNA→蛋白質只是生命劇本的臺詞,而真正的戲劇,是在細胞的三維舞臺上、再加上第四維在真實的時間、在物理規律的約束中上演的時空法則。
中心法則告訴我們遺傳信息怎么傳,但沒告訴我們生命怎么活。就像你拿到一本食譜,不等于你會做菜。真正的生命,是在廚房里發生的物理和化學反應,而不是在紙上的文字游戲。
12
兩種模型,一個未來:語言模型與時空模型的共生
生成-驗證閉環與智能的完整形態
看完前面的內容,我想你已經慢慢理解了迷宮的本質,把“概率直覺”與“形式邏輯”合二為一,通向真智能的最強范式——讓“生成-驗證閉環”可以水到渠成。
![]()
在這個閉環中,語言模型很多時候可以充當天馬行空的設計師,負責提供“跨越維度的直覺”,從海量序列數據中提出關于生命機制的猜想;而時空模型則是嚴謹苛刻的工程師,負責在四維仿真中驗證這些猜想能否涌現為真實的生命過程。
語言模型扮演的角色是“外推猜想”:給定大量序列,它能推斷出序列背后的“語法規則”,預測未知序列的可能結構和功能。時空模型扮演的角色是“內在本體”:在物理時空中運行機制,驗證生命“實際如何”的過程,讓因果關系從底層涌現為宏觀現象。
兩者不是替代關系,而是互補關系。語言模型生成的假設,需要用時空模型驗證;時空模型需要的參數初始化,可以由語言模型從組學數據中估計。所以,邏輯畫定了底線,直覺會決定我們的上限。
語言模型是詩人的想象,時空模型是物理學家的實驗。詩人可以“疑似銀河落九天”,但只有火箭能把人送到“九天”。
生物學需要詩人,更需要火箭——還需要詩人和火箭能一起工作。
13
工具決定論:華大的堅守與AI生物學的根本前提
沒有工具,就沒有數據;沒有數據,一切模型都是零
以上所有討論,都建立在一個根本前提下:我們已經有了完備的數據。而數據的獲取,本質上是一個“工具”問題。
這正是華大集團數十年來一以貫之的核心理念——“工具決定論”。從華大之初,這一理念就深植于華大的基因:生命科學的每一次重大突破,本質上都是由工具的進步驅動的。
![]()
● 低成本決定規模。當測序成本從數億美元降至數百美元,使“萬基因組”“百萬基因組”乃至“人人基因組”計劃成為可能。
● 高通量決定覆蓋。單細胞測序、空間轉錄組等技術,擴展了生物學的觀測維度——從一維序列到二維空間、三維組織、四維時間。
● 高質量決定精度。數據的質量決定了模型的上限。噪聲過多、偏差過大的數據,那就是“Garbage in, garbage out”,即使規模再大,也只能訓練出泛化能力有限的模型。
我們今天看到,不管是GENOS,還是果蠅連接組、4D虛擬細胞、EchoJEPA、ESM——每一個突破的背后,都是工具的進步。沒有工具,就沒有數據;沒有數據,一切模型都是零。
工具決定了我們能看見什么,能看見了什么就決定了我們能建模什么。工具是模型的“眼睛”,沒有眼睛,再聰明的大腦也是盲目的。
所以,工具和模型是AI生物學的雙翼,缺一不可。但若論先后次序,工具永遠在先——沒有工具提供的觀測能力,模型連“學什么”都不知道。
![]()
就像沒有望遠鏡,很多人就會懷疑天文學家是瘋子。又沒看見,你怎么知道?
沒有顯微鏡,微生物到今天我們都不會認知,“上帝降罪、鬼神作祟”就這么來的。
同理,沒有測序儀,生命天書就是供在神壇上的圣經。工具不是科學的仆人,工具是科學的眼睛——沒有眼睛,我想我們的科學就只能在黑暗中摸索。
![]()
這就是我加入華大二十多年來,體會的“工具決定論”的深刻之處:它并不是在貶低模型的價值,而是在強調一個好模型的前提。
模型可以爭論架構、爭論范式、爭論哪個更本質,但如果沒有數據、沒有高質量的數據,這一切爭論都是空中樓閣。而數據的獲取,最終要回歸到工具,回歸到我們能否以更低的成本、更高的通量、更好的質量,去測量生命的每一個維度、每一個層次、每一個瞬間。
14
走向工具驅動的時空模型
結論與展望
現在,我們可以完整地回答開篇的問題。
生物學是大模型——生命的復雜度要求模型規模足夠大、容量足夠高、表達力足夠強。
但生物學不是大語言模型——生命的物理實在性要求模型必須尊重時間連續性、空間三維性、因果關系耦合性。
生物學需要的是時空模型——在三維空間中、在連續時間里、在物理規律約束下、在多尺度耦合中,生命的機制才能被重新運行、被真正理解、被準確預測。
而這一切,都必須建立在工具的基礎上。未來的AI生物學,不會簡單的用語言模型去“預測”生命,而要用時空模型去“運行”生命。未來的數字生命,不是更大規模的序列生成器,而是能夠在其內部涌現出生命現象的虛擬世界。而這一切的根本,是工具要再強、再強、再強——是能夠以低成本、高通量、高質量獲取更多模態生物學數據的下一代測量工具。
![]()
1958年,克里克以“中心法則”為分子生物學奠基。2026年,我們正在見證由華大提出的、一個新法則的流行——時空法則:生命的意義不僅僅在序列里,更在時空中。真正的生命模型,必須是能夠復現這種時空演化的系統。而真正的生命模型,必須建立在工具獲取的真實數據之上。
![]()
38億年演化,生命一直在寫一首詩——用四維時空作紙,用物理規律作墨,用自然選擇作筆。我們終于有了能讀懂這首詩的工具,也有了能理解這首詩的模型。
但這首詩還沒寫完,甚至只是剛剛開始。下一個詩句,不光是人類的下一代,也將由我們和AI共同寫下。工具是我們的筆,模型是我們的眼,而生命,永遠是那個讓我們敬畏的作者。
感謝38億年的演化,賜予了我860億個神經元的大腦,讓我得以思考。感謝人工智能,沒有你的幫忙,沒有你的映射,沒有你的對照,沒有你像一個鏡子一樣、不斷的跟我討論,這14期內容,我恐怕也無法寫出。
或許這個宇宙還會持續演進,而在未來,我相信碳硅結合、多行星物種,是我們共同的星辰大海。
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.