![]()
王曉東,北京生命科學研究所所長、資深研究員
撰文|王曉東?
——從生命本質到逆向工程
“道可道,非常道。”
老子的這句話,用來形容今天生命科學的現狀,或許再合適不過。
突破層出不窮。新的疾病通路、靶點與機制,幾乎每天都會通過手機里的各種推送撲面而來。抗衰老、抗腫瘤、抗老年癡呆的新方法、新思路,不斷登上三大科學雜志的頭條。AI加持的醫學與生命科學,正在成為各種大項目與資本追逐的中心。發明AlphaFold的諾獎獲得者,甚至做出了“十年內治愈所有人類疾病”的預言。仿佛人類距離活到150歲,已經只差幾個大模型和幾個融資輪次。
生命科學的規律——也就是它的“道”——好像已經可以經常被人說道了。
什么是生命
然而,這些“可道”,是否真的是生命科學的“常道”?
我們仍需要回到“什么是生命”這個最根本的問題。
人類真正開始理解生命,其實不過是最近幾十年的事情。
1953年DNA雙螺旋結構被發現時,人類第一次真正意識到:生命或許并不是一種神秘力量,它背后同樣存在可以被理解的規律。
如果抽象地看,DNA本質上是一套由四種堿基構成的信息系統。真正革命性的地方,在于其互補雙鏈結構使信息第一次能夠以“模板復制”的方式穩定延續。達爾文進化論也因此第一次真正擁有了明確的物質基礎。
但信息本身并不足以構成生命。
一本書可以儲存大量信息,一塊硬盤甚至可以儲存整個人類文明,但它們都不是生命。生命除了能夠復制信息之外,還必須維持自身存在。一個無法維持結構穩定的系統,會迅速走向熱力學平衡,也就是死亡。
因此,生命的第二個核心問題,是能量。
二十世紀生物化學的發展逐漸回答了這一問題。從電子傳遞鏈到氧化磷酸化,人類開始理解:生命并不是違反熱力學定律的存在。恰恰相反,生命本質上是一個遠離熱平衡的耗散系統。它通過持續吸收外界能量,轉化為可以利用的ATP來維持自身高度有序的狀態。
從這個意義上講,DNA解決了“信息如何延續”的問題,而能量轉化則解決了“生命如何維持存在”的問題。
真正深刻的地方在于:生命并不是信息本身,也不是能量本身,而是信息與能量第一次被穩定耦合在一起。DNA儲存信息,ATP提供能量,而蛋白質與代謝網絡則讓信息能夠調用能量去維持自身結構,并繼續復制信息本身。
信息與能量的耦合,構成了生命的起源;而演化,則不斷擴展生命能夠存在的空間。
然而,信息與能量究竟如何通過核苷、氨基酸等簡單有機分子的相互作用,最終耦合成一個能夠自我復制并維持穩態的系統——也就是生命真正的“道”——至今仍然超出了我們的理解。
生命真正需要對抗的,并不是個體死亡。
而是信息的湮滅。
個體會消失,但只要信息能夠延續,生命本身便仍在繼續。
生命為何如此復雜
二十世紀物理學的巨大成功,很大程度上塑造了現代人對于“科學”的理解。相對論重新定義了時間與空間,量子力學揭示了微觀世界的規律。現代物理學之所以輝煌,很大程度上建立在數學這一語言之上。
而生命科學不同。
生命不是靜態系統,而是演化系統。一個電子不會因為過去發生過什么而改變性質和運動軌跡,但一個生命系統,卻攜帶著幾十億年的演化歷史。
因此,生命不僅遵循物理規律,它還記錄歷史。
今天所有活著的生命系統,都不是“從零開始設計”的結果,而是在無數隨機突變、自然選擇與環境壓力下不斷修補、妥協與疊加后幸存下來的產物。生命系統中充滿冗余、補償、模塊重復,以及各種演化遺留下來的“bug”與歷史補丁。它更像一段不斷被修改、卻從未被徹底重寫的古老代碼。
而生命演化中最深刻、也最具有偶然性的例子之一,或許就是線粒體的出現。
今天幾乎所有真核生命——包括人類——都依賴線粒體產生ATP來提供能量;但線粒體原本并不屬于這些細胞。
宿主細胞與線粒體祖先,最初都能夠獨立生存。
在二十多億年前某個偶然時刻,一個原始細胞吞噬了另一種能夠高效利用氧氣產生能量的微生物。但這次吞噬并沒有像通常那樣導致消化。相反,雙方逐漸形成了穩定共生關系。被吞噬的微生物最終演化成線粒體。
而今天地球上所有復雜生命——從海洋里的魚類、陸地上的動物,到森林中的植物與最終出現的人類——某種意義上,都源于二十多億年前兩個微生物的一次偶遇。否則地球上的生物可能至今仍停留在肉眼不可見的單細胞狀態。
從這個意義上講,生命系統很多時候并不是“最優設計”。它更像是歷史偶然事件不斷累積后的“幸存方案”。
因此,理解生命,不僅需要理解物理與化學規律;還必須理解歷史本身。
也正因為如此,生命科學很難像物理學那樣,僅僅依靠幾個優美方程就被完全統一。如果生命系統真能被幾個優美方程完全統一,生物學家的數學功底恐怕也會好很多。
生命不僅是物理系統,它還是歷史系統。
而歷史,恰恰是不容易重復、也很難完全簡化的。所以生命科學研究中不可以只是憑邏輯自洽,或孤證結論。
生命科學研究的“道”
如果說生命科學存在一個最根本的“道”,那就是理解生命如何利用能量維持一個能夠自我復制、并不斷演化的信息系統,并通過占領不同的生存空間去最大限度地利用能量、復制信息。
DNA讓信息能夠跨越時間;ATP讓系統能夠維持遠離熱平衡的穩態;而演化,則讓生命不斷適應環境并產生復雜性來擴展生存空間。
而整個現代生命科學能夠成立,還有一個極其重要、甚至近乎奇跡般的前提:地球上所有生命形式,無論是細菌、植物、昆蟲,還是人類,都來自共同祖先。
因此,所有生命的信息載體都使用相同的核苷酸多聚體;DNA與RNA的基本化學邏輯一致;從核酸到蛋白質翻譯的遺傳密碼,也幾乎完全統一。
這一點意味著,生命雖然演化出了億萬種形態,但底層“操作系統”卻高度統一。
于是,人類才可能通過酵母、果蠅、線蟲、小鼠甚至細菌去研究人類自身,研究細胞分裂、神經系統、衰老與死亡。
整個現代生命科學,其實都建立在“生命單一起源”這一巨大幸運之上。
生命科學研究的“術”
如果說生命科學的“道”是理解生命為何存在,那么生命科學研究的“術”,本質上則是一種逆向工程(reverse engineering)來了解生命體的運行。
生命并不是一個由人類設計出來的機器。它沒有設計圖紙,也沒有統一架構。今天所有生命系統,都是幾十億年演化不斷疊加后的結果。
因此,現代生命科學研究,本質上是在不斷拆解這個復雜系統,逐漸理解它如何運作、如何組裝、如何維持穩態,以及如何根據環境變化不斷調節自身狀態。
這個過程大致可以分成幾個層次。
最初是對生命現象的描述。從博物學時代對自然界生命形式的記錄,到顯微鏡發明后對細胞與微生物的觀察,生命科學首先需要知道“發生了什么”。
隨后,研究進入機制分解階段。問題不僅是“發生了什么”,而是“為什么會發生”。于是,人類開始不斷把復雜生命活動拆解成更基礎的分子與細胞事件:哪些基因參與,哪些蛋白發揮作用,它們如何相互作用,信息如何傳遞,能量如何流動。
而機制研究本身,又包括兩個層面:一個是生命活動最基礎的核心過程,例如DNA復制、蛋白質翻譯、ATP產生與細胞分裂;另一個則是調節機制。
因為生命并不是靜態機器。生命存在于不斷變化的環境中。溫度、營養、感染、壓力、損傷、晝夜節律都會改變生命狀態。因此,調節本身就是生命最核心的屬性之一。
某種意義上,一個實驗室里觀察到的生命現象是否真實,一個重要標準就是它是否會隨著環境變化而被調節。因為生命最本質的特征之一,正是動態適應。
但即便理解了分子機制,生命科學研究仍未結束。因為生命最終并不是單個分子的集合,而是一個高度整合的整體系統。因此,機制最終必須重新回到組織、器官、個體與生態系統中,在正常(生理)與異常(病理)狀態下不斷被驗證,并賦予其生命過程中的意義。
而生命科學研究最終,也并不止于“理解”。更進一步的目標,是人為調節生命過程,為人類服務。治療疾病、提高農作物產量、增強抗病與抗逆能力、優化生態系統,本質上都屬于建立在生命逆向工程基礎上的“再工程化”。
技術革命與生命科學
生命科學的發展,在極大程度上受到技術進步推動。
某種意義上,生命科學的發展史,本身就是一部不斷“看見更深層生命世界”的技術史。
從光學顯微鏡,到X光衍射解析DNA結構;從熒光蛋白到超分辨顯微鏡;從冷凍電鏡到單分子技術與活體成像;從模式生物與遺傳突變體,到DNA重組、測序與編輯、光和化學遺傳學、類器官、單細胞組學與空間組學。
每一次技術革命,都會重新定義人類能夠觀察生命的尺度與深度。
技術發展的不均衡,也逐漸塑造了現代生命科學內部兩種不同研究路徑。
一種是傳統的還原論(Reductionism)。不斷把生命系統拆解成更小、更基礎的子系統,以化學分析為手段,研究單個基因、單個蛋白、單條信號通路,用遺傳學的手段建立因果關系。這種方式像“管中窺豹”,速度很慢,以小團隊、專業化、探索性為途徑。
另一種則是隨著組學與AI發展而興起的整體化(Holistic)研究方式。即不再首先拆解系統,而是試圖直接從全基因組、全轉錄組、全蛋白組與全細胞狀態中整體推斷生命活動規律。我把這種方式戲稱為“觀豹造虎”。
某種意義上,Reductionism是在“拆機器”,而Holistic則更像是在透視“整臺機器如何整體運轉”。
隨著組學、AI與深度學習的發展,生命科學第一次開始真正擁有“在尚未完全理解子系統之前,直接從整體數據推斷規律”的能力。
這與傳統還原論研究形成了明顯不同。
傳統生命科學強調的是:在可控條件下建立因果關系。而AI與大數據更擅長的,則是從復雜數據中發現關聯與模式。
于是,生命科學第一次真正開始面對一個問題:
關聯,是否能夠替代機制?
AI時代與生命科學的邊界
AlphaFold對蛋白質結構預測的成功,第一次讓人類看到:生命活動背后的某些復雜規律,或許能夠通過大模型與深度學習被“學習”出來。
于是,出現了很多驚人的預測:十年內解決所有人類疾病,徹底攻克衰老,重新設計生命。
但真正重要的問題是:我們的逆向工程,究竟進行到了什么程度?
即便所有蛋白結構都被解析,所有空間位置都被確定,疾病狀態中的所有變化都被系統記錄,是否就意味著我們真正理解了疾病?
問題恰恰在這里。
因為變化本身,并不一定就是病因。
最明顯的變化,未必是最早發生的變化;最強烈的變化,也未必是真正驅動疾病的變化。很多變化,可能只是系統失衡后的結果,甚至只是代償反應。真正困難的,并不是“觀察變化”,而是如何在可控條件下建立真正可靠的因果關系。
否則,任何一個熬夜、喝咖啡、發炎,或者老板當天情緒與興趣方向的變化,都足以在組學數據里制造出成千上萬個“重大機制”。
而生命系統中的因果關系,往往并不是線性的。中間可能存在未知調節層、時間依賴、空間依賴、環境依賴以及目前完全未知的黑箱。
這些黑箱,并不僅僅存在于理論中。它們每天都在實驗室里不斷出現,包括在我自己的實驗室中。很多時候,現象真實存在,實驗也穩定可靠,但目前技術與研究體系,依然無法解釋其背后的運行邏輯。
因此,AI、大數據與整體組學當然會極大加速生命科學研究,但它們不會真正取代小團隊、探索性、以傳統還原論為基礎的機制研究。
因為生命科學最終仍然需要在可控條件下建立因果關系。
真正重要的新發現,很多時候依然來自一個個小實驗室中,對一個異常現象長期而執著的追問,并最終把光亮照進這些黑箱。
科學研究與人的成長
科學研究從來不只是尋找答案。
它同樣是在不斷追問中,理解世界,也理解自己。
真正決定一個科學家最終能走多遠的,往往也并不是技術。因為技術終究可以學習,也可以通過合作來利用。真正稀缺的,其實是在表象之下,發現可以入手研究問題的能力。
技巧可以讓人走得快,但只有問題,才能決定一個科學家最終能走多遠。
科研真正培養的,從來不只是知識與技術,而是判斷力。
也許人類永遠無法徹底完成對生命的理解。因為生命本身,不僅承載著淹沒的歷史,同時還是一個仍在不斷演化中的系統。
但科學的意義,或許從來也不在于終點。
通過不斷提出更深的問題,
并在追問這些問題的過程中,
一點點接近世界的真實。
從而回應人類亙古以來最深的追問:
我從哪里來?
又將到哪里去?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.