![]()
導語
為什么一個系統越復雜,反而越容易預測?一項發表于《Science》的研究提出了一個反常識發現:在微生物群落中,隨著物種數量不斷增加,系統并沒有變得更加不可捉摸,而是逐漸收斂到少數幾個主導維度上。研究團隊建立了一套量化框架,發現高多樣性群落不僅更加穩定,而且能夠用更少的信息實現更準確的預測。這種現象被稱為“涌現可預測性”(Emergent Predictability)。研究表明,復雜系統中的大量微觀細節并不會無限累積復雜性,而可能通過反饋機制壓縮為少數關鍵變量,為理解微生物生態、氣候系統乃至更廣泛復雜系統中的“降維規律”提供了新的視角。
關鍵詞:涌現可預測性、復雜系統、粗粒化、反饋機制、多樣性、帕累托前沿
來源:集智俱樂部
作者:郭瑞東
審校:張江
按照常識,一個系統里的變量越多,往往就越難預測。一鍋放了二十幾種食材的亂燉,香料、肉類、蔬菜彼此交織,這鍋湯最終呈現出的風味,通常很難僅憑單個成分直觀推斷。
但今年4月發表于Science的一項研究卻發現,在微生物世界里,情況可能恰恰相反:菌種越多,系統反而越容易預測。當一個微生物群落從幾種菌擴展到幾十種菌時,它在微觀層面確實變得更加復雜;然而在宏觀功能層面,卻開始自發收斂到少數幾個主導變量上。研究者將這種現象稱為涌現可預測性(emergent predictability)。
這有些像一幅印象派畫作:近看是無數復雜而雜亂的筆觸,退后幾步,整體結構反而變得清晰可辨。不過,一個反常識現象要成立,首先需要回答一個問題:什么叫“更容易預測”?
![]()
論文題目:Emergent predictability in microbial ecosystems 論文鏈接:https://www.science.org/doi/10.1126/science.adr1440 發表日期:2026年4月9日 發表期刊:Science
量化評估并拆解涌現簡單性
僅僅觀察到高多樣性群落表現得更穩定,并不能證明系統真的變得更容易預測。它也可能只是隨機波動被平均后的結果。因此,研究者首先建立了一套量化框架,希望回答一個更具體的問題:隨著微生物群落變得越來越復雜,其宏觀功能究竟需要多少信息才能被準確預測?
在這項研究中,研究人員從一個固定的菌株庫出發,通過組合抽樣構建不同組成和豐富度的微生物群落,每個群落包含S個物種。隨后,他們記錄每個群落的物種豐度ni,并測量對應的宏觀功能指標Y(如代謝產物濃度)。
![]()
圖1:實驗設計流程圖
如果系統真的存在某種“涌現簡單性”,那么理論上,我們未必需要掌握每一種細菌的全部信息,就能夠預測群落的整體行為。為了檢驗這一點,研究者開始嘗試對群落組成進行壓縮。
他們不再逐個追蹤所有物種,而是將其歸并為更少的功能組(圖1B),即把S個物種劃分為遠小于S的K個功能類(functional classes)。這些功能組既可以依據分類學關系、代謝通路或系統發育距離劃分,也可以完全由數據驅動生成。這種用更少類別描述更多物種的過程,被稱為粗粒化(coarse-graining)。本質上,研究者是在問:如果不再關心每一種細菌的具體身份,而只保留更粗略的功能分類,還能否準確預測系統行為?
為了回答這個問題,研究者引入了兩個指標。第一個指標衡量信息壓縮的程度,采用物種標簽與粗粒化類別標簽之間的互信息表示,記為I(Ψ)。I(Ψ)越小,說明壓縮越徹底;I(Ψ)越大,則意味著保留了更多原始組成信息。第二個指標衡量預測誤差,即粗粒化后仍有多少系統變化無法被解釋,用無法解釋方差占比(Fraction of Variance Unexplained,FVU)表示。FVU越小,說明預測能力越強。
接下來,研究者比較了大量不同的粗粒化方案(圖1C)。有些方案保留了更多物種信息,有些則進行了更激進的壓縮。對于每一種方案,都可以同時得到一個“信息量”和“預測誤差”的組合結果。將這些方案放在一起后,會形成一條代表最佳權衡關系的邊界,即帕累托前沿(Pareto frontier)。這條邊界反映了系統在“信息復雜度”和“預測能力”之間能夠達到的最佳平衡。
更重要的是,當群落多樣性發生變化時,這條邊界也會隨之移動。通過比較不同多樣性水平下帕累托前沿的位置,研究者便能夠觀察系統是變得更容易壓縮、更容易預測,還是僅僅變得更加穩定,從而量化所謂的“涌現簡單性”。
不過,“系統變簡單”本身并不是單一現象。一個系統可能只是變得更加穩定,也可能更容易被壓縮描述,或者真的開始被少數主導變量所約束。為了區分這些不同來源的簡單化過程,研究者進一步將涌現簡單性拆分為三個彼此獨立的維度(圖2)。
為了理解這三個維度,可以把微生物群落想象成一支不斷擴充成員的合唱團。
![]()
圖2:涌現簡單性的三個維度
第一個維度叫涌現可重復性(emergent reproducibility),對應的是“人多聲穩”。一支合唱團人數越多,單個成員的發揮對整體效果的影響往往越小,因此每次演出的音量和節奏都會更加穩定。對應到微生物系統中,就是隨著物種豐富度增加,群落宏觀屬性Y(如代謝產物濃度)的波動范圍逐漸收縮(圖2D)。此時系統表現得更穩定了,但這種穩定更多來自隨機波動被平均,并不意味著系統變得更容易理解。
第二個維度叫可粗粒化(coarse-grained),對應的是“分聲部聽音”。聽合唱時,我們未必需要分辨每位歌手的聲音,只需區分高聲部、低聲部等幾個大類,就能大致把握整體旋律。類似地,在微生物群落中,即使不追蹤每個具體物種,只保留更粗略的功能分類,依然能夠保留相當強的預測能力(圖2E)。這說明系統內部并非完全雜亂無章,而是存在某種能夠被壓縮和概括的結構。
而第三維度涌現可預測性(emergent predictability)則最反直覺,也是論文真正關注的核心。對于低多樣性群落,要預測其整體行為,往往需要掌握大量關于具體物種的信息;而在高多樣性群落中,只需知道少量粗粒化信息,例如不同功能組的大致比例,就能夠做出更準確的預測。換句話說,隨著系統變得越來越復雜,決定其行為的有效變量反而變少了。
在圖2F中,高多樣性群落對應的帕累托前沿(紫色)整體移動到低多樣性群落(橙色)的左下方,這意味著兩件事同時發生了:
在相同信息復雜度下,預測誤差更低;
或者在相同預測精度下,所需的信息量更少。
至此,文章開頭提出的那個問題有了答案。所謂“更容易預測”,并不是系統中的組成成分減少了,而是系統的行為開始受到少數主導軸的約束。隨著多樣性增加,越來越多的微觀細節被吸收到這些主導軸中,因此雖然系統包含的物種更多了,但描述和預測其宏觀行為所需的信息反而更少了。
最反直覺的結果出現了:菌越多,越容易預測
前面的分析仍然屬于理論框架。那么,在真實微生物群落中,涌現簡單性真的存在嗎?
為此,研究團隊進一步分析了兩組已公開發表的實驗數據:一組來自包含25株腸道菌的合成群落體系,通過測量不同菌群組合產生的發酵產物來評估群落功能;另一組來自土壤微生物合成群落體系,通過觀察目標共生菌的定殖情況,評估群落組成對生態功能的影響。研究者將這些群落按照多樣性劃分為低、中、高三個等級,并利用前述框架逐一檢驗涌現簡單性的三個維度。
結果首先驗證了涌現可重復性。隨著群落多樣性增加,無論是發酵產物濃度還是關鍵菌種豐度,其波動幅度都持續下降,說明高多樣性群落確實表現出更強的穩定性。與此同時,可粗粒化特征也得到了驗證。即使不追蹤每一種細菌,只保留較粗略的功能分類信息,研究者依然能夠較好地預測系統行為。這表明微生物群落內部并非完全雜亂無章,而是存在能夠被壓縮描述的結構。
但真正關鍵的發現來自第三個維度——涌現可預測性。研究者比較了不同多樣性水平下的帕累托前沿,發現高多樣性群落對應的前沿整體向左下方移動。按照前文建立的框架,這意味著系統同時實現了兩件看似矛盾的事情:一方面預測誤差下降,另一方面所需的信息量也減少了。
這正是本文最反直覺的結果。按照通常理解,系統越復雜,應該越難預測;然而在這些微生物群落中,隨著物種數量增加,預測系統行為所需的信息反而越來越少。復雜性并沒有消失,但開始被壓縮到少數幾個主導維度之中。
研究者進一步對腸道菌群的數據進行了主成分分析(PCA),結果發現,由四種發酵產物構成的四維功能空間中,高多樣性群落并沒有均勻分布,而是聚集到一個低維流形上(圖3A)。這意味著雖然群落內部包含大量不同物種,但它們最終產生的功能狀態卻集中在少數幾種可能的模式之中。
![]()
圖3:功能空間坍縮到反饋假設的機制解釋
那么,是什么力量讓原本復雜的系統開始表現出這種收斂趨勢?
研究者提出,一個可能的答案來自環境反饋。例如,微生物代謝會改變環境pH,而變化后的pH又會反過來影響不同菌種的生長和競爭能力(圖3B)。以產酸菌為例:它們降低環境pH,而較低的pH又會抑制不耐酸菌,從而進一步強化產酸菌和耐酸菌的優勢。隨著這種反饋不斷強化,系統行為開始向少數穩定狀態收斂,并表現出更強的可預測性。
不過,研究者也強調,pH目前仍只是候選機制,而非已經證實的因果解釋。究竟是pH篩選了優勢菌,還是優勢菌先改變環境進而影響pH,仍需進一步實驗驗證。
不是所有“簡單化”都一樣
這一發現的重要意義在于,它幫助研究者區分了兩種容易混淆的“簡單化”。
第一種簡單化來自統計平均效應。當系統規模變大時,隨機波動被不斷抵消,整體表現得更加穩定;或者經過粗粒化后,即使忽略部分微觀細節,仍然能夠保留一定預測能力。這對應前文討論的涌現可重復性和可粗粒化特征。
然而,僅僅更穩定、或者能夠被粗略描述,并不意味著系統真的變得更容易理解。因為這些現象完全可能來自大數定律:物種多了,個體差異自然被平均掉,系統看起來更平滑而已。
這項研究真正關注的是另一種情況:隨著多樣性增加,預測系統行為所需的信息本身也在減少。換句話說,系統不僅表現得更穩定,而且開始呈現出新的組織結構。
正是在這個意義上,這篇研究將“涌現可預測性”與一般意義上的穩定性區分開來。從這個角度看,這項研究真正挑戰的并不是“復雜系統是否復雜”,而是另一個更深刻的問題:復雜性是否一定意味著不可預測。
從腸道菌群到氣候系統:
復雜世界為何總會“降維”
下面關于跨系統的討論,主要是筆者基于本文結果的延伸思考,用于理解涌現可預測性可能具有的普遍意義。
20世紀中葉以前,熱帶太平洋的氣候波動長期被視為近乎隨機的現象。直到1960年代,氣象學家Jacob Bjerknes提出海—氣耦合反饋機制:海溫變化影響風場,風場又反過來改變海溫,形成閉環反饋。正是這一反饋結構,讓原本雜亂的數據開始呈現出可理解的規律,并最終催生了現代ENSO預測理論。
從這個角度看,微生物群落中的涌現可預測性與氣候系統中的可預報性,或許遵循著相似的邏輯:當系統規模不斷擴大時,復雜性并不一定無限增長;某些反饋過程反而會逐漸占據主導地位,將大量微觀細節壓縮到少數幾個關鍵變量之中。
這或許也是本文最值得思考的地方。復雜性并不一定意味著不可預測。正如印象派畫作中的無數筆觸最終匯聚成清晰圖景一樣,復雜系統中的大量局部互動,也可能在更高尺度上收斂為少數可理解、可預測的規律。
作者:郭瑞東 審核:張江 北京師范大學系統科學學院教授 出品:中國科協科普部 監制:中國科學技術出版社有限公司、北京中科星河文化傳媒有限公司
閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”
![]()
未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.