★置頂zzllrr小樂公眾號(主頁右上角)數學科普不迷路!
從直覺上來說,我們能夠想象一個一維實體,它永遠只能在一條無限延伸的直線上移動;也能想象一個二維生物,它注定只能生活在一個平坦的平面上。而三維生物無需我們刻意想象,因為這正是我們感知宇宙的方式。然而,驅動現代世界運轉的計算能力,卻在五維、十維乃至數千維的抽象空間中蓬勃發展。高維數學究竟是如何幫助我們處理和解讀信息,又如何揭示那些支配著從生物學到人工智能等萬事萬物的隱藏規律的呢?
作者:Benjamin Skuse(HLF海德堡桂冠論壇科普記者)2026-1-28
譯者:zzllrr小樂(數學科普公眾號)2026-2-1
超越感知的維度
我們不妨先區分宇宙的維度與維度的其他定義方式,這是一個不錯的切入點。如果討論的是前者,那么核心問題便是:我們是否真的生活在一個三維宇宙中?抑或這只是我們感知方式的局限所致?左與右、前與后、上與下,這是我們僅有的移動方向,也是我們感知到三維世界的原因。但阿爾伯特·愛因斯坦(Albert Einstein)的出現改變了這一切。他提出的狹義相對論與廣義相對論將時間納入了考量范疇。盡管我們只能感知到時間的單向流逝,其體驗方式與三維空間維度截然不同(從數學角度而言亦是如此),但相對論將空間與時間整合為一個整體,即時空(spacetime)。
數學家赫爾曼·閔可夫斯基(Hermann Minkowski)的研究讓時空的數學表達變得具象化。他證明,若將空間與時間置于近乎平等的地位,狹義相對論便能得到簡潔優美的闡釋。這一統一視角催生了閔可夫斯基空間(Minkowski space)的概念——這是一個四維空間,時間被視為第四個坐標。
這項研究為將時空視為單一四維結構奠定了基礎。在數學術語中,這種結構被稱為流形(manifold),它并非一成不變,而是會受到質量或能量的影響。當靠近黑洞這類大質量天體時,空間會被實實在在地拉伸,時間亦是如此。換句話說,這個四維流形的維度會發生幾何扭曲。
一個多世紀前,相對論帶來的啟示讓公眾意識到,我們所處的宇宙或許擁有三個以上的維度,也讓人們深刻理解到,我們感知到的事物并非存在的全部。但更多的突破性發現還在后面。
超立方體(左)與立方體(右)示意圖
![]()
展示超立方體(左)與立方體(右)折疊和展開過程的動畫。
圖源:Christopher Thomas(wikimedia)
在愛因斯坦向世界提出廣義相對論后不久,德國數學家特奧多爾·卡魯扎(Theodor Kaluza)與瑞典物理學家奧斯卡·克萊因(Oskar Klein)意識到,這個理論中還缺少了關鍵的一環:另一個空間維度。兩人論證指出,倘若宇宙是五維而非四維的,那么五維形式的愛因斯坦方程將可以分解為三組四維方程,分別是:描述引力的愛因斯坦原始場方程、描述電磁力的詹姆斯·克拉克·麥克斯韋方程(James Clerk Maxwell’s equations),以及一個全新的標量場方程。
這個新增的第四空間維度可以蜷縮成一個極小的閉合環路,其半徑遠小于任何可測量的距離——這也解釋了為何我們無法感知到它的存在。但與此同時,它卻可能對我們周遭的世界產生深遠影響,堪稱是實現引力與電磁力統一的“秘訣”。
這一理論便是著名的卡魯扎-克萊因理論(Kaluza–Klein theory)。它在數學層面精妙絕倫,但在物理層面卻存在缺陷:該理論無法準確預測粒子的屬性,也未能涵蓋另外兩種基本作用力(強核力與弱核力)以及諸多基本粒子。盡管如此,它卻是首次嚴肅嘗試證明,我們所感知到的基本作用力,或許只是高維幾何結構的一種表現形式。如今,這一理論的思想遺產依然延續,催生出一系列試圖通過多個蜷縮空間維度來統一基本作用力與粒子的理論,例如弦理論(string theory)與M理論(M-theory)——后者由1990年菲爾茲獎得主(Fields Medallist)愛德華·威滕(Edward Witten)首次提出。
四維廣義相對論、五維卡魯扎-克萊因理論,以及十維、十一維的弦理論與M理論都表明,我們宇宙的幾何結構,或許遠比我們能感知到的更為奇特。但這些理論所涉及的維度,在數學家與統計學家研究的高維范疇中,還處于較低的水平。那么,為何人們要涉足這些高度抽象的領域呢?
定義數據
當我們描述某個N維空間內一個點的位置時,高維數學的作用就變得易于理解了。前文提到的那個在無限直線上移動的一維生物,只需一個坐標(x)就能確定其位置;平面上的二維生物需要兩個坐標(x,y);而我們人類,若只考慮空間位置,用三個坐標(x,y,z)即可定位,若要同時描述時空位置,則需要四個坐標(x,y,z,t)。
一維、二維與三維生物示意圖
![]()
從左至右依次為一維、二維與三維生物的示意圖。
本圖在谷歌雙子座(Google Gemini)的協助下制作完成。
高維空間中的點,其實只是擁有更多的坐標而已。當我們不再將維度視為宇宙的構成要素,而是從其他角度定義維度時,高維空間的價值便凸顯出來。我們可以將維度定義為某一空間內所包含的屬性或變量的數量,而非構成現實的不同層面。例如,金融模型師想要追蹤并預測某一資產的風險,就可以將該資產視為N維風險空間(N-dimensional risk space)中的一個點,其中N代表多種變量,如當前價格、波動率、利率等。
另一個典型例子是人口普查數據。政府的人口普查數據庫包含數百個關于人口(年齡、性別、種族、職業等)和家庭(住房類型、產權狀況、臥室數量等)的變量。這樣一來,每個人就成為了數據庫這個N維空間中的一個點,N對應的是普查中測量的數百種不同特征。
在這兩個例子中,想要獲取有價值的洞見,關鍵在于發現并分析隱藏在高維數據中的低維模式與結構。金融模型師可以運行算法,在高維風險空間中尋找一個超平面(hyperplane),以此將安全投資與高風險投資進行最優劃分。統計學家則可以將原始變量整合為主成分(principal components)——這些主成分能夠反映不同群體在社會經濟地位上的主要差異,進而構建出基于區域的貧困指數(deprivation index)。
高維數學的重要性還體現在一個當下的熱門領域中,那就是大語言模型(large language models, LLMs)。這類模型的發展得益于約書亞·本吉奧(Yoshua Bengio)與楊立昆(Yann LeCun)等研究者數十年來在人工智能、機器學習與自然語言處理領域的深耕——兩人均是2018年ACM圖靈獎(ACM A.M. Turing Award)得主。事實上,倘若沒有高維數學,大語言模型便無從運轉。
![]()
約書亞·本吉奧與楊立昆分別出席2019年與2022年海德堡獲獎者論壇
圖源:海德堡獲獎者論壇基金會HLFF / Flemming
大語言模型完全通過向量數學(vector mathematics)處理文本。模型會將每個“標記(token)”(可以是單詞、子詞或標點符號)轉換為一個高維向量,其維度通常在512至4096之間,同時還會將標記在序列(句子)中的位置編碼為另一個向量。模型的運算主要由自注意力機制(self-attention mechanism)驅動:該機制通過計算高維向量之間的點積(dot product),來衡量所有標記之間的語義關聯,進而生成一系列新的高維向量,這些向量包含了給定序列的上下文信息。最終生成的輸出向量會被映射到詞匯空間(vocabulary space)——該空間的維度等于模型詞匯表中可能存在的標記數量。最后,模型會通過一個函數篩選出合適的標記,完成文本生成。
復雜性的形態
當大型數據集包含本身就是高維向量的數據點時,數據分析與洞察的難度便會大幅提升。例如在單細胞核糖核酸測序(single-cell RNA sequencing)技術中,每個單細胞都被表示為一個向量,其維度對應數萬個基因的表達水平。想要理解如此龐大而稀疏的空間,需要采用一種截然不同的方法。
如果我們將這個空間視為一個巨大的數據云(data cloud),忽略其中具體的坐標信息,就能退一步,從宏觀上把握數據的“形態”。這種方法被稱為拓撲數據分析(Topological Data Analysis, TDA),它能夠刻畫高維數據流形(manifold)的全局結構與連通性。這類分析方法源于現代拓撲學,其理論基礎包括1982年菲爾茲獎得主丘成桐(Shing-Tung Yau)關于彎曲空間的幾何分析,以及1986年菲爾茲獎得主邁克爾·弗里德曼(Michael Freedman)在流形結構領域的深刻洞見。
拓撲數據分析借助持久同調(persistent homology)技術識別拓撲特征——這些特征是數據形態的固有屬性,即便數據被拉伸、壓縮或進行連續變換,它們也不會發生改變。通過該技術,我們可以量化那些在不同尺度下都穩定存在的結構,包括聚類、環路與空洞等。這些結構的存在,往往預示著那些用其他方法難以發現的深層規律。
拓撲數據分析的一個極具影響力的應用領域是癌癥基因組學(cancer genomics)。研究人員利用該技術,發現了其他方法未能識別的乳腺癌患者亞群,這些亞群具有特定的疾病預后特征,這一發現為精準治療奠定了基礎。此外,拓撲數據分析還被用于識別基因組標記(genomic markers),這些標記可用于預測患者的治療反應,并對預后情況進行高精度評估。
無限的循環
當我們的研究超越這些已經極高的維度時,便會回到一切的起點:探究現實與宇宙的本質。在創立相對論的同時,愛因斯坦也是現代物理學另一大支柱——量子力學(quantum mechanics)的核心奠基人之一。量子力學描述了原子與亞原子尺度下物質與光的行為規律。在這個尺度上,對物理現象的數學描述需要滿足空間域的連續性,同時還要遵循疊加原理(principle of superposition)——即在被觀測之前,波或量子粒子等物理系統可以同時處于所有可能的狀態。
這些特性導致量子系統具有無窮多的潛在自由度(degrees of freedom),也就是無窮多的維度。而這種復雜性,就需要借助泛函分析(functional analysis)這一數學分支來處理。泛函分析將函數視為無窮維空間中的點或向量,而希爾伯特空間(Hilbert space)正是量子態所處的一種特殊無窮維向量空間。事實上,由著名通才約翰·馮·諾依曼(John von Neumann)嚴格構建,并經著名數學家伊斯雷爾·蓋爾范德(Israel Gelfand)與1962年菲爾茲獎得主拉爾斯·霍爾曼德(Lars H?rmander)進一步推廣的無窮維希爾伯特空間框架,構成了量子力學的數學基石。倘若沒有泛函分析與希爾伯特空間理論,我們便無法準確定義量子態、量化概率,也無法描述亞原子世界的連續動態變化。
正如我們所看到的,人類日常感知的局限,恰恰是獲得真正洞見的起點。如今,我們不再局限于對三維世界的觀察,而是掌握了構建和探索任意維度空間的數學語言,這讓我們在眾多領域與應用中,都獲得了全新而深刻的認知。
參考資料
https://scilogs.spektrum.de/hlf/how-high-dimensional-mathematics-rules-our-world/
小樂數學科普近期文章
·開放 · 友好 · 多元 · 普適 · 守拙·![]()
讓數學
更加
易學易練
易教易研
易賞易玩
易見易得
易傳易及
歡迎評論、點贊、在看、在聽
收藏、分享、轉載、投稿
查看原始文章出處
點擊zzllrr小樂
公眾號主頁
右上角
置頂加星★
數學科普不迷路!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.