★置頂zzllrr小樂公眾號(主頁右上角)數學科普不迷路!
數學家們提出了一個自動化框架,用于統一同一常數(如π)的多種表達形式迥異、但有深層關聯的數學公式。
![]()
本文海報:
![]()
歷史上有關Π數值計算的著名數學公式:
![]()
守恒矩陣場(CMF,conservative matrix field)包含文獻中許多著名的公式:
![]()
作者:Tomer Raz(托默?拉茲,以色列理工學院)2026-3-17
譯者:zzllrr小樂(數學科普公眾號)2026-3-28
摘要
數百年來,常數 π 一直吸引著學者們的關注,催生出眾多用于計算它的公式,例如無窮級數和連分數。盡管這些公式各具重要性,但許多公式之間的內在關聯仍未被揭示,缺乏能夠帶來更深層次理解的統一理論。統一理論的缺失反映了數學和科學領域的一個普遍挑戰:知識通常通過孤立的發現積累,而深層次的關聯往往隱藏不顯。在本研究中,我們提出了一個用于數學公式統一的自動化框架。該系統結合了大語言模型(LLMs)用于系統性公式收集、LLM - 代碼反饋循環用于驗證,以及一種新穎的符號算法用于聚類和最終統一。我們以 π 為標志性案例展示了這一方法 ——π 是符號統一的理想測試平臺。將該方法應用于 455050 篇 arXiv 論文后,我們驗證了 385 個獨特的 π 公式,并證明了其中 360 個(94%)公式之間的關聯,其中 166 個(43%)可由單一數學對象推導得出 —— 該對象將歐拉、高斯、布龍克爾(Brouncker)的經典公式與 “拉馬努金機器” 通過算法發現的新公式聯系起來。我們的方法可推廣至其他常數,包括 e、ζ(3) 和卡塔蘭(Catalan)常數,這表明AI人工智能輔助數學有望揭示隱藏結構并實現跨領域知識的統一。
1 引言
對 π 的首個嚴格近似可追溯至公元前 250 年左右的阿基米德,他確定了 π的取值范圍為223/71 < π < 22/7 [16]。現代 π 近似計算采用了更復雜的公式。例如,源于拉馬努金公式 [48] 的楚德諾夫斯基(Chudnovsky)算法 [15],至今仍是創造精度記錄的關鍵工具;同樣,BBP 公式 [6] 因能夠直接計算特定數位而無需先計算前面的數位,也具有重要意義。此類突破推動了計算機科學的根本性進步,如高精度算術 [7]、進化優化 [35] 和橢圓曲線密碼學 [39]。近年來,研究人員開發出能夠生成大量數學常數公式猜想,有時甚至能提供證明的計算機算法 [9, 17, 46]。
數百年來,與 π 相關的研究成果層出不窮,這引出了一個長期存在的問題:這些公式之間究竟存在怎樣的關聯?這個問題至關重要,不僅能避免重復發現(例如,蘭格Lange 1999 年提出的公式 [37],實際上布龍克爾Brouncker勛爵早在 1656 年就已通過求積連分數推導得出 [42])。許多等價公式初看之下差異巨大,一個典型例子是歐拉的連分數,它可提供無窮級數的等價表示 [23]。這種復雜情況凸顯了對這些關系進行系統性統一的迫切需求。
迄今為止,人工智能在數學領域的應用主要集中在自動定理證明 [44, 56]、自動猜想生成 [3, 24, 25, 40, 46]、回歸分析 [31, 32, 55],以及近期興起的用于數學發現的 LLM - 工具集成 [27, 29, 50, 59]。然而,截至目前,尚無研究致力于數學知識的符號統一問題。
![]()
圖 1:數個世紀以來的代表性 π 公式
公式來源包括:桑伽馬格拉馬的馬德哈瓦(Madhava of Sangamagrama,14/15 世紀,印度)、約翰?沃利斯(1656 年,英國)、卡爾?弗里德里希?高斯(1813 年,德國)、斯里尼瓦瑟?拉馬努金(1914 年,印度)、拉約尼Raayoni等人(《自然》,2021 年)
在本研究中,我們提出了一個用于大規模收集、識別和統一數學公式的系統(圖 2)。該研究利用了基于大語言模型的內容理解最新進展、新發現的守恒矩陣場(CMFs)概念 [21, 58],以及一種名為 UMAPS 的新穎數學算法 —— 該算法通過符號結構映射實現統一,利用上邊緣等價性(coboundary equivalence)數學原理尋找并證明公式之間的關聯。為展示這一方法,我們選擇了 π 計算公式作為符號案例研究。我們從文獻中提取并驗證了 385 個獨特的 π 公式,發現其中 43% 對應于單一守恒矩陣場內的不同軌跡 —— 我們推測,一個或少數幾個獨特的守恒矩陣場能夠統一所有與 π 計算相關的知識(見第 5 節)。
![]()
圖 2:數學知識統一的自動化方法
收集大量數學公式語料庫,將每個公式轉換為可執行代碼進行驗證;然后通過轉換為標準形式對公式進行聚類,并使用新穎的符號計算算法證明它們之間的關聯,從而實現統一。
據我們所知,本研究是首個將 LLM 與符號工具集成用于數論發現的工作,也可能是首個將 LLM 與專有研究級計算機代數系統集成的研究。該研究的成功凸顯了海量數學知識自動化統一的前景。除 π 之外,我們還將算法應用于 e、ζ(3)和卡塔蘭常數等其他數學常數,以及多種公式結構,展示了其廣泛的應用潛力。附錄 A 提供了全文關鍵術語表。
2 數學背景
2.1 作為數學常數公式通用表示的遞推關系
多種類型的公式(包括無窮級數、乘積和連分數)均可轉換為遞推關系,為統一提供了連貫的框架。若函數u?
滿足 m 階遞推關系,則有
u?=a?,?u???+a?,?u???+?+a?,?u???
其可通過相關的友矩陣( companion matrix,伴侶矩陣 )表示為:
![]()
通過 n 步逐步乘以友矩陣,可得到以下矩陣:
![]()
其中p?,?, ..., p?,?是初始條件為p?,?=δ??時遞推關系的解,其他不同初始條件的解可表示為這些解的線性組合。
遞推關系可直接通過lim n→∞ u? = L(例如無窮級數)計算目標常數 L,或通過兩個遞推解的比值lim n→∞ p? / q? = L(例如連分數)計算。在二階遞推關系的特殊情況下,u? =a? u???+b? u???,任意一對解都可表示為連分數形式:
![]()
當函數a?=a(n)和b?=b(n)為多項式時,上述公式被稱為多項式連分數(PCF),記為 PCF(a(n), b(n))。詳見附錄 E。
2.2 描述每個公式的動態度量
數學常數 L 的公式提供了一個收斂的有理數序列p? / q? (稱為丟番圖逼近)。該公式可通過捕捉收斂速度等特性的動態度量來表征。近期一篇論文 [52] 提出使用此類度量進行公式發現和聚類。本文中,我們使用收斂速度和無理性測度這兩個度量指標。收斂速度定義為:
![]()
在考察兩個候選公式的關聯時,它們的 r 值之比可暗示其中一個公式是否是另一個公式子序列的變換(見附錄 E.5 的示例)。p? / q?的無理性測度定義為極限δ=lim n→∞ δ?,其中:
![]()
我們發現,兩個公式具有相同的 δ 值是它們可能存在關聯的最強指示 —— 因為 δ 在多種變換和子序列選擇下具有不變性。下文將介紹,一旦兩個公式具有相同的r?和 δ 值,我們將使用 UMAPS 算法推導并證明它們之間的關聯。
2.3 守恒矩陣場(CMFs)
守恒矩陣場(CMF)是一種推廣特定常數公式的數學結構,最初通過推廣多項式連分數(PCFs)發現 [21],后來被證實具有更廣泛的適用性(附錄 G)。為便于說明這一概念,我們重點關注 π 的守恒矩陣場。該守恒矩陣場為 3 維,即由三個矩陣Mx、My、Mz組成,其元素為變量(x,y,z)的有理函數,滿足:
Mx(x,y,z)My(x+1,y,z)=My(x,y,z)Mx(x,y+1,z)
Mx(x,y,z)Mz(x+1,y,z)=Mz(x,y,z)Mx(x,y,z+1)
My(x,y,z)Mz(x,y+1,z)=Mz(x,y,z)My(x,y,z+1)
這一性質描述了 3 維格點中兩點間轉移的路徑無關性(格點示意圖見圖 5b),類似于守恒向量場。守恒矩陣場滿足離散平坦聯絡的性質 [11]。關于公式如何作為守恒矩陣場內的方向存在,詳見附錄 G.1。守恒矩陣場的一個顯著特征是:若兩個公式被發現是具有不同初始點的平行軌跡,則它們對應的矩陣是上邊緣等價的。
許多已知的 π 公式都可歸入單一守恒矩陣場(詳見附錄 G.2):
![]()
![]()
![]()
3 公式符號統一的方法
3.1 收集:從文獻中大規模檢索公式
首個挑戰在于公式的自然語言處理。我們結合正則表達式和大語言模型(LLMs)分析了 455050 篇 arXiv 論文的 LATEX 源代碼,提取所有數學表達式,得到 278242506 個字符串。篩選包含 π 符號的表達式,檢索出 121662 個與 π 相關的方程。由于 π 符號在科學文獻中使用廣泛,大多數出現場景與計算該常數本身無關。為解決這一問題,同時考慮到先驗情況下關于有效公式的 LATEX 格式數據極少,我們使用 GPT-4o mini [41](選擇其是因為性價比高)將每個潛在公式分類為 “計算 π” 或 “不計算 π”,將候選公式數量減少至 3367 個。隨后,GPT-4o 將公式按類型分類:級數、連分數或其他類型,最終得到 1656 個公式候選。
收集流程
示例
arXiv 預印本
吉列拉?赫蘇斯 Guillera, Jesús :《與拉馬努金型級數相關的雙邊級數》 Bilateral sums related to Ramanujan-like series. ,arXiv:1610.04839(2016)
455050 篇論文
(a) 爬取
![]()
278242506 個方程
(b) 檢索
\sum_{n = 0}^{\infty} (-1)^n \frac{(\frac12)_n (\frac14)_n (\frac34)_n}{(1)_n^3} \frac{21460n + 1123}{882^{2n}} = \frac{3528}{\pi}
121662 個方程
(c) 是否計算 π?
(c) 是級數還是連分數?(分類)
級數
1656 個方程
(d) 提取
項:
(?1)? ? n ? RisingFactorial(1/2,n)? RisingFactorial(1/4,n)? RisingFactorial(3/4,n)/(RisingFactorial(1,n)? ? 3)? (21460? n+ 1123)/882? ? ( 2 ? n )
起始值:0
變量:n
660 個公式
(e) 通過 PSLQ 驗證
1122.99727845641348 == 3528 / π
385 個公式
(f) 轉換為遞推關系
(-14681/1695923712 - (1946417*n)/89035994880 - (1366829*n^2)/66776996160 - (46871*n^3)/5564749680 - n^4/777924)*f[n] + (-71386776899/8479618560 - (1836628904911*n)/89035994880 - (1222951171699*n^2)/66776996160 - (39244403773*n^3)/5564749680 - (777923*n^4)/777924)*f[1 + n] + (45166/5365 + (110669*n)/5365 + (196509*n^2)/10730 + (151343*n^3)/21460 + n^4)*f[2 + n] = 0
385 個公式
圖3:公式收集流程及示例
(a) 從 arXiv 平臺的論文中提取方程。
(b) 對LATEX字符串運用正則表達式,檢索出僅含 π 作為唯一無理數的級數和連分數模式(詳見附錄 I.3)。
(c) 采用 OpenAI 的 GPT-4o mini 模型進行零樣本分類,識別出計算常數 π 的公式;隨后,利用 OpenAI 的 GPT-4o 模型判定公式類型(級數、連分數或兩者皆非)。
(d) 借助 GPT-4o 模型提取級數的通項,或連分數的部分分子與部分分母;再將公式轉化為代碼。
(e) 運用整數關系查找算法 PSLQ 對公式進行計算與驗證。
(f) 利用RISC的遞推擬合工具 [33],將公式轉化為標準遞推式。
3.2 收集:提取與驗證
提取和驗證階段依賴于一個 LLM - 代碼反饋循環,該循環為 PSLQ 算法提供輸入。每個表示為 LATEX 字符串的方程都必須解析為計算機代數系統(CAS)(本文使用 SymPy [38])以進行進一步處理。由于 LATEX 格式多樣,難以通過預定義邏輯系統地轉換為可執行代碼,因此從 LATEX 字符串中自動提取代數形式尤為復雜 [14, 47]。大語言模型(LLMs)通過上下文處理文本并關注相關部分,幫助我們克服了這些障礙,解決了可能需要復雜規則才能完成的自然語言處理任務。具體而言,我們使用 OpenAI 的 GPT-4o 將相關 LATEX 轉換為可執行的數學代碼 [22, 43, 61](詳見附錄 I 中的具體提示詞)。為修正 LLM 生成公式代碼中(常見的)錯誤,我們應用 LLM - 代碼反饋循環進行代碼驗證:將錯誤與有問題的代碼一起反饋給 LLM 以進行修正,最多可修正三次(詳見附錄 I.6.3)。
我們通過運行公式代碼獲取數值近似值,然后應用整數關系算法 PSLQ [26],驗證每個提取的公式是否計算常數 π。由于我們發現 GPT-4o 在某些情況下會錯誤提取極限值(見表 14),因此不會直接從 LATEX 字符串中提取極限值進行驗證。相反,PSLQ 方法能夠修正這些關鍵的 GPT 錯誤,并重現預期的公式。在 660 個候選公式中,385 個被驗證為 π 公式,并進入標準化階段(詳見附錄 I.5)。
3.3 聚類:使用標準形式
統一的第一步是將每個公式轉換為其標準形式:最簡單的帶多項式系數的線性遞推關系(附錄 E.4.1)。自動化代數工具在解決此類任務時的表現具有不確定性。因此,我們采用一種計算方法將公式轉換為多項式遞推關系:使用 RISC 的 Mathematica 包 [33],為每個有理數序列擬合帶多項式系數的線性遞推關系。生成的遞推關系經過數值驗證后,再傳入 Maple 包以確保階數最小化 [57, 60],從而找到可證明的最小多項式遞推關系。在 385 個驗證后的公式(第 3.1 節)中,380 個可表示為二階遞推關系,5 個為三階遞推關系(附錄 B.6 和附錄 C.3 將展示如何處理三階遞推關系)。
相同的標準形式可涵蓋多種類型的公式,包括連分數和無窮級數。因此,轉換為標準形式可自動實現不同公式的統一:從 385 個公式中得到 149 個不同的二階標準形式和 4 個三階標準形式,共 153 個標準形式(部分示例見表 1)。
![]()
表 1:標準形式表示
將公式轉換為標準形式可揭示不同形式表達式的等價性(例如 1、2),而更復雜的關聯則留待算法后續步驟解決。詳見附錄 C.4。
3.4 聚類:使用動態度量
聚類階段是一種啟發式方法,用于指導應嘗試通過 UMAPS 證明哪些公式等價。具有相同度量的公式可能與同一常數相關 [52]。這些度量還能指示更復雜的關聯,使公式能夠以系統的方式統一,證明它們之間的解析變換關系。首先,通過無理性測度 δ(圖 4a)比較標準形式公式 ——δ 是潛在等價性的最可靠指標。每個新公式首先與守恒矩陣場中具有相同 δ 的遞推關系對應的方向進行比對。由于 δ 具有連續性 [21],可通過對方向參數進行梯度下降來優化搜索。
我們發現僅靠 δ 不足以暗示等價性,因此補充使用收斂速度比r?:r?。將標準形式 A 按r?折疊(附錄 E.5),標準形式 B 按r?折疊(圖 4b),使它們以相同的速度收斂。下一步通過 UMAPS 找到它們之間精確的代數關聯。
3.5 統一:使用 UMAPS 算法實現上邊緣等價
![]()
圖 4:匹配算法:連接多項式線性遞推關系
該算法以多項式連分數(PCFs)為例進行演示,但可推廣至任何線性多項式遞推關系。
(a)計算兩個 PCF 的動態度量 [52](無理性測度δ?、δ?和收斂速度比r?/r?)。δ 度量用于識別潛在關聯 —— 僅當δ?=δ?(實際應用中,我們測試兩者差值是否在 0.06 以內)時,PCF 才可通過上邊緣關聯。
(b)將PCF?按r?折疊,PCF?按r?折疊(附錄 E.5)。
UMAPS 流程(c)-(e):
(c)求解一般莫比烏斯變換(2×2 矩陣U(1)),將其應用于PCF?的極限可使其與PCF?的極限相等。
(d)將 PCF 表示為矩陣形式A(n)和B(n),通過關系U(n+1)=A(n)?1?U(n)?B(n)傳播上邊緣矩陣至U(N)(本研究中 N=40 已足夠,詳見附錄 D)。
(e)假設U(n)的一般形式為有理函數,其分子分母多項式次數不超過?(N?1)/2?,并使用標準化的U(1,...,N)求解其系數。若找到并驗證此類解,則 PCF 是上邊緣相關的。詳見附錄 C。
我們提出的通過符號結構映射實現統一的算法(UMAPS)基于已確立的上邊緣等價概念(附錄 E.4),但在本研究之前尚無專門的上邊緣求解器。若存在矩陣U(n),使得
A(n)?U(n+1)=U(n)?B(n)(7)
則A(n)、B(n)∈PGL?(?(n)) 是上邊緣等價的。
當遞推關系的友矩陣——式(1)是上邊緣等價時,這一定義可推廣至遞推關系(圖 5a、d),此時有
由于任何帶有理函數系數的矩陣都可縮放為帶多項式系數的矩陣,因此可定義:若存在矩陣U(n)∈GL?(?[n])和多項式p?(n)、p?(n)∈?[n],使得
p?(n)?A(n)?U(n+1)=p?(n)?U(n)?B(n)(8)
則A(n)、B(n)∈GL?(?[n])是上邊緣等價的。
由于未知多項式p?、p?與未知上邊緣矩陣 U 的乘積,尋找兩個多項式矩陣之間的上邊緣等價本質上是一個非線性問題,且每個多項式的次數未知。盡管存在非線性,我們仍提出了一種適用于一般 m 階的上邊緣求解器算法(附錄 C.3)。
UMAPS 無需求解非線性方程即可找到解,而是利用遞推極限計算經驗上邊緣矩陣序列,其元素擬合為有理函數 [53]。該算法基于以下引理:
引理 1(上邊緣等價矩陣的必要條件):設L?=lim n→∞ PCF(a(n),b(n))和L?=lim n→∞ PCF(c(n),d(n))是收斂的 PCF,其相關友矩陣為A(n)、B(n)∈PGL?(?(n))。若A(n)與B(n)是上邊緣等價的,則L?和L?通過有理莫比烏斯變換相關聯;此外,若 U(n) 是上邊緣矩陣,則L?=U(1)(L?)(U(1) 作為莫比烏斯變換應用于L?)。
高階遞推關系的推廣證明(引理 4)以及上邊緣矩陣的唯一性證明(引理 5)詳見附錄 F。這些證明共同表明,如推論 1 所述(證明見附錄 C.3),UMAPS 足以求解上邊緣矩陣。
推論 1(UMAPS 的充分性):若兩個矩陣存在上邊緣矩陣,且上邊緣矩陣的每個有理函數元素的多項式次數不超過 d,則運行 N≥2d+1 的 UMAPS 足以恢復該上邊緣矩陣。
圖 4 總結了兩個標準形式公式的匹配流程。使用該方法,我們發現表 1 中的公式 1、2、5 是等價的,公式 3、4 也是等價的。附錄 B.1 描述了該算法在這些公式上的應用,附錄 C 列出了相關算法。附錄 D 提供了算法對超參數的敏感性研究。該流程適用于每個標準形式公式:計算其 δ 值,利用 δ 作為守恒矩陣場中方向的連續函數這一特性,定位可能產生公式對的上邊緣算法的有效方向。然后,在公式與守恒矩陣場的代表性遞推關系之間應用匹配算法。若公式與守恒矩陣場的代表性遞推關系匹配,則證明該公式由該守恒矩陣場生成。完整結果列表見附錄 J,π 的部分結果詳見第 5 節。
![]()
圖 5:上邊緣等價:公式轉換為標準形式后連接不同公式的數學框架。
(a)上邊緣條件A(n)?U(n+1)=U(n)?B(n)將公式重塑為守恒矩陣場中的平行軌跡(b、c)。
(d)兩個上邊緣等價的著名公式示例,展示了它們的上邊緣矩陣和極限,構成了新等價性的證明。
4 基準測試
4.1 與其他符號統一方法的比較
本研究首次大規模解決符號統一問題,因此尚無標準基準用于性能比較。主流大語言模型(LLMs)通常無法應對這一完整挑戰。例如,我們將算法的等價性檢測和證明能力與 LLMs 進行了比較:我們讓兩個領先的 LLMs(GPT-4o 和 Gemini 2.5 Pro Preview)識別并證明 10 對由我們的算法證明等價的公式(表 2)。所選公式對在折疊后具有相同的動態度量(r, δ)—— 這是守恒矩陣場中平行軌跡的較簡單證明場景。即使對于這些較簡單的任務,LLMs 的表現也僅有限成功。我們未發現任何 LLM 能在沒有相同動態度量的公式對之間找到關聯。
4.2 LLM 模型性能比較
我們以兩種不同方式利用 LLMs 進行分類和提取。表 3 比較了三種提取器 LLM 的性能 —— 我們發現提取器 LLM 的選擇更為關鍵,因為它用于更高級的 LLM - 代碼反饋循環。通過合并三個對比 LLMs 發現的驗證公式(第 3.2 節)建立基準真值。
LLM
成功檢測數
正確證明數
GPT-4o
1/10
2/10
Gemini 2.5 Pro Preview
8/10
5/10
表 2:LLM 在 10 對隨機選擇的具有相同動態參數的公式對中檢測和證明等價性的性能(附錄 H)。所有 LLM 證明均經過人工驗證。
LLM 分類器
LLM 提取器
成功提取數
代碼錯誤數
符號錯誤數
GPT-4o mini
GPT-4o
289(97.6%)
2(0.7%)
5(1.7%)
GPT-4o mini
Claude 3.7 Sonnet
266(89.9%)
21(7.1%)
9(3.0%)
GPT-4o mini
GPT-4o mini
206(69.6%)
70(23.6%)
20(6.8%)
表 3:不同提取器 LLM 在成功收集公式方面的性能。LLM 錯誤分為 “代碼錯誤”(無法運行的代碼)和 “符號錯誤”(錯誤識別公式成分,如連分數多項式)。加粗行標記為本研究其余結果所使用的 LLM 選擇。
5 結果
5.1 著名公式之間的等價性示例
我們的自動化系統證明了公式之間此前未知的等價性。其中包括著名的例子,如拉馬努金 1914 年提出的一個公式,以及 17、18、19 世紀布龍克爾勛爵、歐拉和高斯的多項式連分數(PCFs)[23, 28, 42]。例如,拉馬努金 1914 年發現的以下級數 [48]:
被證明與 2020 年發表的一篇論文 [54] 中的新級數等價(附錄 B.4):
這一等價性表明,兩個相隔一個多世紀發現的、看似截然不同的數學表達式,如今通過自動化過程被證明是等價的。
圖 5d 證明了另一對著名公式的等價性:(1)PCF (2n+3, n (n+2))——2021 年首個由計算機發現的 π 公式 [46];(2)PCF (2n+1, n2)—— 高斯 1813 年發表 [28],當時是計算 π 數位的高效方法。
5.2 由守恒矩陣場(CMF)統一的公式
π 的守恒矩陣場(式(6))涵蓋了大部分收集到的公式(表 4),部分示例及其對應的軌跡如圖 6 所示。
發現的關聯
同一 守恒 矩陣場
發現的關聯(標準形式)
同一 守恒 矩陣場(標準形式)
360/385(94%)
166/385(43%)
136/153(89%)
81/153(53%)
表 4:統一結果摘要。左列針對所有驗證公式,右列針對標準形式。公式來自 140 篇 arXiv 論文(表 15),其中 137/140(98%)的論文至少有一個公式通過標準化和 UMAPS 被證明存在關聯(金色或青色),70/140(50%)的論文有一個公式被守恒矩陣場統一(青色)。
守恒矩陣場涵蓋的完整標準形式列表見表 16。UMAPS 的改進可能會將更多公式(表 17)納入同一守恒矩陣場。
5.3 超越 π 的公式統一
除 π 之外,我們自動識別了 e、ζ(3) 和卡塔蘭常數的等價公式 —— 這展示了該方法的通用性。以阿佩里Apéry常數(黎曼 ζ 函數值 ζ(3))的兩個公式為例:
![]()
第二個公式 [36] 的收斂速度比 ζ(3) 的經典定義更快,盡管兩者均為多項式收斂。我們的自動化流程通過上邊緣變換證明了它們的等價性,并將其統一在 ζ(3) 的守恒矩陣場中(詳見附錄 B.2)。
另一個例子是卡塔蘭常數的兩個多項式連分數 [13],也通過 UMAPS 被證明等價(附錄 B.5):
![]()
自然的下一步是對其他知名常數以及物理和計算機科學等領域的基本數學結構進行全面搜索。e 的示例見附錄 B.3。
5.4 由守恒矩陣場(CMF)生成的公式
我們從 π 的守恒矩陣場中生成了 1693 個獨特的 π 公式樣本(見附錄 C.5)。守恒矩陣場提供了一種新的公式比較方法 —— 使用標準化收斂速度,定義為r/?1(t),其中 r 是式(4)中的收斂速度,t 是軌跡,?1是?1范數。在我們生成的公式中,57 個具有最佳標準化r值 1.76,例如軌跡 (-1, -1, 0) 對應的公式:
![]()
相比之下,我們的守恒矩陣場統一的現有最佳公式的標準化收斂速度為 0.88(方向 (1, 1, 2),見表 16)。詳見附錄 G.6。
![]()
圖 6:通過守恒矩陣場(CMF)實現的公式統一。從文獻中收集的眾多 π 公式被自動排列為三維守恒矩陣場中的軌跡,包括高斯、歐拉和布龍克爾勛爵的著名公式。統一公式及其標準形式的完整列表見表 16。每個聚類(大虛線圓圈)表示通過上邊緣關聯的公式,代表平行軌跡或重疊軌跡。每個聚類中心的數字是該聚類中所有公式的 δ 值。箭頭表示軌跡方向。注意,多個公式聚類可能具有相同的 δ 值但并非上邊緣相關,這表明 δ 相同是公式上邊緣相關的必要條件而非充分條件。
6 討論
6.1 局限性
目前,收集階段依賴于 LLM 解釋和上下文理解數學 LATEX 字符串的能力,這一階段可能導致公式分類中的數據丟失和假陰性。提示詞工程和驗證技術的改進將增強 LLM 應用的穩健性。隨著更先進 LLM 的出現,這一階段將變得更加可靠。
公式中通常包含求和指標以外的其他符號,例如公式周圍文本中定義的變量,這些變量應被提取并代入公式求值。我們手動進行了若干此類替換,以測試這些特殊情況下流程的其余部分。未來統一流程的改進可通過更先進的 LLM 應用和自動化驗證來解決這一局限性。
本研究分析的大多數公式是級數或連分數。然而,UMAPS 以及收集和聚類過程中的所有其他步驟具有更廣泛的適用性(適用于為給定常數生成有理逼近序列的任何公式,例如更高階遞推關系)。擴展系統以適應更多情況是未來工作的一個有前景的方向。
本文展示的統一流程可通過找到相應的守恒矩陣場 [58],應用于源自 D - 有限函數的大量常數。
6.2 展望
增加 π 的守恒矩陣場的維度和秩,以及進一步改進 UMAPS [2],有望在不久的將來提高公式的統一比例。計劃中的未來研究將利用守恒矩陣場系統搜索快速收斂和無理性證明公式。
展望未來,這種收集、分析和組織數學知識的方法有助于建立數學不同分支之間的嚴格關聯。本文提出的方法有助于開發更通用的框架,通過數學表示識別不同科學理論之間的關聯。隨著信息體量的加速增長,找到自動化的知識統一方法將變得越來越重要,尤其是在為復雜概念提供更直觀理解的目標下。
將 LLMs 與現有的和新穎的符號及數值數學工具相結合,實現了本文中的自動化發現。我們相信,這種 LLM - 工具集成方案將在未來幾年推動人工智能在數學和科學領域的發展。
致謝
本研究得到施密特科學有限責任公司的支持。
原文參考文獻
[1] Kunle Adegoke and Olawanle Layeni. The higher derivatives of the inverse tangent function and rapidly convergent BBP-type formulas. arXiv preprint arXiv:1603.08540, 2016.
[2] After this work was accepted, Jakob Obrovsky from the Research Institute for Symbolic Computation (RISC), Johannes Kepler University, proposed a stronger algorithm for finding coboundary equivalences. This algorithm will be published in a future work.
[3] Alberto Alfarano, Fran?ois Charton, and Amaury Hayat. Global lyapunov functions: a long standing open problem in mathematics, with symbolic transformers. In Advances in Neural Information Processing Systems (NeurIPS), volume 37, pages 93643–93670. Curran Associates, Inc., 2024.
[4] An interactive online demonstration of UMAPS and the matching algorithm is available at the following Google Colab link.
[5] arXiv.org submitters. Kaggle arXiv dataset, 2024.
[6] David Bailey, Peter Borwein, and Simon Plouffe. On the rapid computation of various polylog arithmic constants. Mathematics of Computation, 66, 05 1996.
[7] D.H. Bailey, R. Barrio, and J.M. Borwein. High-precision computation: Mathematical physics and dynamics. Applied Mathematics and Computation, 218(20):10106–10121, 2012.
[8] Daniel Barsky, Vicente Mu?oz, and Ricardo Pérez-Marco. On the genesis of BBP formulas. arXiv:1906.09629, 2019.
[9] Itay Beit-Halachmi and Ido Kaminer. The ramanujan library– automated discovery on the hypergraph of integer relations. In International Conference on Learning Representations (ICLR), 2025.
[10] N. Ben David, G. Nimri, U. Mendlovic, Y. Manor, C. De la Cruz Mengual, and I. Kaminer. On the connection between irrationality measures and polynomial continued fractions. Arnold Mathematical Journal, 10(4):529–566, 2024.
[11] Alexander I. Bobenko and Yuri B. Suris. Discrete Differential Geometry: Integrable Structure, volume 98 of Graduate Studies in Mathematics, chapter 6.2. American Mathematical Society, Providence, Rhode Island, first edition, 2008.
[12] Jairo Bochi, Yakov Pesin, and Omri Sarig. Complete regularity of linear cocycles and the baire category of the set of lyapunov-perron regular points. arXiv preprint arXiv:2409.01798, 2024.
[13] David M Bradley. Representations of Catalan’s constant, 2001.
[14] Tom Brown et al. Language models are few-shot learners. In Advances in Neural Information Processing Systems (NeurIPS), volume 33, pages 1877–1901. Curran Associates, Inc., 2020.
[15] D. V. Chudnovsky and G. V. Chudnovsky. The computation of classical constants. Proceedings of the National Academy of Sciences (PNAS), 86(21):8178–8182, 1989.
[16] Abhishek Dhar et al. How archimedes showed that π is approximately equal to 22/7. arXiv:2008.07995, 2020.
[17] Robert Dougherty-Bliss and Doron Zeilberger. Automatic conjecturing and proving of exact values of some infinite families of infinite continued fractions. The Ramanujan Journal, 61: 31–47, 2023.
[18] Pedro Duarte and Silvius Klein. Lyapunov Exponents of Linear Cocycles: Continuity via Large Deviations, volume 3 of Atlantis Studies in Dynamical Systems. Atlantis Press (Zeger Karssen), Paris, first edition, 2016.
[19] Saber Elaydi. An Introduction to Difference Equations. Undergraduate Texts in Mathematics. Springer Nature, New York, third edition, 2006.
[20] Rotem Elimelech, Ofir David, Carlos De la Cruz Mengual, Rotem Kalisch, Wolfgang Berndt, Michael Shalyt, Mark Silberstein, Yaron Hadad, and Ido Kaminer. Algorithm-assisted discovery of an intrinsic order among mathematical constants. arXiv preprint arXiv:2308.11829, 2023.
[21] Rotem Elimelech, Ofir David, Carlos De la Cruz Mengual, Rotem Kalisch, Wolfgang Berndt, Michael Shalyt, Mark Silberstein, Yaron Hadad, and Ido Kaminer. Algorithm-assisted discovery of an intrinsic order among mathematical constants. Proceedings of the National Academy of Sciences (PNAS), 121(25):e2321440121, 2024.
[22] Hasan Ferit Eniser, Hanliang Zhang, Cristina David, Meng Wang, Maria Christakis, Brandon Paulsen, Joey Dodds, and Daniel Kroening. Towards translating real-world code with llms: A study of translating to rust. arXiv preprint arXiv:2405.11514, 2024.
[23] Leonhard Euler. Introductio in analysin infinitorum, volume 2. 1748.
[24] Siemion Fajtlowicz. On conjectures of graffiti. In J. Akiyama, Y. Egawa, and H. Enomoto, editors, Graph Theory and Applications, volume 38 of Annals of Discrete Mathematics, pages 113–118. Elsevier, 1988.
[25] Alhussein Fawzi et al. Discovering faster matrix multiplication algorithms with reinforcement learning. Nature, 610:47–53, 2022.
[26] Helaman R. P. Ferguson, David H. Bailey, and Paul Kutler. A Polynomial Time, Numerically Stable Integer Relation Algorithm. Ames Research Center, 1998.
[27] Luyu Gao et al. PAL: Program-aided language models. In Proceedings of the 40th International Conference on Machine Learning (ICML), volume 202 of Proceedings of Machine Learning Research, pages 10764–10799. PMLR, 23–29 Jul 2023.
[28] Carl Friedrich Gauss. Werke, vol. 3, 1813.
[29] Zhibin Gou, Zhihong Shao, Yeyun Gong, Yelong Shen, Yujiu Yang, Minlie Huang, Nan Duan, and Weizhu Chen. ToRA: A tool-integrated reasoning agent for mathematical problem solving. In International Conference on Learning Representations (ICLR), 2024.
[30] Jesus Guillera. History of the formulas and algorithms for pi. arXiv preprint arXiv:0807.0872, 2008.
[31] Milad Hashemi et al. Can transformers do enumerative geometry? In International Conference on Learning Representations (ICLR), 2025.
[32] Pierre-Alexandre Kamienny, Stéphane d’Ascoli, Guillaume Lample, and Fran?ois Charton. End-to-end symbolic regression with transformers. In Advances in Neural Information Processing Systems (NeurIPS), volume 35, pages 10269–10281. Curran Associates, Inc., 2022.
[33] Manuel Kauers and Christoph Koutschan. Guessing with little data. In Proceedings of the 2022 International Symposium on Symbolic and Algebraic Computation, ISSAC ’22, page 83–90. ACM, July 2022.
[34] Walter G. Kelley and Allan C. Peterson. Difference equations: An introduction with applications. Harcourt/Academic Press, San Diego, CA, second edition, 2000.
[35] John R. Koza. Genetic programming as a means for programming computers by natural selection. Statistics and Computing, 4:87–112, 1994.
[36] Ernst Eduard Kummer. Eine neue Methode, die numerischen Summen langsam convergirender Reihen zu berechnen. Walter de Gruyter, Berlin/New York, 1837.
[37] L. J. Lange. An elegant continued fraction for π. American Mathematical Monthly, 106: 456–458, 1999.
[38] Aaron Meurer et al. Sympy: symbolic computing in python. PeerJ Computer Science, 3:e103, January 2017.
[39] Victor S. Miller. Use of elliptic curves in cryptography. In Hugh C. Williams, editor, Advances in Cryptology — CRYPTO ’85 Proceedings, pages 417–426, Berlin, Heidelberg, 1986. Springer Berlin Heidelberg.
[40] Alexander Novikov et al. AlphaEvolve: A coding agent for scientific and algorithmic discovery. Technical report, Google DeepMind, May 2025.
[41] OpenAI. GPT-4 technical report. arXiv preprint arXiv:2303.08774, 2023.
[42] ThomasJ.Osler. Lordbrouncker’s forgotten sequence of continued fractions for pi. International Journal of Mathematical Education in Science and Technology, 41(1):105–110, 2010.
[43] Rangeet Pan et al. Lost in translation: A study of bugs introduced by large language models while translating code. In Proceedings of the IEEE/ACM 46th International Conference on Software Engineering, ICSE ’24, New York, NY, USA, 2024. Association for Computing Machinery.
[44] Peter Paule and Carsten Schneider. Creative telescoping for hypergeometric double sums. Journal of Symbolic Computation, 128:102394, 2025.
[45] Marko Petkovsek, Herbert S. Wilf, and Doron Zeilberger. A=B. AK Peters Ltd, 1996.
[46] Gal Raayoni, Shahar Gottlieb, Yahel Manor, George Pisha, Yoav Harris, Uri Mendlovic, Doron Haviv, Yaron Hadad, and Ido Kaminer. Generating conjectures on fundamental constants with the ramanujan machine. Nature, 590, 2021.
[47] Alec Radford, Jeff Wu, Rewon Child, David Luan, Dario Amodei, and Ilya Sutskever. Language models are unsupervised multitask learners. 2019.
[48] Srinivasa Ramanujan. Modular equations and approximations to π. Quarterly Journal of Mathematics 45, 1914.
[49] Ofir Razon, Yoav Harris, Shahar Gottlieb, Dan Carmon, Ofir David, and Ido Kaminer. Automated search for conjectures on mathematical constants using analysis of integer sequences. In Proceedings of the 40th International Conference on Machine Learning (ICML), volume 202 of Proceedings of Machine Learning Research, pages 28809–28842. PMLR, 23–29 Jul 2023.
[50] Bernardino Romera-Paredes, Mohammadamin Barekatain, Alexander Novikov, et al. Mathematical discoveries from program search with large language models. Nature, 625:468–475,2024.
[51] Jean-Pierre Serre and P Ion. Galois Cohomology. Springer Monographs in Mathematics. Springer Berlin / Heidelberg, Berlin, Heidelberg, first edition, 1997.
[52] Michael Shalyt, Uri Seligmann, Itay Beit Halachmi, Ofir David, Rotem Elimelech, and Ido Kaminer. Unsupervised discovery of formulas for mathematical constants. In Advances in Neural Information Processing Systems (NeurIPS), volume 37, pages 113156–113190, 2024.
[53] J. Stoer and R. Bulirsch. Introduction to Numerical Analysis, chapter 2.2. Springer, third edition, 2002.
[54] Zhi-Wei Sun. New series for powers of π and related congruences. arXiv:1911.05456, 2019.
[55] Yiming Tian, Wei Zhou, Matteo Viscione, et al. Interactive symbolic regression with co-design mechanism through offline reinforcement learning. Nature Communications, 16:3930, 2025.
[56] Trieu H Trinh, Yuhuai Wu, Quoc V Le, He He, and Thang Luong. Solving olympiad geometry without human demonstrations. Nature, 625(7995):476–482, 2024.
[57] Mark van Hoeij. Factoring linear recurrence operators, 2019.
[58] Shachar Weinbaum, Elyasheev Leibtag, Rotem Kalisch, Michael Shalyt, and Ido Kaminer. On conservative matrix fields: Continuous asymptotics and arithmetic. arXiv:2507.08138, 2025.
[59] Eric Zelikman, Qian Huang, Gabriel Poesia, Noah Goodman, and Nick Haber. Parsel: Algorithmic reasoning with language models by composing decompositions. In Advances in Neural Information Processing Systems (NeurIPS), volume 36, pages 31466–31523. Curran Associates, Inc., 2023.
[60] Yi Zhou. Algorithms for Factoring Linear Recurrence Operators. PhD thesis, Florida State University, 2022.
[61] Wenhao Zhu et al. Multilingual machine translation with large language models: Empirical results and analysis. In Findings of the Association for Computational Linguistics: NAACL 2024, pages 2765–2781, Mexico City, Mexico, June 2024. Association for Computational Linguistics.
參考資料
https://arxiv.org/abs/2502.17533
https://neurips.cc/virtual/2025/loc/san-diego/poster/117099
https://github.com/RamanujanMachine/euler2ai
https://www.scientificamerican.com/article/mathematicians-find-one-pi-formula-to-rule-them-all/
https://www.pnas.org/doi/10.1073/pnas.2321440121
小樂數學科普近期文章
·開放 · 友好 · 多元 · 普適 · 守拙·![]()
讓數學
更加
易學易練
易教易研
易賞易玩
易見易得
易傳易及
歡迎評論、點贊、在看、在聽
收藏、分享、轉載、投稿
查看原始文章出處
點擊zzllrr小樂
公眾號主頁
右上角
置頂★加星
數學科普不迷路!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.