★置頂zzllrr小樂公眾號,追蹤《小樂數學科普》系列報道!
AI可以幫助我們發現有趣的數學嗎?今年JMM2026數學聯合會議首日喬迪?威廉姆森(Geordie Williamson)的案例分享。
![]()
作者:喬迪?威廉姆森( Geordie Williamson,悉尼大學)2026-1-4
譯者:zzllrr小樂(數學科普公眾號)2026-5-27
求喜歡
主持人:拉維?瓦基爾(Ravi Vakil)
各位好。我是拉維?瓦基爾,AMS美國數學會主席。
學術報告會是美國數學會會議中歷史最悠久的系列講座,首次舉辦于1896年,也就是學會的第二次會議。主講者堪稱數學界的群星璀璨。我本想列出五六位最知名的學者,但遺漏任何一位都會顯得不妥。因此我建議大家上網查閱這份主講人名單,而今天的演講者也正式加入了這份名單 —— 來自悉尼大學的喬迪?威廉姆森(Geordie Williamson)。
他在數學領域成果豐碩,包括與貝尼亞萊斯共同證明圓周猜想、發現反駁利斯特猜想的反例,以及與喬治?利斯特格共同提出比爾猜想。他曾獲得克雷研究獎、英國皇家學會會士、高等研究院杰出訪問教授席位,并在國際數學家大會上作全會報告。他是一位真正的數學家,研究興趣與貢獻極為廣泛,本次系列講座便充分體現了這一點。
他跟我講過這樣一段經歷:2018年,喬迪與谷歌DeepMind首席執行官德米斯?哈薩比斯同年當選英國皇家學會會士。當選儀式持續三天,茶歇期間兩人多次長談,這徹底改變了喬迪對人工智能的看法。回到悉尼后,兩人仍持續交流,最終促成了喬迪與DeepMind的合作研究。
現在,讓我們聆聽喬迪本人的分享。有請喬迪?威廉姆森。
(掌聲)
![]()
演講人:喬迪?威廉姆森( Geordie Williamson)
非常感謝拉維。同時感謝美國數學會與學術報告會委員會給予我這次演講機會,這是一份真正的榮譽。也感謝你們讓我來到這里,與老友重逢,感受世界這一側的生活。昨天我可算是真切體會到華盛頓特區距離悉尼有多遠。
(笑聲)
我是一名數學家,自幼便對計算機及其能力邊界充滿興趣。過去十年間,我尤其著迷于計算技術能為數學帶來什么,特別是人工智能對數學的作用與局限 —— 這也正是本次系列講座的主題。
![]()
在開始之前,我想先說明:當下對許多數學家而言,人工智能領域的快速發展正帶來一段充滿挑戰的時期。如今是2026年,回望2016年DeepMind的系統擊敗了世界頂尖圍棋棋手,那一刻許多人意識到神經網絡正在發生非同凡響的突破。而過去十年,相關能力迎來了驚人的加速發展。
尤其是ChatGPT這類大語言模型,對教育乃至整個社會產生了巨大影響。對數學家而言,這種沖擊尤為直觀:我從未參加過國際數學奧林匹克競賽,也絕不可能拿到金牌,但就在今年,多個實驗室的AI系統在國際數學奧林匹克競賽中取得了金牌成績。
作為數學家,面對這一切難免會困惑:究竟發生了什么?我們該如何應對?
![]()
我想用一頁內容說明我對此的態度。首先,我認為我們不應僅以無知與恐懼回應。我并非說無知不可取 ——(笑聲)我剛才口誤了。我本人也時常無知,偶爾會感到擔憂,但我認為我們也可以帶著興趣與樂觀看待這些發展。這并非硅谷式的盲目樂觀,認定一切都會順利,而是主動關注、認真了解這些技術,這本身就是重要的態度。
我不斷提醒自己:數學在兩千年間不斷帶來驚喜,未來必然還有更多。我們應當認真對待這些工具,它們為我們提供了理解數學世界的全新潛力 —— 這是我的基本信念。
但我也清楚,這并非只是象牙塔內的事。如果只按個人意愿,我會樂于用先進系統解決數學問題。但這些技術對整個世界意義重大,我們必須正視并積極參與。作為學術共同體,我們需要謹慎前行。
我先講到這里。接下來用一頁簡要介紹當前數學與人工智能領域的整體態勢,為本次講座定位。
![]()
神經網絡在應用數學中已發揮巨大作用,多年來皆是如此;但到目前為止,對純數學的影響明顯更小。與此同時,證明輔助工具迅速興起,例如 Lean、Isabelle 等,計算機可以檢驗證明是否正確,就像驗證程序能否編譯一樣 —— 編譯通過即證明正確。
自動證明的實現仍有距離,這也是當前人工智能與數學創業公司的主要方向。大語言模型開始對研究級數學產生影響,我會在講座末尾適當討論。此外,數學在人工智能討論中占據重要位置,大家可能好奇為何外界突然關注數學,簡單來說,他們并非真正關心數學本身,而是數學像編程一樣,是評估人工智能系統的優質基準。
![]()
本次系列共有三場講座,我盡量讓它們相對獨立。今天的主題是用人工智能發現數學;明天,我雖非機器學習理論專家,但這一理論極具魅力,我會概述當前對神經網絡數學基礎的理解,這會以有趣的方式略微改變我們對數學的認知;周二的講座則是我過去兩年密集研究的工作 —— 利用神經網絡進行海量搜索。
![]()
回到今天的內容。我先極簡介紹機器學習與神經網絡,不會占用太多時間,隨后詳細講解三個案例,我認為這些案例中機器學習與人工智能方法真正催生了有趣的新數學 —— 并非解決重大猜想,但作為數學家,我認為這些成果真實而迷人。
前兩個案例使用極低資源的人工智能,筆記本電腦即可運行;第三個則用到大語言模型。周二的第三場講座會聚焦資源更少、但人工智能技術更復雜的案例,最后簡要反思數學與人工智能的現狀。
![]()
簡單說明什么是機器學習與神經網絡,僅作直觀描述。用一句話概括機器學習:不妨把它看作人類的感知任務。比如看到一張老虎的圖片,我們立刻知道那是老虎,這種感知任務毫不費力,但在機器學習出現之前,計算機極難實現。這類函數通常是高維的,右側的老虎圖片有約兩百萬像素,我們看到圖片時,相當于在感知一個兩百萬維向量空間中的向量,并立刻賦予其意義,這本身就很了不起。
在我看來,機器學習的核心意義之一,是應對超高維空間中特有的難題,這些技術正是為處理這類問題而生。大家都應了解一些基礎方法,比如回歸分析、主成分分析,我們稍后會提到;而神經網絡則提供了另一種途徑 —— 簡單來說,神經網絡是在高維空間中逼近函數的工具。
![]()
![]()
舉個最佳擬合線的例子,想象這些點云位于極高維空間,這條線是我試圖逼近的超曲面,這能粗略反映其原理。即便在高維空間,這也可能帶來洞察。我有個做金融的朋友說,我總跟他講數學,但他除了每天做回歸分析,根本用不到其他數學。
![]()
![]()
而神經網絡,可以理解為在高維空間中以非線性方式逼近函數。大家看到的是神經網絡訓練過程,它在逼近數據集,并期望能泛化到未見過的數據。
如我所說,第二場講座會更詳細講解神經網絡。現在進入三個數學問題。
案例1:Bruhat圖、Kazhdan-Lusztig多項式、組合不變性
第一個是我們幾年前的工作,涉及一個重要猜想 ——組合不變性猜想,與多項式和一類特殊的有向圖有關。我先描述這個圖,再說明人工智能方法如何介入。
![]()
這個圖叫作Bruhat圖。我們取一個置換,即對 1 到 n 的重排,是從 1 到 n 到自身的雙射。置換的長度是逆序個數,恒等置換長度為 0,完全逆序置換的長度為 n選2(組合數)。圖中列出了 n=3 的所有置換,按長度分層:恒等置換在最下方,依次是長度 1、2、3 的置換。我們可以由此構建群的圖,兩個群元素相連當且僅當一個可通過對換(交換兩個元素)得到另一個。從恒等置換可以到達交換相鄰元素的置換,這些是邊。
單看長度和Bruhat圖本身并不復雜,但結合起來就成為非常有趣的對象。我們給邊加上方向,依據是長度是否增加,這就導出對稱群上的Bruhat序,是非常重要的序結構。若在Bruhat序中有 x≤y,我們可以取誘導子圖,得到這個區間的Bruhat圖。許多有趣的圖都能作為Bruhat序的子圖出現。比如 n=3 的例子比較平凡,但 n=4 時圖就相當復雜,其中還包含類似八面體的有趣結構。
![]()
組合不變性猜想是Dyer和Lusztig在1980年代發現的:對兩個置換,若對應的Bruhat圖相同,那么相應的卡扎丹–盧斯蒂格多項式也相同。這一現象至今沒有完整解釋。
![]()
他們由此提出猜想:若圖相同,則多項式相同;強版本則是可以直接從圖推導出多項式。
![]()
面對這個問題,我們有大量例子可算,但圖會迅速變得極其復雜,多項式則是對結構的高度凝練 —— 多項式長期保持簡單,要看到復雜行為必須研究極復雜的例子。我越研究這個問題,越覺得從圖到多項式的映射本應很簡單,只是我們尚未找到。
我們從人工智能角度如何入手?我與DeepMind合作訓練了圖神經網絡,輸入Bruhat圖,預測卡扎丹–盧斯蒂格(Kazhdan-Lusztig)多項式。我們使用的是圖神經網絡,而非全連接網絡,圖結構決定神經網絡的結構。
當時我剛接觸神經網絡,很驚訝的是,我們只用了大約一周就整理好軟件、生成圖與多項式的數據集。DeepMind的一位研究員佩塔?維利奇科維奇開始運行圖神經網絡,很快就達到了很高的準確率 —— 這說明預測多項式本應很容易,只是我們不知道方法。
![]()
但隨之而來的是一個難題:神經網絡顯然抓住了某種規律,可我們不知道它抓住了什么,這就是可解釋性問題,極其困難。我們只能不斷嘗試,最終 DeepMind 的另一位研究員發現了一個關鍵模式:圖中某些邊對神經網絡的預測格外重要。
這對我而言是極重要的線索,作為數學家,我能看懂神經網絡關注的這些邊的意義。憑借這條線索,我們最終給出了基于Bruhat圖的卡扎丹–盧斯蒂格多項式新公式。
簡單來說,公式需要做一些選擇,其中一種選擇能給出正確結果,但我們至今仍未能證明所有選擇都給出相同答案。(輕笑)
但這被視為組合不變性猜想的重要進展。
時間線大致是:前兩周完成數據與訓練,兩個月得到關鍵線索,七個月得出公式。在這個案例中,數學家仍承擔大量核心工作,但神經網絡提供了決定性線索。
![]()
最近,這個公式已被其他研究者沿用,其中一篇論文給出了組合不變性猜想目前最好的無條件結果,這令人十分欣慰。
案例2:橢圓曲線與椋鳥群飛現象(murmuration)
第二個主題是橢圓曲線與椋鳥群飛現象(murmuration),這是數論中令我興奮的最新進展。
![]()
我們從有理數域上的橢圓曲線開始,屬于丟番圖幾何,研究方程的有理數解,這一問題極其困難。有理數解構成有限生成阿貝爾群,這是莫德爾–韋伊(Mordell-Weil)定理。有限生成阿貝爾群可分解為撓部分與自由部分,撓部分相對容易計算,而確定秩是丟番圖幾何的核心難題。
一個簡單的操作是對素數 p 取模,計算模 p 解數。小素數時可直接枚舉,大素數也可高效計算,于是得到一列數:對所有素數 p,模 p 解的個數。
![]()
伯奇(Birch)和斯溫納頓–戴爾(Swinnerton-Dyer)在1960年代發表了極具影響力的論文,提出局部–整體啟發式原則:若對大多數素數 p,曲線有異常多的點,那么它應有很多有理點。嚴格化這一想法,就引出伯奇 – 斯溫納頓–戴爾(BSD)猜想,是七大千禧年難題之一。
現在我們從數據科學與機器學習視角看待它:把橢圓曲線看作高維空間中的點,坐標就是這些模 p 計數,做一點標準化處理,使其均值為 0,這在數據科學中是很自然的處理方式。
![]()
令人驚嘆的是,嚴肅對待這一高維空間中的點,讓李(Kyu-Hwan Lee)、奧利弗(Thomas Oliver)、波茲尼亞科夫(Alexey Pozdnyakov)等人發現了椋鳥群飛現象,這是極重要的觀測結果。詳情參閱
橢圓曲線有一個導子(conductor),是與其關聯的整數,衡量曲線的復雜程度,非常精細的不變量。p 整除導子當且僅當曲線模 p 奇異。從數據科學角度研究橢圓曲線,應固定導子范圍,查看該范圍內所有橢圓曲線。![]()
他們計算了給定秩的所有橢圓曲線的標準化系數平均值,發現了驚人的模式,稱之為“椋鳥群飛murmuration”—— 如同鳥群在空中協同飛舞,由此得名。這一發現引發數論界的大量研究,此前完全被忽略。
如果以正確的方式看待,橢圓曲線可以像鳥一樣成群。 視頻:Paul Chaikin | Quanta Magazine
這件事有幾點值得注意:它源于用序列預測秩的研究,很多人包括我最初認為這在數論上是顯然的,但我忽略了一點:它的精度高得驚人,深究精度來源才發現椋鳥群飛現象。
這或許是一個教訓:如果神經網絡表現異常好,我們應全力探究原因。按導子排序至關重要,沒有導子與整理好的橢圓曲線列表,就看不到這一現象,而這些數據正是由LMFDB數據庫提供的。這一數據庫精心整理了數論信息,想要驗證猜想,直接下載數據即可開展實驗。
![]()
由此得到一個更普遍的啟示:若想在其他領域復現這類成果,應尋找那些投入大量精力生成高質量數據、但尚未從機器學習角度系統分析的領域。當然,這一切建立在算術幾何領域長期艱苦的工作之上。
![]()
案例3:通過AlphaEvolve Bruhat圖和超立方體
第三個案例,我再次強調:前兩個案例都使用非常基礎的機器學習技術,圖神經網絡不算簡單,但也不算特別尖端;椋鳥群飛現象用到的更是最基礎的人工智能方法 —— 回歸與主成分分析。我記得亞歷克西斯跟我說,他父親是統計學教授,聽說用AI做出重大成果覺得很轟動,結果發現不過是回歸和主成分分析,覺得很有趣。(笑聲)
現在我們進入更前沿的系統,使用最先進的大語言模型,我要介紹的是AlphaEvolve系統,由DeepMind開發,是此前FunSearch系統的升級版。其核心思想是:用大語言模型生成大量可能的Python程序,這些程序能生成有趣的數學對象。
![]()
假設我們要找一個具體的數學對象,比如100個頂點、無4-圈且滿足七個條件的圖,或有限域上向量空間的某個子集。直接給出對象很困難,比如鄰接矩陣、點列表等;但數學家通常的做法是給出構造方法,而非對象本身。
在很多具體問題中,Python程序本質上就是構造方法 —— 精確描述如何生成對象。而大語言模型非常擅長寫 Python 代碼,因此我們可以在程序空間中搜索。
![]()
換個角度理解:傳統局部搜索在圖空間中進行,有點分函數,有局部移動(增刪頂點、邊);而FunSearch與AlphaEvolve是在Python程序空間中做局部搜索。沒有大語言模型,談論兩個程序的距離沒有數學意義,但有了大語言模型,就可以精確定義距離,并讓模型生成鄰近程序。
![]()
這也可以類比遺傳算法:保留一批好的構造,隨機選擇一些進行 “雜交”,篩選優秀后代,不斷迭代。在這里就是告訴大語言模型:這里有五個在該問題上得分高的程序,再生成一些類似的,自動評估并迭代。
回到Bruhat圖,兩個月前我們有一個令人興奮的結果。這是一個隨機問題,源于一些研究動機,我理解并非所有人都像我一樣喜歡Bruhat序。問題是:對稱群的Bruhat序中最大的超立方體是什么?我們不知道答案。
![]()
我研究這個問題的動機之一,是 S? 中存在一個神秘的超立方體,我十多年來一直無法理解其來源。我們面對一個大圖,尋找高度結構化的特殊子圖。我們讓Python程序生成區間的上下界置換,運行程序得到兩個置換,對應一個子圖,用d不變量打分,衡量其與超立方體的相似程度。
AlphaEvolve 在很多問題上效果平平,只能給出平凡答案,但在這個問題上出現了令人驚喜的突破。
![]()
使用方式就像提示大語言模型:扮演組合代數與組合優化專家,完整提示長度大約是這里的三倍,可以給出提示。亞當?瓦格納做過大量這類實驗,他堅信心理激勵至關重要,總是對模型說 “你可以的,我相信你”,給模型信心。
![]()
程序跑一整晚,早上就能得到有趣結果。我們得到的程序不長,運行后能對所有n生成區間上下界,對應Bruhat序中的子圖。測試后發現,它在遠超測試范圍的n上依然成立 —— 這極不尋常。根據我的經驗,AlphaEvolve 通常只會在指定范圍內優化,超出范圍就失效,但這次沒有,說明確實發現了有趣結構。
我們花了一天時間運行、檢驗、觀察例子,確認它抓住了關鍵規律,但程序本身比較復雜。如果有人直接給你一個程序,問你它在數學上做了什么,并不容易回答。
喬丹發來一封很棒的郵件指出:當n取2的冪時,程序變為確定性,行為清晰可辨。憑借這一觀察,我們反編譯了程序的邏輯,發現了Bruhat序中一類優美的結構:一類特殊置換構成巨大而漂亮的超立方體,恰好對應我十多年來想理解的 n=4 時的怪異超立方體。
![]()
這是一個不大的結果,但令人非常滿足。
![]()
我必須強調:人們常批評數學人工智能領域只講成功、不提失敗。我明確說明:這種方法通常不奏效,但偶爾會成功,而這種偶爾的成功就很有價值,有點像數學研究本身 —— 通常不順利,但偶爾成功就足夠令人滿足。
效果究竟如何?博格丹?喬加諾、陶哲軒與亞當?瓦格納有一篇論文,在67個問題上測試了該系統,涉及分析、組合、幾何、數論等領域。我必須強調,這些并非重大公開難題,大多是改進不等式常數、優化圖構造等增量式進展,但這篇論文是對系統有效性與適用場景的重要研究。
![]()
這是陶哲軒博客公布的結果:綠色代表改進已知界,紅色代表變差,灰色是未改進或僅得到已知結果。
這是我第一次見到,在數學人工智能層面,絕大多數數學家都能在某些問題上有效使用的工具。
![]()
作為這項工作的衍生成果,陶哲軒在11月將兩篇論文掛到arXiv,憑借他對問題的理解結合AlphaEvolve,改進了若干數學定理,方式與我剛才講的超立方體例子類似。我相信未來會出現更多這類論文,這一切都還非常新。
以上是三個案例,最后我簡要談談數學人工智能的更廣泛背景。
數學人工智能的更廣泛背景
首先是近期挑戰。第一個挑戰:技術發展太快,我們來不及建立相應的學術文化,這是非常大的問題。我們必須規范資源使用報告,我剛才沒有說明AlphaEvolve的資源消耗,因為我還不習慣這么做。順便一提,我們大概用了50美元的算力額度。
![]()
還有大量關于如何規范使用的重要問題。另外,這類工作需要一套特殊技能,純數學家并不熟悉,我們必須讓學生了解這個領域、學會與之互動。跨學科性也帶來諸多困難,我想提及卡內基梅隆大學(CMU)新成立的美國國家科學基金會(NSF)研究所 ICARM(數學計算機輔助推理研究所),其使命之一就是降低這類跨學科工作的門檻。
![]()
更廣泛地說,我很欣賞邁克爾?哈里斯關于數學與人工智能的博客,他的觀點與我的樂觀形成平衡。我認為必須記住一個事實:工業界的人工智能實驗室的首要動機并非學術好奇心,我有時會忽略這一點。
我也承認,共同體中部分成員對此極為擔憂,我并非其中一員 —— 我熱愛這項工作,熱愛與計算機合作,但有些人并非如此,他們的擔憂應當被傾聽與重視。
我們共同體的基本誠信是最寶貴的資產。當下我們談論人工智能時,聽眾不僅限于數學家,這一點至關重要。人工智能研究者非常重視數學家的評價,因為我們擁有扎實的學術操守,而這份操守必須堅守。
![]()
總結來說,我主張謹慎地參與人工智能,而非排斥。我認為我們能做出獨特貢獻。我展示了三個案例,其中機器學習與人工智能真正帶來了我作為數學家能夠欣賞的有趣新數學,這份清單還會繼續增長。
![]()
數學人工智能尚處于起步階段,我個人對未來幾年的發展充滿期待。
謝謝大家。
(掌聲)
Q&A問答環節
主持人:這場演講極具啟發性,我們還有少量時間提問。過道設有麥克風,有問題的聽眾可以上前。
問:您提到用神經網絡理解Python程序空間,進而探索該空間。這很有前瞻性,我想請問您是否考慮過用神經網絡、人工智能理解定理的證明空間?MathOverflow曾有討論:如何判斷兩個定理證明本質相同或不同?您認為您提到的工具能否幫助這類問題?
答:這是非常有趣的問題。從形式上看,如果你相信證明可以用 Lean 證明近似,那么證明空間就可以被賦予幾何結構 —— 大語言模型可以給出證明之間的距離概念。我對這個空間的拓撲沒有任何理解,但相關問題非常有趣。
我看過一個很有啟發性的工作:蒂姆?高爾斯在某次學術研討會上提到,緊性這類關鍵概念就像證明空間中的局部極小值。我們在基礎分析中卡殼的很多問題,突破口就是緊性,它幫我們跳出局部極小。這個觀點很有說服力,如果你對這個方向感興趣,值得一看。
問:在椋鳥群飛現象的圖中,紅色和藍色分別代表什么?
答:抱歉沒說明,紅色是秩 0,藍色是秩 1。
問:您對剛入學的研究生有何建議,在人工智能時代如何培養數學素養?
答:我最直接的建議是:了解并動手嘗試這些工具。我要求我的學生掌握 git,會訓練簡單神經網絡,會用AI編碼快速檢驗例子。除此之外,我沒有統一答案,這個問題值得研討會上所有人討論。
問:您如何看待將人工智能用于化學、核物理、醫學等其他領域?相關倫理討論很多,您的看法是?
答:我很難超越數學研究者的身份回答。(笑聲)但我可以說,這些都是重大問題。一個基本點:我們可以證明軟件正確,這正是形式化證明的動機之一。如果能生成證明,就能生成驗證過的軟件,這類軟件可以安全用于核電站等關鍵場景。
當前的人工智能大多是預測模型,會犯錯;但形式化驗證的軟件則不同。我只能說這些。
問:您如何看待Lean的可靠性問題?有人擔心AI,尤其是強化學習,會利用Lean的漏洞生成虛假證明,因此主張換用其他證明系統。
答:AI “作弊” 是事實,只要有漏洞,AI就會利用,我見過無數次。但人們對Lean內核的可靠性信心非常高。當然必須小心定義本身是否正確—— 定義無法形式化驗證,模型可能通過錯誤定義 “證明” 任何結論,比如直接把納維–斯托克斯方程定義為零。
主持人:這場講座非常精彩,期待大家參加后兩場。再次感謝威廉姆森教授。
參考資料
https://www.youtube.com/watch?v=0Tgftb5ELvE
https://www.youtube.com/watch?v=5LDagOaWZnw
https://www.youtube.com/watch?v=hVIBiwWWaqM
小樂數學科普本月文章
小樂數學科普歷年合集
版權聲明:本文首發于微信公眾號“zzllrr小樂”的專欄《小樂數學科普》。歡迎個人轉發。如需轉載,請在“zzllrr小樂”公眾號后臺回復“轉載”,還可通過公眾號菜單、發送郵件到zzllrr@gmail.com與我們取得聯系。相關圖文音視頻內容默認遵守CC BY-NC 4.0知識共享協議,未獲作者和譯者授權,禁止用于營銷宣傳和商業目的。
·開放 · 友好 · 多元 · 普適 · 守拙·
![]()
讓數學
更加
易學易練
易教易研
易賞易玩
易見易得
易傳易及
歡迎評論、點贊、在看、在聽
收藏、分享、轉載、投稿
查看原始文章出處
點擊底部一起捐
助力騰訊公益
點擊zzllrr小樂
公眾號主頁
右上角
置頂★加星
數學科普不迷路!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.