![]()
新智元報道
編輯:定慧
【新智元導讀】菲爾茲獎得主陶哲軒在斯坦福演講后宣布改變個人工作習慣:不再試圖實時跟進所有新證明。AI生成證明的速度已經遠超人類消化能力,數學正在被自己的產出撐爆。
陶哲軒,公開演講承認AI已徹底改變數學工作流。
周三,這位菲爾茲獎得主在斯坦福大學發表了一場題為《新數學工作流》的演講。
![]()
然后在Mathstodon上寫下一條公告:
他要改變自己的工作習慣,不再試圖實時跟進所有新證明。
![]()
一個每年審閱上百篇論文的數學家,親手給自己按下了暫停鍵。
原因不是他老了,不是他累了,而是一個他親眼看著成形的事實:
AI生成數學證明的速度,已經遠遠超過人類消化證明的速度。
數學正在被AI撐爆。
證明,不再稀缺了
陶哲軒在演講開頭就甩出了一個判斷:
數學正在經歷其他科學領域早已經歷過的那場革命。
生物學有基因測序爆炸、天文學有望遠鏡數據洪流,每個學科進入「數據豐裕」時代之后,都被迫重建自己的工作流程。
AI時代,數學的版本是:證明豐裕。
幾千年來,數學一直活在「證明稀缺」的年代。
看一眼數學論文的署名傳統就知道——其他學科早已習慣10人、20人、50人合著的常態,數學一百年來還卡在1-2人。
陶哲軒在演講里直接放了一張對比圖,那條幾乎貼地的線就是數學。
![]()
為什么數學這么獨?因為證明很貴。
一篇定理的誕生需要幾年甚至幾十年——Andrew Wiles關了自己7年才證完費馬大定理。
![]()
在那個稀缺時代,「誰第一個走出帳篷」就是最自然的衡量標準。
你給他一切——榮譽、教職、獎項、定理的署名權。
這套激勵運轉得非常好,因為它和「推動整個數學社區進步」的目標基本對齊:
第一個走出來的人,通常也是把這件事講清楚的人。
一個猜想懸在那里幾十年,全世界最聰明的腦袋輪番上陣,能解出來就是載入史冊的事件。
整個學科的激勵體系、榮譽體系、評價體系,全部建立在這個稀缺性之上。
現在稀缺性正在被AI抹掉。
陶哲軒舉了一個很具體的例子。
Erd?s問題網站——數學界最著名的未解難題清單之一,目前已經有大約20篇AI輔助解題方案處于積壓待審狀態。
提交者自己坦言:根本沒有時間手動驗證。
![]()
不是沒人想看,是看不過來。
陶哲軒把這比作19世紀的汽車困境——車的速度越來越快,但當時的道路系統根本承載不了。
結果不是交通更快了,而是交通更堵了。
AI是能生成數學難題的證明。
![]()
但證明堆在那里沒人消化,等于什么都沒證明。
數學家的工作流,被AI切成了三段
陶哲軒在演講里把數學的生產過程拆成三步。
第一步,proof generation,證明生成。
AI現在已經在批量產出。
GPT-5.5、Claude Opus 4.7、專門做形式化數學的求解器,一夜之間能涌出幾十條新證明。一年前還是驚喜的事情,現在變成生產線日產。
第二步,verification,證明驗證。
Lean、Coq這一類形式化驗證工具大半年迭代一次。
AI加Lean讓驗證流程半自動化,審稿人不再需要一行一行手算每個引理。
GPT-5.2解Erd?s#728那次,驗證環節由工具Aristotle自動完成,陶哲軒本人只在終點確認了一下。
第三步,digestion,消化與理解。
現在,完全空白。
沒有任何工具能幫數學家把機器證完的東西轉化成人類讀得懂的洞察。
一條證明被形式化驗證為正確,和這條證明對數學家有用,是兩回事。
前兩階段越快,第三階段越追不上。
更要命的是,目前學術界沒有任何成型的方法論,讓數學家批量消化AI產出的證明。
每天審稿郵件里塞滿Lean驗證過的新證明,能讀的人就那么多。
![]()
陶哲軒說了一句被現場反復引用的話:
數學的本質,不是積累正確證明的數量,是讓人類理解這個世界為什么是這樣運行的。
機器解出#1196是一回事。
陶哲軒親自從Price的證明里提煉出向下馮·曼戈爾特鏈這種新概念、再把它擴展成新理論,是另一回事。
前者AI可以包圓。
后者目前還得人來做。
而且越來越沒人做得過來。每天幾十條新證明涌出來,能讀懂的數學家就那么多。
瓶頸不在生產端,在閱讀端。
技術正確,但沒人理解
真正讓陶哲軒警覺的,不是AI生成證明的速度,而是AI生成的證明長什么樣。
他在演講中做了一個關鍵區分:數學研究有兩類目標。
第一類是顯性目標——證明某個定理、解決某個猜想。寫在論文標題里的那種。
第二類是隱性目標——弄清楚這個證明和已有文獻的關系,發現后續的自然問題,提煉新的技術手段,理解核心困難在哪里,以及最重要的:讓做這個研究的人本身變得更強。
過去幾百年里,這兩類目標從來不需要分開討論。
因為當一個人類數學家解決一個問題時,隱性目標是自動完成的——你不可能在證明過程中不了解文獻、不發現新問題、不訓練自己的直覺。
AI把它們拆開了。
AI可以在技術層面解決顯性目標,給出一個邏輯上正確的證明。但它生成的證明不引用已有文獻,不突出核心思想,不啟發后續研究,不幫任何人變得更聰明。
用陶哲軒的表述:這種證明技術上正確,但與數學的真正進步目標脫節。
一道題被AI解了,但數學界對這道題的理解沒有增長一毫米。
這就像一個學生在考試里拿了滿分,但走出考場什么都沒學到。
古德哈特定律發作了
陶哲軒在演講里搬出了一個經濟學概念:古德哈特定律。
一個學術界耳熟能詳的名字——Charles Goodhart,1975年提出那條以他名字命名的定律:
當一個衡量標準變成目標,它就不再是好的衡量標準。
![]()
這條定律過去50年發作過無數次:
KPI文化下的銷售作假
Twitter算法把互動變成目標,結果催生了憤怒經濟
學術影響因子(h-index)被刷成了產業鏈
數學曾經是少數沒被它擊穿的領域。
當一個衡量標準變成目標時,它就不再是一個好的標準。
翻譯到數學界:「誰第一個證明了這個定理」,曾經是衡量數學進步的好指標。
因為在證明稀缺的年代,能第一個證明的人,一定深入理解了問題,一定推進了數學的前沿。
顯性目標和隱性目標完全對齊。
AI讓這個對齊崩了。
第一個證明的速度可以被無限加速,但理解不能。
當整個社區開始無限制地卷「證明速度」,這個指標就和真正的數學進步脫鉤了。
繼續按舊規則玩,不僅不創造進步,反而在多方面阻礙數學的發展。
陶哲軒的建議很明確:停止對「誰是第一個解決某個未解難題」的過度執著。
把錦標賽式的極限優化引導到更受控的方向——比如專門為重度使用AI而設計的數學競賽工作流,讓競速歸競速,讓理解歸理解。
菲爾茲獎得主親手給數學界的舊游戲規則判了緩刑。
數學是預告片
把視線從數學拉遠一步。
陶哲軒描述的這個困境——AI產出速度遠超人類消化速度,顯性目標和隱性目標被強行解耦——不是數學獨有的。
代碼可以被AI大量生成,但沒人review。
論文可以被AI批量寫出,但沒人讀。
診斷可以被AI秒出,但醫生來不及理解推理過程。
每一個知識密集型行業,都在走向同一個岔路口:產出在爆炸,理解在停滯。
陶哲軒在演講中反復強調一句話:數學不只是一堆互不相關的定理的集合,它上面有一整套系統。
證明是磚。但建筑不是磚堆。
當AI能無限供應磚塊的時候,建筑師比磚匠更重要。
問題是,連建筑師都快被埋在磚堆下面了。
陶哲軒選擇不追了。
![]()
不是追不上,而是他發現,追本身正在成為問題。
錦標賽燈光熄了,劇場剛剛開門
陶哲軒在演講最后,留下一個具體的提議。
為AI重度使用設計專門的數學競賽。
評判標準不再是「誰先證出來」,是誰的證明體系最有解釋力、誰的形式化最干凈、誰能推動整個領域消化某個突破。
![]()
這句話的潛臺詞很明白:獎項、期刊、招聘評價——所有建立在證明稀缺時代之上的制度,都要重做。
數學不是被AI終結的第一門學科。
但它是第一門由頂級專家親手宣告規則失效的學科。
物理、化學、生物大概率會跟上。
千年來,數學家比誰先證出來。
從今天起,比的是誰更能讀得懂AI的證明。
參考資料:
https://www.youtube.com/watch?v=Uc2zt198U_U
https://mathstodon.xyz/@tao/116569989993991669
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.