无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

陶哲軒:千年數學規則被AI按下重啟鍵

0
分享至


新智元報道

編輯:定慧

【新智元導讀】菲爾茲獎得主陶哲軒在斯坦福演講后宣布改變個人工作習慣:不再試圖實時跟進所有新證明。AI生成證明的速度已經遠超人類消化能力,數學正在被自己的產出撐爆。

陶哲軒,公開演講承認AI已徹底改變數學工作流。

周三,這位菲爾茲獎得主在斯坦福大學發表了一場題為《新數學工作流》的演講。


然后在Mathstodon上寫下一條公告:

他要改變自己的工作習慣,不再試圖實時跟進所有新證明。


一個每年審閱上百篇論文的數學家,親手給自己按下了暫停鍵。

原因不是他老了,不是他累了,而是一個他親眼看著成形的事實:

AI生成數學證明的速度,已經遠遠超過人類消化證明的速度。

數學正在被AI撐爆。

證明,不再稀缺了

陶哲軒在演講開頭就甩出了一個判斷:

數學正在經歷其他科學領域早已經歷過的那場革命。

生物學有基因測序爆炸、天文學有望遠鏡數據洪流,每個學科進入「數據豐裕」時代之后,都被迫重建自己的工作流程。

AI時代,數學的版本是:證明豐裕。

幾千年來,數學一直活在「證明稀缺」的年代。

看一眼數學論文的署名傳統就知道——其他學科早已習慣10人、20人、50人合著的常態,數學一百年來還卡在1-2人。

陶哲軒在演講里直接放了一張對比圖,那條幾乎貼地的線就是數學。


為什么數學這么獨?因為證明很貴

一篇定理的誕生需要幾年甚至幾十年——Andrew Wiles關了自己7年才證完費馬大定理。


在那個稀缺時代,「誰第一個走出帳篷」就是最自然的衡量標準。

你給他一切——榮譽、教職、獎項、定理的署名權。

這套激勵運轉得非常好,因為它和「推動整個數學社區進步」的目標基本對齊:

第一個走出來的人,通常也是把這件事講清楚的人。

一個猜想懸在那里幾十年,全世界最聰明的腦袋輪番上陣,能解出來就是載入史冊的事件。

整個學科的激勵體系、榮譽體系、評價體系,全部建立在這個稀缺性之上。

現在稀缺性正在被AI抹掉。

陶哲軒舉了一個很具體的例子。

Erd?s問題網站——數學界最著名的未解難題清單之一,目前已經有大約20篇AI輔助解題方案處于積壓待審狀態。

提交者自己坦言:根本沒有時間手動驗證。


不是沒人想看,是看不過來。

陶哲軒把這比作19世紀的汽車困境——車的速度越來越快,但當時的道路系統根本承載不了。

結果不是交通更快了,而是交通更堵了。

AI是能生成數學難題的證明。


但證明堆在那里沒人消化,等于什么都沒證明。

數學家的工作流,被AI切成了三段

陶哲軒在演講里把數學的生產過程拆成三步。

第一步,proof generation,證明生成。

AI現在已經在批量產出。

GPT-5.5、Claude Opus 4.7、專門做形式化數學的求解器,一夜之間能涌出幾十條新證明。一年前還是驚喜的事情,現在變成生產線日產。

第二步,verification,證明驗證。

Lean、Coq這一類形式化驗證工具大半年迭代一次。

AI加Lean讓驗證流程半自動化,審稿人不再需要一行一行手算每個引理。

GPT-5.2解Erd?s#728那次,驗證環節由工具Aristotle自動完成,陶哲軒本人只在終點確認了一下。

第三步,digestion,消化與理解。

現在,完全空白。

沒有任何工具能幫數學家把機器證完的東西轉化成人類讀得懂的洞察。

一條證明被形式化驗證為正確,和這條證明對數學家有用,是兩回事。

前兩階段越快,第三階段越追不上。

更要命的是,目前學術界沒有任何成型的方法論,讓數學家批量消化AI產出的證明。

每天審稿郵件里塞滿Lean驗證過的新證明,能讀的人就那么多。


陶哲軒說了一句被現場反復引用的話:

數學的本質,不是積累正確證明的數量,是讓人類理解這個世界為什么是這樣運行的。

機器解出#1196是一回事。

陶哲軒親自從Price的證明里提煉出向下馮·曼戈爾特鏈這種新概念、再把它擴展成新理論,是另一回事。

前者AI可以包圓。

后者目前還得人來做。

而且越來越沒人做得過來。每天幾十條新證明涌出來,能讀懂的數學家就那么多。

瓶頸不在生產端,在閱讀端。

技術正確,但沒人理解

真正讓陶哲軒警覺的,不是AI生成證明的速度,而是AI生成的證明長什么樣。

他在演講中做了一個關鍵區分:數學研究有兩類目標。

第一類是顯性目標——證明某個定理、解決某個猜想。寫在論文標題里的那種。

第二類是隱性目標——弄清楚這個證明和已有文獻的關系,發現后續的自然問題,提煉新的技術手段,理解核心困難在哪里,以及最重要的:讓做這個研究的人本身變得更強。

過去幾百年里,這兩類目標從來不需要分開討論。

因為當一個人類數學家解決一個問題時,隱性目標是自動完成的——你不可能在證明過程中不了解文獻、不發現新問題、不訓練自己的直覺。

AI把它們拆開了。

AI可以在技術層面解決顯性目標,給出一個邏輯上正確的證明。但它生成的證明不引用已有文獻,不突出核心思想,不啟發后續研究,不幫任何人變得更聰明。

用陶哲軒的表述:這種證明技術上正確,但與數學的真正進步目標脫節。

一道題被AI解了,但數學界對這道題的理解沒有增長一毫米。

這就像一個學生在考試里拿了滿分,但走出考場什么都沒學到。

古德哈特定律發作了

陶哲軒在演講里搬出了一個經濟學概念:古德哈特定律。

一個學術界耳熟能詳的名字——Charles Goodhart,1975年提出那條以他名字命名的定律:

當一個衡量標準變成目標,它就不再是好的衡量標準。


這條定律過去50年發作過無數次:

  • KPI文化下的銷售作假

  • Twitter算法把互動變成目標,結果催生了憤怒經濟

  • 學術影響因子(h-index)被刷成了產業鏈

數學曾經是少數沒被它擊穿的領域。

當一個衡量標準變成目標時,它就不再是一個好的標準。

翻譯到數學界:「誰第一個證明了這個定理」,曾經是衡量數學進步的好指標。

因為在證明稀缺的年代,能第一個證明的人,一定深入理解了問題,一定推進了數學的前沿。

顯性目標和隱性目標完全對齊。

AI讓這個對齊崩了。

第一個證明的速度可以被無限加速,但理解不能。

當整個社區開始無限制地卷「證明速度」,這個指標就和真正的數學進步脫鉤了。

繼續按舊規則玩,不僅不創造進步,反而在多方面阻礙數學的發展。

陶哲軒的建議很明確:停止對「誰是第一個解決某個未解難題」的過度執著。

把錦標賽式的極限優化引導到更受控的方向——比如專門為重度使用AI而設計的數學競賽工作流,讓競速歸競速,讓理解歸理解。

菲爾茲獎得主親手給數學界的舊游戲規則判了緩刑。

數學是預告片

把視線從數學拉遠一步。

陶哲軒描述的這個困境——AI產出速度遠超人類消化速度,顯性目標和隱性目標被強行解耦——不是數學獨有的。

代碼可以被AI大量生成,但沒人review。

論文可以被AI批量寫出,但沒人讀。

診斷可以被AI秒出,但醫生來不及理解推理過程。

每一個知識密集型行業,都在走向同一個岔路口:產出在爆炸,理解在停滯。

陶哲軒在演講中反復強調一句話:數學不只是一堆互不相關的定理的集合,它上面有一整套系統。

證明是磚。但建筑不是磚堆。

當AI能無限供應磚塊的時候,建筑師比磚匠更重要。

問題是,連建筑師都快被埋在磚堆下面了。

陶哲軒選擇不追了。


不是追不上,而是他發現,追本身正在成為問題。

錦標賽燈光熄了,劇場剛剛開門

陶哲軒在演講最后,留下一個具體的提議。

為AI重度使用設計專門的數學競賽。

評判標準不再是「誰先證出來」,是誰的證明體系最有解釋力、誰的形式化最干凈、誰能推動整個領域消化某個突破。


這句話的潛臺詞很明白:獎項、期刊、招聘評價——所有建立在證明稀缺時代之上的制度,都要重做。

數學不是被AI終結的第一門學科。

但它是第一門由頂級專家親手宣告規則失效的學科。

物理、化學、生物大概率會跟上。

千年來,數學家比誰先證出來。

從今天起,比的是誰更能讀得懂AI的證明。

參考資料:

https://www.youtube.com/watch?v=Uc2zt198U_U

https://mathstodon.xyz/@tao/116569989993991669

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
慘!新娘換裝太久賓客吃完全跑光,4萬婚禮變獨角戲!

慘!新娘換裝太久賓客吃完全跑光,4萬婚禮變獨角戲!

煙潯渺渺
2026-05-16 15:12:34
中國U17爆冷掀翻東道主,半決賽對決越南

中國U17爆冷掀翻東道主,半決賽對決越南

硯底沉香
2026-05-16 12:47:56
參議院槍響!馬科斯徹底失控,軍方翻臉,南海局勢迎來大變

參議院槍響!馬科斯徹底失控,軍方翻臉,南海局勢迎來大變

何嗀愛捕漁
2026-05-15 15:53:24
新款奔馳CLE上市 售價45.76-59.98萬元

新款奔馳CLE上市 售價45.76-59.98萬元

車質網
2026-05-15 12:51:58
“余生好好走”,知名央視主持人王小丫,病床上的留言字字催淚

“余生好好走”,知名央視主持人王小丫,病床上的留言字字催淚

近史談
2026-03-31 18:57:49
時代最大的荒誕,是年輕人重新迷信了!

時代最大的荒誕,是年輕人重新迷信了!

胖胖說他不胖
2026-05-16 14:33:35
《主角》7位小演員個個都有來頭,楊紫“女兒”,張嘉益“兒子”

《主角》7位小演員個個都有來頭,楊紫“女兒”,張嘉益“兒子”

八斗小先生
2026-05-15 17:40:06
深圳隊動員大會,賀希寧實話實說!

深圳隊動員大會,賀希寧實話實說!

體育哲人
2026-05-16 18:20:45
《主角》胡三元出獄大變天,惡領導下臺,易青娥熬成頂流臺柱子

《主角》胡三元出獄大變天,惡領導下臺,易青娥熬成頂流臺柱子

慫熊劇場
2026-05-16 06:45:57
寧夏惡魔,白天在謝晉電影里演好人,晚上回家當閻王,殺人喂狗!

寧夏惡魔,白天在謝晉電影里演好人,晚上回家當閻王,殺人喂狗!

莫地方
2026-05-14 00:55:03
母親葬禮婆家全員缺席,丈夫掛我99通電話,我下令開除他家所有人

母親葬禮婆家全員缺席,丈夫掛我99通電話,我下令開除他家所有人

千秋文化
2026-05-13 19:39:45
蘇聯航空母艦發展的悲劇:戰略搖擺、技術跛行與帝國崩塌

蘇聯航空母艦發展的悲劇:戰略搖擺、技術跛行與帝國崩塌

上甘嶺的旗幟
2026-05-16 00:13:08
小姐姐這套職業穿搭雖然簡約,但是很有魅力

小姐姐這套職業穿搭雖然簡約,但是很有魅力

美女穿搭分享
2026-05-16 17:42:12
1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

1985年,國安叛徒藏身南美,中國6名兵王萬里鋤奸,FBI顏面盡失

干史人
2026-04-14 21:10:03
1923年蔣介石奉命出訪蘇聯,也正是這次訪問,讓他開始對蘇聯反感

1923年蔣介石奉命出訪蘇聯,也正是這次訪問,讓他開始對蘇聯反感

飯小妹說歷史
2026-05-15 08:25:21
統一方式敲定!國臺辦剛亮底牌,鄭麗文火速接招,這波配合絕了

統一方式敲定!國臺辦剛亮底牌,鄭麗文火速接招,這波配合絕了

小影的娛樂
2026-05-16 11:28:46
趕緊扔掉!這5種“廚房神器”危害很大,你家廚房可能也有

趕緊扔掉!這5種“廚房神器”危害很大,你家廚房可能也有

Home范
2026-05-03 16:50:03
老了才看透:父弱母強的家庭,養出來的孩子,大多是這兩種結局

老了才看透:父弱母強的家庭,養出來的孩子,大多是這兩種結局

心理觀察局
2026-05-11 10:00:27
哈馬斯官員證實其軍事領導人哈達德身亡,以軍確認

哈馬斯官員證實其軍事領導人哈達德身亡,以軍確認

澎湃新聞
2026-05-16 18:34:20
“那家伙在空軍1號前居然一動不動”!美媒注意到一名中國儀仗兵

“那家伙在空軍1號前居然一動不動”!美媒注意到一名中國儀仗兵

阿龍聊軍事
2026-05-14 11:02:15
2026-05-16 19:15:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15227文章數 66869關注度
往期回顧 全部

科技要聞

漲的是車價,要的是老命

頭條要聞

22筆房貸斷供貸款人集體失聯 銀行報警:金額2千多萬

頭條要聞

22筆房貸斷供貸款人集體失聯 銀行報警:金額2千多萬

體育要聞

馬刺2號,少年老成,這集看過?

娛樂要聞

謝霆鋒北京街頭騎行被偶遇,側顏帥炸

財經要聞

造詞狂魔賈躍亭

汽車要聞

高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

態度原創

教育
親子
旅游
本地
房產

教育要聞

集體游戲完全是在培養焦慮感

親子要聞

娃過了這個年紀,媽媽請記得給TA穿上小內褲,否則對孩子影響大

旅游要聞

5月18日免費開放!寶山民博館五月福利來啦~

本地新聞

用蘇繡的方式,打開江西婺源

房產要聞

老黃埔熱銷之下,珠江春,為何去化僅3成?

無障礙瀏覽 進入關懷版