網易首頁 > 網易號 > 正文 申請入駐

AI「生肉證明」堆爆GitHub!陶哲軒重磅發聲:只會解題沒用了

0
分享至


新智元報道

編輯:犀牛

【新智元導讀】陶哲軒最新判斷,數學正在從「證明稀缺」進入「證明過!箷r代——數學家最值錢的工作已不再只是「做出證明」,而是驗證它、消化它,并把一塊 AI 吐出的「生肉證明」變成人類真正吃得下的知識。

最近,陶哲軒在 Mastodon 拋出一記重磅判斷——

數學正在從證明稀缺時代,進入證明過剩時代(from an era of proof scarcity to an era of proof abundance)!


在AI對Erd?s問題的貢獻Github頁面上,20多份 AI 提交的全部或部分解,正堆在「pending assessment」(待評估)那一欄。

而在此之前,這個分類常年只有1-2份。


一夜之間,AI 正在以令人窒息的速度瘋狂輸出數學證明。

問題是——沒人來得及看。

問題求解「三件套」

生成、驗證、消化

陶哲軒把這次的思考建立在一個簡潔的框架上。

他說,數學問題求解從來不是一件事,而是三件事:

  • Proof generation(證明生成):把一個猜想從「未解決」推到「有解」。

  • Proof verification(證明驗證):確認這個解是對的,邏輯沒有漏洞。

  • Proof digestion(證明消化):把證明讀懂、講透、提煉出方法論,讓整個領域受益。


在過去的幾百年里,三件事基本由同一撥人完成——你證了一個定理,你自然理解它,你寫論文解釋它。

這三個環節之間不存在「瓶頸差」。

但 AI 來了之后,情況變了。

生成環節被 LLM 大幅加速,驗證環節有 Lean、Coq 等形式化工具兜底,唯獨消化環節——那個需要人類大腦去理解「這個證明到底意味著什么」的環節——完全跟不上。

陶哲軒用了一個精確的工程術語來形容這種錯位:impedance mismatch(阻抗失配)。

三個環節的速度不匹配了:證明像洪水一樣涌來,但理解的堤壩還是手工砌的。

他說,想象兩種社會。

食物稀缺的社會,最受尊敬的人是獵手和農夫——是那些「bring home the bacon」(把食物帶回家)的人。

你獵回一頭鹿,不管肉質如何,整個部落都會感激你,會有人主動幫你清洗、烹飪、分配。幾乎任何沒有毒的食物貢獻都受歡迎。

食物過剩的社會則完全不同。

想象一個 pot-luck 派對(每人帶一道菜的聚餐)。如果一個陌生人闖進來,扔下一塊來路不明的生肉,讓大家自己去處理——沒有人會高興。

甚至超市買來的預包裝食品,也只是勉強算數。

真正受歡迎的,是社區里受信任的成員精心烹制的家常菜——不僅因為好吃,更因為圍繞這道菜的對話本身就是社交的一部分,也是培養下一代廚師的機會。

回到數學——AI 跑出來的「生肉證明」(raw proof),就是那塊被陌生人扔在派對上的神秘肉。

它可能是正確的。它可能通過了形式化驗證。

但沒有人清洗過它、烹飪過它、也沒有人能告訴你它到底好不好吃。


陶哲軒直言:這種「貢獻」不僅沒有推進問題的實際進展(do not measurably advance the progress),反而可能產生一個「負面效果」——它殺死了人們繼續研究這個問題的興趣。

問題被宣告「已解決」了,但沒人懂這個解。

好比一道菜被端上桌,但沒人敢動筷子。

于是這道菜——連同圍繞它可能產生的所有對話和靈感——就這樣涼了。

Erd?s #1196,唯一跑通「三件套」的案例

理論都需要一個切片去檢驗。

陶哲軒反復提到的那個切片,就是 Erd?s 問題 #1196。

這是一個關于「primitive sets」(本原集)的猜想:在一個整數集合中,如果沒有任何元素整除另一個元素,那么對所有元素 a 按 1/(a·log a) 求和,當集合元素趨于無窮大時,這個和是否趨近于1?

1968年,Erd?s、Sárk?zy 和 Szemerédi 提出了這個猜想。


此后將近60年,數學家們不斷逼近——斯坦福數學家 Jared Lichtman 花了數年證明了一個相關的上界(約1.399),但最終的漸近猜想始終懸而未決。

2026年4月的某個周一下午,23歲的 Liam Price 把這道題丟進了 GPT-5.4 Pro。

Price 沒有數學博士學位,沒有多年的專業訓練。他用的是一個20美元/月的 ChatGPT Pro 訂閱——任何人都能用的工具。


80分鐘。

模型走通了一條數學界忽視了近90年的路徑:用von Mangoldt 函數(一種經典的解析數論權重函數)結合馬爾可夫過程理論,構造出了一個全新的證明框架。

這個技術組合已經存在了幾十年,但從未有人想到把它用在本原集問題上。

證明出來了。

但如果故事到這里就結束,它只不過又是一塊「神秘肉」。

關鍵在于接下來發生的事:陶哲軒親自下場。

他在24小時內驗證了證明的核心思路,隨后將其擴展、重組、打磨,最終揭示出這個證明背后隱藏著一條更深層的聯系——整數解剖學(integeranatomy)與馬爾可夫過程理論之間一條此前未被描述的全新橋梁。

這就是證明消化(proof digestion)。

不只是「對不對」的問題,而是「它意味著什么」的問題。

陶哲軒稱 #1196 是目前唯一一個三階段——生成、驗證、消化——都基本跑通的案例。

也正因如此,他反復強調一個原則:理想狀態是同一撥人完成全部三件事。

而現實中,越來越多的人在用 AI 生成證明后,沒時間去驗證和消化,就直接提交了。

這正是 Erd?s 問題近20多份待評估方案堆積的直接原因。

三處表態,同一判斷

陶哲軒不是在一個地方隨口說說。

他在幾乎同一時期,通過三個不同渠道發出了同一個信號。

4月27日,Mastodon 長帖正式提出「證明稀缺→證明過!沟姆妒脚袛。

4月27日,Nature 訪談(The job description is changing):他對記者 Davide Castelvecchi 說,數學家的「崗位描述」正在改變。一個拒絕碰 AI 工具、只想用傳統方式做證明的研究生,未來可能會發現自己的機會越來越少。

能在傳統數學功底之上熟練運用新工具的人,才會真正繁榮。


3月29日,博客長文《Mathematical methods and human thought in the age of AI》:他和 Klowden 花了超過一年寫成這篇論文,試圖超越眼前的技術細節,直面更根本的哲學問題——數學證明的本質是什么?論文的目的是什么?我們這個職業存在的意義是什么?

他在博客中寫道:如果我們自己不回答這些問題,它們就會被科技公司或經濟激勵機制替我們回答。


三處表態,同一個內核:數學家的核心競爭力正在遷移——從「誰先生成證明」,轉向「誰能選對問題、設計工作流、驗證并消化結果」。

稀缺的不再是答案,而是理解。

更大的震蕩:學術評價體系要重寫

如果只是數學家的工作方式變了,那還只是一個學科內部的事。

但陶哲軒看到的遠不止此。

當證明的成本被 AI 壓到接近于零,當證明驗證被 Lean/Coq 等形式化引擎大幅自動化——證明消化這個環節的價值就會被重估。

過去,消化證明是「免費的」。

你證了一個定理,你自然會理解它,會在論文里解釋它。這個勞動從未被單獨計價。

但當證明的生產者(AI)和理解者(人類)被拆開之后,消化就從隱性勞動變成了顯性稀缺資源。

這意味著整個學術聲望的分配邏輯要變。

Citation 體系、論文評審標準、獎項評選規則、甚至招聘和晉升的依據——所有這些圍繞「誰先證了什么」建立起來的激勵結構,都將面臨重構。

陶哲軒預測:就像現代社會不再把生食原料當作一頓飯一樣,數學研究文化將不再把「未消化的裸證明」(raw, undigested proofs)視為對一個問題的解決方案。

未來的評判標準,將聚焦于一個貢獻究竟在多大程度上豐富了整個領域,而非僅僅「解決」了問題本身。

而且這不只是數學一個學科的事。

AI for Math 的范式漂移,將成為所有強證明型學科的預演——理論物理中的計算驗證、密碼學中的安全性證明、軟件工程中的形式化驗證——所有依賴「正確性論證」作為核心產出的領域,都將面臨同樣的「阻抗失配」。

證明會越來越多,越來越快,越來越便宜。

證明的時代沒有結束。

但「證明即一切」的時代,正在落幕。

未來屬于那些不僅能「算出來」,更能「講明白」的人。

參考資料:

https://mathstodon.xyz/@tao/116477351524980995

https://mathstodon.xyz/@tao/116450581967483825

https://www.nature.com/articles/d41586-026-01246-9

https://terrytao.wordpress.com/2026/03/29/mathematical-methods-and-human-thought-in-the-age-of-ai/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
50歲后,突然醒悟,壽命長短,不取決于運動,取決于3方面,很準

50歲后,突然醒悟,壽命長短,不取決于運動,取決于3方面,很準

人間百態大全
2026-04-27 06:40:07
我國首例公開轉世人:6歲憑記憶找到前世的家,還找到前世情人

我國首例公開轉世人:6歲憑記憶找到前世的家,還找到前世情人

小蘭聊歷史
2026-04-13 12:04:13
被忽視的風險,存款保險,保的是“銀行破產”,不!般y行被盜”

被忽視的風險,存款保險,保的是“銀行破產”,不!般y行被盜”

月滿大江流
2026-04-30 13:52:04
“香港演員幾乎全軍覆沒! 無戲可拍”引發網友熱議

“香港演員幾乎全軍覆沒! 無戲可拍”引發網友熱議

許三歲
2026-03-26 11:35:13
俄方宣布紅場閱兵不再展示重型裝備,從“一輛坦克”到徹底取消

俄方宣布紅場閱兵不再展示重型裝備,從“一輛坦克”到徹底取消

桂系007
2026-04-29 05:18:10
逆轉!馬杜羅被捕114天后,特朗普首度重大讓步,美法官有言在先

逆轉!馬杜羅被捕114天后,特朗普首度重大讓步,美法官有言在先

杰絲聊古今
2026-04-30 11:34:36
鬧!媒體人揭山東泰山亂象,韓鵬疑被架空,宿茂臻成不穩定因素

鬧!媒體人揭山東泰山亂象,韓鵬疑被架空,宿茂臻成不穩定因素

國足風云
2026-04-29 18:51:08
震驚!李白《靜夜思》被篡改“床前看月光”,網友:這才是原始版

震驚!李白《靜夜思》被篡改“床前看月光”,網友:這才是原始版

火山詩話
2026-04-29 19:47:16
厄齊爾:因為我當年發表了涉華言論,導致我被阿森納棄用

厄齊爾:因為我當年發表了涉華言論,導致我被阿森納棄用

懂球帝
2026-04-30 09:07:30
85年越戰,顧克路犧牲后,副連長下令:不要俘虜,全部殺死

85年越戰,顧克路犧牲后,副連長下令:不要俘虜,全部殺死

我不是沃神
2026-04-30 11:40:08
90后救人夫妻找到!人民日報點名,工作單位曝光,難怪會不顧一切

90后救人夫妻找到!人民日報點名,工作單位曝光,難怪會不顧一切

杰絲聊古今
2026-04-29 16:44:22
李斌現場演示做飯!蔚來全新車型預售15.98萬起

李斌現場演示做飯!蔚來全新車型預售15.98萬起

汽車工程師
2026-04-28 22:04:44
空軍司令員劉亞樓頂撞毛主席,毛主席臉色一變:以后空軍你說了算

空軍司令員劉亞樓頂撞毛主席,毛主席臉色一變:以后空軍你說了算

歷史甄有趣
2026-04-29 13:00:13
員工在廁所玩手機,照片被發到400多人的大群......

員工在廁所玩手機,照片被發到400多人的大群......

環球時報國際
2026-04-29 21:19:36
普京釋放停戰善意,特朗普緊急宣布烏戰敗,不料澤連斯基反手出擊

普京釋放停戰善意,特朗普緊急宣布烏戰敗,不料澤連斯基反手出擊

阿紿聊社會
2026-04-30 11:44:18
屬馬人:五一后多到3個地方去走動,尤其今年特別有益

屬馬人:五一后多到3個地方去走動,尤其今年特別有益

阿龍美食記
2026-04-29 22:39:06
未來房價是漲還是跌?房產專家表示,近兩年買房可能會是接盤俠

未來房價是漲還是跌?房產專家表示,近兩年買房可能會是接盤俠

墜入二次元的海洋
2026-04-30 13:05:32
嚴查“中午喝、晚上開”等行為 重慶將開展酒駕醉駕專項整治行動

嚴查“中午喝、晚上開”等行為 重慶將開展酒駕醉駕專項整治行動

上游新聞
2026-04-30 13:05:35
不管樓層多高,這5個樓層才是最吉利樓層,不是迷信,而是共識

不管樓層多高,這5個樓層才是最吉利樓層,不是迷信,而是共識

室內設計師有料兒
2026-04-24 10:42:26
外媒:美或在對伊戰爭中“首次動用高超音速導彈”

外媒:美或在對伊戰爭中“首次動用高超音速導彈”

參考消息
2026-04-30 13:44:45
2026-04-30 15:15:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15101文章數 66823關注度
往期回顧 全部

科技要聞

四巨頭財報齊發:AI已經不只是風口

頭條要聞

"上海最通透爸爸"去世 女兒:他退休20多年這輩子不虧

頭條要聞

"上海最通透爸爸"去世 女兒:他退休20多年這輩子不虧

體育要聞

騎士天王山:哈登、莫布里和……施羅德?

娛樂要聞

孫楊媽媽被曝!過往言行被扒大開眼界

財經要聞

醫美偷稅手法曝光 借免稅優惠來避稅被封堵

汽車要聞

上汽一季報出爐 在低增長周期里守住基本盤

態度原創

數碼
健康
教育
時尚
軍事航空

數碼要聞

“120W”只是商品或型號名稱?央視曝光充電頭文字游戲套路

干細胞治燒燙傷能用了么?

教育要聞

成都鹽外發出倡議:每個家庭設立“家庭情緒日”

春季穿衣千萬別太暗沉!試試藍白配色、選基礎款褲子,大方得體

軍事要聞

意大利議會批準:捐贈航母給印度尼西亞

無障礙瀏覽 進入關懷版