網易首頁 > 網易號 > 正文 申請入駐

陶哲軒驚呼“變天”,AI用6小時改寫數學史

0
分享至

一塊閃亮的數學獎牌,剛剛被寫入代碼的智能體在6小時內摘下,而人類為此思考了30年。

PART 01

AI六小時破解30年數學難題

2025年12月,人工智能領域迎來里程碑事件:Harmonic公司開發的AI系統“亞里士多德”僅用6小時便攻克了困擾數學界30年的埃爾德什問題#124簡化版。這一突破被學界稱為“數學智能體時代的開端”,而菲爾茲獎得主陶哲軒則犀利指出:AI正在高效收割數學界的“低垂果實”,讓人類研究者得以聚焦更具挑戰性的核心問題。



埃爾德什問題#124自1995年提出以來,一直是組合數論領域的頑固堡壘。其核心命題探討:給定k個不小于2的自然數d?,若∑1/(d?-1) ≥ 1,是否所有足夠大的自然數n都能表示為特定0-1組合的和?這個看似簡潔的問題,卻讓數學家們在最大公約數(gcd)約束和邊界案例驗證中陷入長達三十年的僵局。

“亞里士多德”的突破性在于其完全獨立的證明能力。它采用創新的“vibe proving”方法論,融合強化學習與蒙特卡洛樹搜索,在無需人類干預的情況下遍歷上億種證明路徑,最終輸出100%可驗證的定理。整個過程僅耗時6小時,而通過Lean形式化驗證系統的檢驗只需1分鐘。



耐人尋味的是,當通用AI巨頭ChatGPT和Gemini面對同一問題時,卻集體“折戟”。陶哲軒分析指出:Gemini僅能給出排除數字1后gcd條件成為必要的基礎觀察;ChatGPT則表現出明顯的“路徑依賴”,大量引用已有網頁和論文,未能提出原創性觀點。

這種差異揭示了專業AI與通用AI的本質分野——當“亞里士多德”被設計為“邏輯工匠”,基于形式邏輯生成可驗證代碼時,ChatGPT類模型仍是“猜詞機器”,依賴統計概率生成文本。

PART 02

“人機協同”的科研革命

陶哲軒將數學未解問題的分布描述為“長尾特征”。大多數難題并非超高難度,而是因人類數學家資源有限而被擱置的“低垂果實”。AI的自動化能力恰恰擅長處理這類問題。



在埃爾德什問題網站上,“未解”標簽最近減少了近十個,這并非因為人類突然解決了這些問題,而是AI通過文獻檢索發現它們早已被攻克。這種現象揭示了AI作為“清道夫”的價值——它能清理最容易解決的問題,讓人類聚焦于真正具有挑戰性的核心難題。

HarmonicMath創始人Vlad Tenev提出的“Vibe證明時代”已經到來。這一概念意味著AI不僅能輔助驗證,還能獨立創造。在數學領域,這種變革尤為深刻,因為數學的形式化特性使其非常適合AI參與。



微軟前AI副總裁Sebastien Bubeck激動地分享道:“該解決方案100%由AI生成,總計耗時6小時?!边@一效率與人類數學家30年的掙扎形成鮮明對比,凸顯了AI在科研效率方面的革命性提升。

PART 03

AI當前局限與信息學學生的不可替代性

盡管“亞里士多德”取得了突破,但它解決的是原問題的簡化版本。原版埃爾德什問題#124不允許使用數字1且需要滿足額外的最小公約數條件,這一更復雜的版本仍有待解決。

AI在數學推理中面臨的主要挑戰之一是“超長推理鏈”問題。高中數學證明可能只需10到40步,而像黎曼猜想這樣的難題,證明路徑可能長達百萬步。美國加州理工學院的謝爾蓋·古科夫指出,這類超長路徑極難處理,AI必須在指數級增長的可能路徑中找到正確解法。



DeepMind的AlphaProof和AlphaGeometry2在國際奧數競賽中表現出色,但專家們普遍認為,它們仍缺乏真正的數學洞察力。競賽題有一定“套路”,而真正的數學研究更開放、復雜。初創公司Epoch AI的FrontierMath測試顯示,面對全新技術難題,LLM幾乎集體“交白卷”。

數學家董彬指出,AI在數學研究中的理想角色是“AI學徒”——用訓練數學家的方式培養AI助手。但目前,AI更適用于“單點突破”,從局部解決某些具體問題,而非全面替代人類直覺和創造力。

PART 04

信息學學生的四維能力重構

當AI開始收割數學“低垂果實”,信息學學生亟需重構能力模型,在以下四個維度建立新優勢:

人機協同的架構思維——“亞里士多德”的成功源于其專業定位——與通用大模型不同,它專為數學證明設計,融合強化學習、蒙特卡洛樹搜索與Lean形式化語言。這種“領域專用智能”架構思維值得信息學學生深入學習。正如DeepSeek-V3.2-Speciale模型展現的,通過融合定理證明能力,專業模型在IMO、ICPC等賽事中已超越多數人類選手。

形式化驗證的必備技能——Lean證明系統的應用標志著數學驗證進入程序化時代。信息學學生需掌握形式化驗證工具,將自然語言證明轉化為機器可驗證代碼。這不僅是防范AI幻覺的有效手段,更是未來科研協作的基礎能力。埃爾德什#124的證明在GitHub公開后,全球研究者均可參與驗證與拓展(github.com/plby/lean-proofs)。

直覺引導的算法設計——當前AI在依賴性質觀察與解題直覺的題目上仍存在明顯局限。如AlphaProof解決3個IMO問題耗時3天,而人類選手僅需4.5小時。信息學學生應強化元認知能力,在AI陷入局部最優時提供方向性指導,這正是人類思維不可替代的核心價值——正如PatternBoost AI系統開發者所言:“探索性思維是數學的核心”。

問題發現的戰略眼光——倫敦數學科學研究所何楊輝指出:AI能幫助證明問題,卻無法幫助確定需要解決的關鍵問題。信息學學生需培養科學發現的前瞻力,在AI清理“低垂果實”后,精準識別真正值得攻堅的“數學高峰”。這種能力建立在對學科發展脈絡的深刻理解與跨領域知識融合基礎上。

PART 05

教育轉型:從工具使用者到智能體架構師

面對AI的沖擊,信息學教育正在經歷范式轉變。2025年CNCC論壇達成共識:信息學奧賽應繼續堅持以計算思維培養為核心,同時更加重視學生發現問題和提出問題的能力。微軟前AI副總裁塞巴斯蒂安·布貝克激動地分享AI攻克埃爾德什難題的消息時,強調“解決方案100%由AI生成”。



但走進普林斯頓高等研究院,數學家們已在全新實驗室工作:人類提出大膽猜想,AI負責驗證與反例生成;人類構建理論框架,AI完成繁瑣計算;人類捕捉靈感火花,AI將其轉化為嚴謹證明。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
突發!臺高層已抵達斯威士蘭,大陸徹底看清了:特朗普的最壞打算

突發!臺高層已抵達斯威士蘭,大陸徹底看清了:特朗普的最壞打算

觸摸史跡
2026-04-26 15:15:42
飯店老板被顧客踹續:一腳踹出三米遠,強喂服務員吃菜,警方介入

飯店老板被顧客踹續:一腳踹出三米遠,強喂服務員吃菜,警方介入

奇思妙想草葉君
2026-04-25 15:02:47
一頓午飯吃進ICU!14歲男孩狂吃6個雞腿+紅燒肉,上腹部劇痛送醫!醫生:急性重癥壞死性胰腺炎的典型表現

一頓午飯吃進ICU!14歲男孩狂吃6個雞腿+紅燒肉,上腹部劇痛送醫!醫生:急性重癥壞死性胰腺炎的典型表現

魯中晨報
2026-04-26 21:40:08
22公里極限挑釁,阿利耶夫當眾下套,普京面子被踩在腳下

22公里極限挑釁,阿利耶夫當眾下套,普京面子被踩在腳下

老馬拉車莫少裝
2026-04-26 22:37:17
伊朗開出停戰條件

伊朗開出停戰條件

第一財經資訊
2026-04-27 00:24:31
8億豪門最后的回光?熱刺用血肉拼下一場無效勝利!保級更難了!

8億豪門最后的回光?熱刺用血肉拼下一場無效勝利!保級更難了!

落夜足球
2026-04-26 15:43:55
紫牛頭條|父親半生尋子走訪50萬公里,33年后才知兒子就在走失處30公里外

紫牛頭條|父親半生尋子走訪50萬公里,33年后才知兒子就在走失處30公里外

揚子晚報
2026-04-26 20:30:38
胡錫進否認自己有老干部病房vip待遇,但消炎藥卻用124元一盒的

胡錫進否認自己有老干部病房vip待遇,但消炎藥卻用124元一盒的

映射生活的身影
2026-04-26 20:57:40
22分鐘轟20分!中國女籃26歲2米07中鋒閃耀WNBA:聯手兩大MVP沖冠

22分鐘轟20分!中國女籃26歲2米07中鋒閃耀WNBA:聯手兩大MVP沖冠

李喜林籃球絕殺
2026-04-26 11:59:34
廣東又又又將有大暴雨

廣東又又又將有大暴雨

新快報新聞
2026-04-26 17:12:28
伊卡路斯沖刺港股:年營收2億利潤6691萬 郝慶軍賣老股套現6000萬

伊卡路斯沖刺港股:年營收2億利潤6691萬 郝慶軍賣老股套現6000萬

雷遞
2026-04-26 15:51:08
這部講“無能”的劇,究竟是怎么過會的啊

這部講“無能”的劇,究竟是怎么過會的啊

老吳教育課堂
2026-04-26 15:59:01
突發!上市公司總裁,涉嫌嚴重違法被留置!

突發!上市公司總裁,涉嫌嚴重違法被留置!

南方都市報
2026-04-26 21:55:04
他們反川普已經到了靈魂撕裂、歇斯底里的程度

他們反川普已經到了靈魂撕裂、歇斯底里的程度

壹家言
2026-04-25 20:47:45
伊朗政權秋后算賬,絞死更多抗議者

伊朗政權秋后算賬,絞死更多抗議者

一種觀點
2026-04-25 19:08:26
回榜首!阿森納奪冠概率升至72.4% 曼城遭看衰:會輸2場+3分丟冠

回榜首!阿森納奪冠概率升至72.4% 曼城遭看衰:會輸2場+3分丟冠

我愛英超
2026-04-26 07:40:23
1:0!足總杯決賽出爐,切爾西晉級,與曼城爭冠,歐聯資格雙保險

1:0!足總杯決賽出爐,切爾西晉級,與曼城爭冠,歐聯資格雙保險

呀古銅
2026-04-27 00:17:00
北京車展冒出一堆路虎風味國產電車

北京車展冒出一堆路虎風味國產電車

源Auto
2026-04-24 20:19:02
女大學生“受邀”去泰國潑水節被轉賣到緬甸,父親稱報道發出后,園區老板感到了壓力,讓刪除新聞報道,揚言“警方也拿他們沒辦法”

女大學生“受邀”去泰國潑水節被轉賣到緬甸,父親稱報道發出后,園區老板感到了壓力,讓刪除新聞報道,揚言“警方也拿他們沒辦法”

揚子晚報
2026-04-24 12:06:30
緊急叫停!醫生:服用二甲雙胍的人,身體出現6種癥狀必須停藥

緊急叫停!醫生:服用二甲雙胍的人,身體出現6種癥狀必須停藥

健康科普365
2026-04-26 17:05:05
2026-04-27 01:04:49
電腦報少年派 incentive-icons
電腦報少年派
最新鮮的互聯網產業資訊
3922文章數 1602關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

事關新就業群體,中辦、國辦發文

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

數碼
房產
親子
旅游
藝術

數碼要聞

三星Tab S12系列進入固件測試階段 或配10500mAh大電池

房產要聞

新一輪教育大爆發來了!???,開始瘋狂建學校!

親子要聞

爸爸買的餐椅太好了,早知道早買了#餐椅 #寶寶板凳 #寶寶吃飯 #寶媽推薦

旅游要聞

2000余場特色活動邀市民歡度五一

藝術要聞

免租99年!聯合國大廈年內完工,埃及做“房東”

無障礙瀏覽 進入關懷版