无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

OpenAI 破解80年數(shù)學(xué)懸案,數(shù)學(xué)家的飯碗也危險(xiǎn)了

0
分享至


在桌上灑一把綠豆,有多少對(duì)豆子恰好相距 1 厘米?

作者丨岑峰 陳嘉欣

編輯丨岑峰 林覺(jué)民

2026年5月19日,Google在山景城用了2小時(shí)發(fā)布16款產(chǎn)品,告訴世界:AGI的未來(lái)是一整套工具鏈。一天后,OpenAI在Twitter上發(fā)了一條推文,告訴世界:AGI的未來(lái)是一個(gè)能獨(dú)立做數(shù)學(xué)證明的通用推理體。

推文的核心信息是:OpenAI的通用推理模型破解了數(shù)學(xué)家Paul Erd?s在1946年提出的平面單位距離問(wèn)題。這個(gè)問(wèn)題在離散幾何領(lǐng)域懸而未決了80年。

沒(méi)有發(fā)布會(huì),沒(méi)有Keynote。只有發(fā)布后4個(gè)小時(shí)帶來(lái)的1萬(wàn)+贊,和一句來(lái)自菲爾茲獎(jiǎng)得主的評(píng)價(jià)。


菲爾茲獎(jiǎng)得主Tim Gowers說(shuō):"如果這是一篇人類(lèi)投稿,被送到了《數(shù)學(xué)年鑒》編輯部,我被要求給出快速審稿意見(jiàn),我會(huì)毫不猶豫地推薦接收。沒(méi)有之前的AI生成證明接近過(guò)這個(gè)水平。"

同一天,Google展示了AI能做什么樣的"工具",OpenAI證明了AI已經(jīng)能做什么樣的"智力"。兩者的差距,可能比16款產(chǎn)品到一條推文的距離還要大。

01


一個(gè)讓數(shù)學(xué)家猜了80年的問(wèn)題

在桌上灑一把綠豆,記錄那些恰好相距 1 厘米的豆子對(duì)。有 n 顆豆子時(shí),最多能找到幾對(duì)?

這就是 Paul Erd?s 在 1946 年提出的“平面單位距離問(wèn)題”。80 年來(lái),人類(lèi)最聰明的頭腦始終只能得到一個(gè)答案:約 2n 對(duì)。數(shù)學(xué)界長(zhǎng)期認(rèn)為,質(zhì)的突破不可能存在。

作為 20 世紀(jì)最高產(chǎn)、最傳奇的數(shù)學(xué)家,Erd?s 留下的清單被視為數(shù)學(xué)界的“待辦圣經(jīng)”。而這次,OpenAI 的模型推翻了圣經(jīng)。它發(fā)現(xiàn)了一類(lèi)全新的點(diǎn)陣排列,使增長(zhǎng)速度突破了線(xiàn)性限制,躍升至“超線(xiàn)性增長(zhǎng)”。


打一個(gè)不太嚴(yán)謹(jǐn)?shù)庇^的比方:線(xiàn)性增長(zhǎng)是沿著地面的平路走,超線(xiàn)性增長(zhǎng)是開(kāi)始上坡。平路走得再快也到不了山頂,但上坡可以。

外行人可能會(huì)想:"模型用算力暴力搜索,找到了人類(lèi)找不到的解。"

但實(shí)際情況完全不同。模型靠的不是算力,是代數(shù)數(shù)論,一個(gè)與幾何完全不沾邊的數(shù)學(xué)分支。它從數(shù)論的工具箱里借了一把鑰匙,打開(kāi)了那扇幾何學(xué)家80年沒(méi)打開(kāi)的門(mén)。

為了確保這不是 AI 的“幻覺(jué)”,數(shù)學(xué)家們不僅逐行檢查了AI的證明,還專(zhuān)門(mén)寫(xiě)了一篇配套論文來(lái)闡釋它的思路。整個(gè)證明通過(guò)Lean軟件做了形式化驗(yàn)證。這意味著它可以被計(jì)算機(jī)逐行追溯檢查,不需要"相信",只需要"驗(yàn)證"。

為什么形式化驗(yàn)證如此重要?數(shù)學(xué)史上發(fā)生過(guò)多起"著名證明后來(lái)被發(fā)現(xiàn)存在漏洞"的事件。1993年懷爾斯證明費(fèi)馬大定理時(shí),第一版就被發(fā)現(xiàn)了一個(gè)關(guān)鍵漏洞,又花了一年多才修復(fù)。AI生成的內(nèi)容如果不經(jīng)過(guò)驗(yàn)證,同樣可能"看上去很美,但某個(gè)細(xì)節(jié)錯(cuò)了"。Lean驗(yàn)證相當(dāng)于給數(shù)學(xué)成果上了一道透明的保險(xiǎn):每一個(gè)推理步驟都可以被追查,不會(huì)因?yàn)檎l(shuí)的名氣大就放水。

Erd?s問(wèn)題清單的管理人Thomas Bloom曾是AI證明的最尖銳批評(píng)者。七個(gè)月前,GPT-5.2當(dāng)時(shí)聲稱(chēng)解決了多個(gè)Erd?s問(wèn)題,后來(lái)被指出只是找到了文獻(xiàn)中的已有解法。但這一次,他的態(tài)度轉(zhuǎn)向了支持。讓最硬的批評(píng)者點(diǎn)頭,這比任何新聞稿都硬。

02


AI是怎么做到的:從"猜答案"到"推答案"

比"證出了什么"更值得追問(wèn)的是"怎么證出的"。

技術(shù)寫(xiě)作者Adam Holter指出,模型的成功率隨思考時(shí)間增加而提高。工作機(jī)制與傳統(tǒng)AI完全不同。

傳統(tǒng)AI模型推理是一次性的:輸入問(wèn)題,輸出答案,沒(méi)有修正。OpenAI的新模型會(huì)生成多條推理路徑,自我評(píng)估,走不通就回溯。這與人類(lèi)數(shù)學(xué)家的"試錯(cuò)"類(lèi)似,區(qū)別在于AI能在毫秒級(jí)完成上百次試錯(cuò)。

這次突破驗(yàn)證了"推理時(shí)Scaling"(即"讓模型想得更久")。過(guò)去兩年,業(yè)界發(fā)現(xiàn):訓(xùn)練階段變大是一條路,推理階段"想"得更久是另一條路。思考時(shí)間從秒級(jí)延長(zhǎng)到小時(shí)級(jí),解決的問(wèn)題從"高中奧數(shù)"躍升到"80年未解的數(shù)學(xué)猜想"。

這個(gè)驗(yàn)證同時(shí)反駁了"讓模型多想只會(huì)把錯(cuò)誤打磨得更光滑"的質(zhì)疑。125頁(yè)的推理鏈條中存在多個(gè)關(guān)鍵決策點(diǎn),每個(gè)都需從備選方案中選擇正確路徑。若只是"打磨錯(cuò)誤",它不可能精準(zhǔn)找到那條80年未被發(fā)現(xiàn)的路徑。

據(jù)Holter描述,模型生成了長(zhǎng)約125頁(yè)的推理鏈。這不是"抄文獻(xiàn)",而是一連串決策:嘗試一種工具,另一種理論提供可能,回頭驗(yàn)證構(gòu)造是否正確。模型在代數(shù)數(shù)論和離散幾何之間跳躍,每一步都在論證、驗(yàn)證、修正。

這條125頁(yè)推理鏈的價(jià)值在于:它不是猜的,是推出來(lái)的。


論文鏈接:https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf

成果背后是一個(gè)分工框架。Holter認(rèn)為,AI負(fù)責(zé)提出方案并驗(yàn)證,人類(lèi)負(fù)責(zé)選擇重要問(wèn)題、判斷結(jié)果重要性、塑造研究方向。AI做"發(fā)散",大規(guī)模生成和探索構(gòu)想;人類(lèi)做"收斂",判斷哪些構(gòu)想值得深挖。人的專(zhuān)業(yè)判斷因AI提供更多選擇而更加寶貴。

Tim Gowers的評(píng)論也印證了這一點(diǎn)。他說(shuō)的是"如果這是人類(lèi)論文,我會(huì)推薦接收",而不是"數(shù)學(xué)家可以退休了"。

AI產(chǎn)出已達(dá)人類(lèi)頂級(jí)期刊發(fā)表水平,但這個(gè)判斷仍需人來(lái)做。

這一成果引發(fā)了討論。Hacker News上的開(kāi)發(fā)者已越過(guò)"AI能不能做數(shù)學(xué)",轉(zhuǎn)向"下一個(gè)是什么"。有人判斷材料科學(xué)可能是下一個(gè)目標(biāo),因?yàn)椴牧显O(shè)計(jì)是在超大空間中搜索最優(yōu)結(jié)構(gòu),與數(shù)學(xué)證明邏輯相似。也有人預(yù)測(cè)藥物分子設(shè)計(jì)會(huì)率先受益,因?yàn)槟P?從抽象理論到具體構(gòu)造"的推理鏈,正是從靶點(diǎn)結(jié)構(gòu)推導(dǎo)候選分子所需的能力。

03


AI4S的兩條路:

一個(gè)建實(shí)驗(yàn)室,一個(gè)培養(yǎng)研究員

AI4S賽道在2026年5月出現(xiàn)了兩條截然不同的技術(shù)路線(xiàn)。

Google在I/O發(fā)布了Gemini for Science,面向科學(xué)家的AI工具包,包含三個(gè)實(shí)驗(yàn)性產(chǎn)品:Co-Scientist(自動(dòng)生成假設(shè))、AlphaEvolve加ERA(計(jì)算發(fā)現(xiàn))、NotebookLM(文獻(xiàn)洞察)。其邏輯是打造科研加速器:看論文、整理數(shù)據(jù)、生成假設(shè)。

OpenAI走了完全不同的路。它的通用推理模型獨(dú)自完成了從產(chǎn)生想法、構(gòu)造證明到驗(yàn)證結(jié)論的完整流程,超越了"輔助工具"定位,親自完成論證。

兩條路線(xiàn)的差異可以用三個(gè)問(wèn)題來(lái)概括。

?誰(shuí)來(lái)定義問(wèn)題?Google的工具需要科學(xué)家輸入問(wèn)題,系統(tǒng)生成假設(shè)并附引用,最終判斷仍由人做。OpenAI的模型自己圈定方向,調(diào)動(dòng)跨學(xué)科工具,走完全程。

?適合什么場(chǎng)景?Google路徑適合已有明確方法論的領(lǐng)域:跑標(biāo)準(zhǔn)流程、處理海量數(shù)據(jù)。OpenAI路徑適合需要"跨學(xué)科借工具"的理論突破。

?驗(yàn)證門(mén)檻多高?Google的成果經(jīng)過(guò)同行評(píng)審,這是學(xué)術(shù)標(biāo)準(zhǔn)。OpenAI的成果經(jīng)過(guò)外部數(shù)學(xué)家獨(dú)立復(fù)核加計(jì)算機(jī)逐行驗(yàn)證,后者更嚴(yán)格,因?yàn)闄C(jī)器不看人面子。

更深層區(qū)別在于對(duì)AI4S的理解。Google的方向是"系統(tǒng)化":建完備的科研基礎(chǔ)設(shè)施,讓科學(xué)家在上面跑研究。OpenAI的方向是"代理化":訓(xùn)練通用推理體,直接參與最核心的智力環(huán)節(jié)。Google在建造實(shí)驗(yàn)室,OpenAI在培養(yǎng)研究員。


OpenAI研究員在做計(jì)算

理解了這個(gè)區(qū)別,就能理解Sam Altman為何說(shuō)"心情復(fù)雜":他的模型開(kāi)始做他自己做不到的事了。不是幫他查資料,是替他做了最難的部分。這種感受難以用驕傲或恐懼簡(jiǎn)單描述,說(shuō)明OpenAI自己也在消化這個(gè)事件的長(zhǎng)期含義。

04


范式的重寫(xiě):當(dāng)AI成為科研伴侶

回到Tim Gowers那句話(huà)。

它的表層含義很直接:AI產(chǎn)出的數(shù)學(xué)成果已達(dá)人類(lèi)頂級(jí)期刊可接收水平。這是菲爾茲獎(jiǎng)得主的認(rèn)可,而非OpenAI新聞稿的表述。

但深層含義更值得推敲。Gowers說(shuō)的是"如果這是人類(lèi)投稿"。意味著AI產(chǎn)出值得被認(rèn)真對(duì)待,但最終判斷權(quán)仍在人類(lèi)手中。

科技媒體IC.Work提出了一套務(wù)實(shí)的檢驗(yàn)框架,將AI數(shù)學(xué)發(fā)現(xiàn)的驗(yàn)證分為三個(gè)步驟:

1、公開(kāi)細(xì)節(jié):完整證明必須透明,Lean 驗(yàn)證必須通過(guò)。(已完成)

2、獨(dú)立復(fù)核:專(zhuān)家群體反復(fù)拆解,尋找隱藏漏洞。(進(jìn)行中)

3、穩(wěn)定復(fù)現(xiàn):同一個(gè)模型能否在其他難題上復(fù)制這種“直覺(jué)”?(關(guān)鍵點(diǎn))

這套框架的價(jià)值在于:既不過(guò)度吹捧,也不過(guò)度貶低。三道關(guān)過(guò)了一道,說(shuō)明值得嚴(yán)肅對(duì)待。第三道還沒(méi)開(kāi)始,說(shuō)明離"AI數(shù)學(xué)時(shí)代"還有距離。

第三道關(guān),即模型能不能在另一道數(shù)學(xué)難題上復(fù)現(xiàn)同樣的水平,才是決定"里程碑還是孤例"的關(guān)鍵。如果能復(fù)現(xiàn),數(shù)學(xué)研究的范式將發(fā)生根本性轉(zhuǎn)變。

數(shù)學(xué)家將會(huì)獲得一個(gè)沒(méi)有學(xué)科偏見(jiàn)、不會(huì)疲勞的同事。你可以請(qǐng)它去數(shù)論領(lǐng)域找工具來(lái)解決幾何問(wèn)題,極大地縮短研究的摸索期。

驗(yàn)證將比發(fā)現(xiàn)更昂貴。當(dāng) AI 能源源不斷提出新構(gòu)造時(shí),人類(lèi)科學(xué)家的角色將從“尋找證明”轉(zhuǎn)向“審判價(jià)值”。

這個(gè)問(wèn)題已經(jīng)越過(guò)了"AI能不能做"的討論階段,進(jìn)入了"人類(lèi)準(zhǔn)備好了沒(méi)有"的實(shí)踐階段。

回到開(kāi)頭那個(gè)場(chǎng)景。Google在I/O現(xiàn)場(chǎng)發(fā)布了16款產(chǎn)品,試圖用工程化的方式把AI嵌入科學(xué)研究的每個(gè)環(huán)節(jié);OpenAI在Twitter上發(fā)了一條推文,證明了AI已經(jīng)能在最深層的邏輯突破中扮演核心角色。

這兩條路最終可能會(huì)在同一個(gè)地方交匯:當(dāng)工具足夠聰明、也足夠好用時(shí),科學(xué)家就多了一個(gè)真正意義上的智力伙伴——一個(gè)能提出新想法、驗(yàn)證新假設(shè)、打破學(xué)科壁壘的伙伴。

這不是工具的勝利,而是科學(xué)發(fā)現(xiàn)從“手動(dòng)時(shí)代”向“全自動(dòng)化協(xié)作”躍遷的起點(diǎn)。

未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁(yè)、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來(lái)源并插入本公眾號(hào)名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
何云偉的相聲專(zhuān)場(chǎng),票價(jià)賣(mài)到480一張,你猜臺(tái)下坐了多少人?

何云偉的相聲專(zhuān)場(chǎng),票價(jià)賣(mài)到480一張,你猜臺(tái)下坐了多少人?

手工制作阿殲
2026-06-11 19:43:28
悲哀!高考女生兩天花光母親3個(gè)月工資2萬(wàn)元,質(zhì)問(wèn)“我錯(cuò)了嗎?”

悲哀!高考女生兩天花光母親3個(gè)月工資2萬(wàn)元,質(zhì)問(wèn)“我錯(cuò)了嗎?”

火山詩(shī)話(huà)
2026-06-12 11:46:38
澳大利亞4-1漁翁得利,世界杯穩(wěn)出線(xiàn),南美最弱隊(duì)浮現(xiàn)

澳大利亞4-1漁翁得利,世界杯穩(wěn)出線(xiàn),南美最弱隊(duì)浮現(xiàn)

精彩瞬間回顧
2026-06-13 22:05:28
“鵝腿阿姨”:一個(gè)時(shí)代有一個(gè)時(shí)代的笑話(huà)

“鵝腿阿姨”:一個(gè)時(shí)代有一個(gè)時(shí)代的笑話(huà)

天水人李成義
2026-06-13 11:00:23
接送初中生?老教師坦言:小學(xué)接安全,初中接的是孩子的整個(gè)人生

接送初中生?老教師坦言:小學(xué)接安全,初中接的是孩子的整個(gè)人生

金哥說(shuō)新能源車(chē)
2026-06-13 06:40:40
尼日爾撕毀4億美元合同,并驅(qū)逐中方高管,我方暗藏后手漂亮反擊

尼日爾撕毀4億美元合同,并驅(qū)逐中方高管,我方暗藏后手漂亮反擊

詭譎怪談
2025-04-30 22:17:42
青島鬼樓奇案:德國(guó)富商蓋洋樓死于非命,20年后,解放軍查出真相

青島鬼樓奇案:德國(guó)富商蓋洋樓死于非命,20年后,解放軍查出真相

歷來(lái)都很現(xiàn)實(shí)
2025-02-23 02:50:42
葬禮上吵翻!親家母非要女婿端骨灰,湖南媽媽當(dāng)場(chǎng)拒絕:外姓不行

葬禮上吵翻!親家母非要女婿端骨灰,湖南媽媽當(dāng)場(chǎng)拒絕:外姓不行

火山詩(shī)話(huà)
2026-06-13 11:39:12
普京向不友好國(guó)家提出建議:永遠(yuǎn)不要與俄羅斯作戰(zhàn)

普京向不友好國(guó)家提出建議:永遠(yuǎn)不要與俄羅斯作戰(zhàn)

俄羅斯衛(wèi)星通訊社
2026-06-13 16:08:03
巴拉圭一對(duì)球迷姐弟因高顏值走紅,被譽(yù)為世界杯女友/男友

巴拉圭一對(duì)球迷姐弟因高顏值走紅,被譽(yù)為世界杯女友/男友

可樂(lè)談情感
2026-06-13 19:28:40
我與父親斷絕關(guān)系10年,他去世我沒(méi)去他葬禮,三天后他戰(zhàn)友找上門(mén)

我與父親斷絕關(guān)系10年,他去世我沒(méi)去他葬禮,三天后他戰(zhàn)友找上門(mén)

千秋文化
2026-06-10 20:43:44
震驚!武漢某大學(xué)食堂貼出提示稱(chēng)“燒鵝飯為廣東俗稱(chēng),實(shí)為烤鴨”

震驚!武漢某大學(xué)食堂貼出提示稱(chēng)“燒鵝飯為廣東俗稱(chēng),實(shí)為烤鴨”

火山詩(shī)話(huà)
2026-06-13 08:00:03
把瑜伽褲穿成日常的松弛感美女

把瑜伽褲穿成日常的松弛感美女

只要高興就好
2026-04-13 14:30:30
罕見(jiàn),房貸連續(xù)兩個(gè)月負(fù)增長(zhǎng)了

罕見(jiàn),房貸連續(xù)兩個(gè)月負(fù)增長(zhǎng)了

城市財(cái)經(jīng)
2026-06-13 11:34:46
藏不住了!人民日?qǐng)?bào)言辭犀利評(píng)董路,范志毅早把真相說(shuō)透了

藏不住了!人民日?qǐng)?bào)言辭犀利評(píng)董路,范志毅早把真相說(shuō)透了

阿訊說(shuō)天下
2026-06-10 12:28:31
你吃過(guò)公司最大的瓜是什么?網(wǎng)友: 這是我吃過(guò)最大的瓜

你吃過(guò)公司最大的瓜是什么?網(wǎng)友: 這是我吃過(guò)最大的瓜

夜深?lèi)?ài)雜談
2026-06-13 23:33:10
丘天和嬌妻近照,最成功混血球員,打了9年CBA,妻子是中國(guó)人

丘天和嬌妻近照,最成功混血球員,打了9年CBA,妻子是中國(guó)人

大西體育
2026-06-13 08:38:12
大水沖了沙漠!災(zāi)禍變喜事?50,萬(wàn)畝胡楊命保住了

大水沖了沙漠!災(zāi)禍變喜事?50,萬(wàn)畝胡楊命保住了

完善法
2026-06-13 20:58:57
膽子太大了!俄議員公開(kāi)批評(píng)克宮,烏克蘭將俄語(yǔ)從保護(hù)語(yǔ)言中剔除

膽子太大了!俄議員公開(kāi)批評(píng)克宮,烏克蘭將俄語(yǔ)從保護(hù)語(yǔ)言中剔除

史政先鋒
2026-06-13 20:41:18
1981年喬清陸不滿(mǎn)黎筍,攜九人投奔我國(guó),他們后來(lái)境遇如何

1981年喬清陸不滿(mǎn)黎筍,攜九人投奔我國(guó),他們后來(lái)境遇如何

嘮叨說(shuō)歷史
2026-06-10 15:52:08
2026-06-14 07:40:49
AI科技評(píng)論 incentive-icons
AI科技評(píng)論
點(diǎn)評(píng)學(xué)術(shù),服務(wù)AI
7372文章數(shù) 20757關(guān)注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬(wàn)億美元,馬斯克再封神

頭條要聞

伊朗官員:目前版本伊美諒解備忘錄“比之前的更好”

頭條要聞

伊朗官員:目前版本伊美諒解備忘錄“比之前的更好”

體育要聞

美國(guó)4比1巴拉圭:這統(tǒng)治力真是美國(guó)隊(duì)?!

娛樂(lè)要聞

鄧超曬孫儷親手織的帽子,笑瘋?cè)W(wǎng)!

財(cái)經(jīng)要聞

梁文鋒向左,楊植麟向右

汽車(chē)要聞

深藍(lán)S07華為乾崑激光版增程車(chē)型上市 限時(shí)15.49萬(wàn)元起

態(tài)度原創(chuàng)

藝術(shù)
教育
旅游
時(shí)尚
健康

藝術(shù)要聞

廣州再建一座“小蠻腰”?190米,頂著個(gè)球,2027年見(jiàn)!

教育要聞

整體思想求值,一個(gè)視頻學(xué)會(huì)!

旅游要聞

縉云·走四方吃八方丨郝樹(shù)靜:蕉葉上的煙火

夏天穿衣要杜絕土氣感!試試精致的小香風(fēng),優(yōu)雅與俏皮并存

老人、小孩、孕婦,吃粽子有啥風(fēng)險(xiǎn)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版