无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

留給人類數(shù)學(xué)家的懸賞不多了!谷歌DeepMind解決9道埃爾德什問(wèn)題

0
分享至

聞樂(lè) 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

AI進(jìn)軍數(shù)學(xué)界的速度太快了。

OpenAI前腳剛用內(nèi)部模型突破埃爾德什的80年單位距離問(wèn)題,谷歌DeepMind后腳就解決一個(gè)同樣卡了人類56年的埃爾德什數(shù)學(xué)難題——

最新發(fā)布AlphaProof Nexus,一套由Gemini驅(qū)動(dòng)的智能體框架,一出手就是9個(gè)埃爾德什開(kāi)放問(wèn)題



除了這9道,它還順手證明了OEIS整數(shù)序列百科里的44個(gè)猜想、搞定了一道擱置15年的代數(shù)幾何難題、還改進(jìn)了凸優(yōu)化領(lǐng)域里一個(gè)沿用已久的理論邊界。

推理成本呢?每道題幾百美元,整套證明代碼也全都開(kāi)源放在了GitHub上。



這篇論文共有20位作者,其中的Aja Huang,也是2016年AlphaGo的核心研究員。

56年沒(méi)人做出來(lái)的題,AI 給了什么答案

AlphaProof Nexus解決的這幾道題,咱挑三道最有意思的說(shuō)說(shuō)。

Erd?s#12,1970年提出,懸置56年

這道題問(wèn)的是:你能不能找出一個(gè)無(wú)限大的整數(shù)集合,滿足兩個(gè)聽(tīng)起來(lái)很別扭的條件:

第一,任意從中挑三個(gè)不同的數(shù)字a、b、c,a永遠(yuǎn)不能整除b加c的和。

第二,這組數(shù)不能太零散,在自然數(shù)里要保持一定的密度。

簡(jiǎn)單理解就是,這群數(shù)字之間,既不能一個(gè)數(shù)整除另一個(gè)數(shù),也不能一個(gè)數(shù)整除另外兩個(gè)數(shù)的和,同時(shí)數(shù)字還要分布得相對(duì)密集,不能只挑寥寥幾個(gè)數(shù)投機(jī)取巧。

從1970年開(kāi)始,就沒(méi)人能給出這個(gè)集合的完整構(gòu)造,各種局部進(jìn)展有,但始終拼不成一個(gè)整體解。



AI的解法是用中國(guó)剩余定理把大問(wèn)題拆成許多個(gè)獨(dú)立的區(qū)塊,每個(gè)區(qū)塊內(nèi)部用三項(xiàng)等差數(shù)列的回避集來(lái)滿足約束,然后把所有區(qū)塊拼回一個(gè)完整的無(wú)限集。



Erd?s#125,1996年提出,30年沒(méi)有定論

這道題聽(tīng)著就更奇怪了。

想象兩個(gè)數(shù)字集合:第一個(gè)集合里全是“在三進(jìn)制下只由數(shù)字0和1組成的整數(shù)”,第二個(gè)集合里全是“在四進(jìn)制下只由數(shù)字0和1組成的整數(shù)”。把這兩個(gè)集合里所有數(shù)字兩兩相加,得到一個(gè)新集合。

問(wèn):這個(gè)新集合里的數(shù)字在自然數(shù)中出現(xiàn)的頻率(數(shù)學(xué)上叫下密度)是不是正的?

直覺(jué)上你可能會(huì)覺(jué)得,兩種集合包含的數(shù)字本來(lái)就不算很多,加起來(lái)應(yīng)該也挺稀疏的。

但稀疏到什么程度?是徹底稀到密度歸零,還是多少保持一點(diǎn)正密度?

這中間的差別非常微妙,1996年提出后一直沒(méi)定論。

AI的答案是:密度為零。



證明思路是log?除以log?是無(wú)理數(shù)。這意味著3的冪次和4的冪次可以以任意精度彼此逼近。

利用這一點(diǎn),AI構(gòu)造了一個(gè)歸納性稀疏化論證:不斷找到兩個(gè)幾乎對(duì)齊的尺度,讓密度以0.99的比率一步步衰減,直到徹底歸零。

一個(gè)純數(shù)論的性質(zhì),解決了一個(gè)組合幾何的問(wèn)題。

Erd?s#846,1992年提出,卡了人類34年。

這是個(gè)平面幾何題,AI證明了存在這樣一個(gè)無(wú)限擴(kuò)展的平面點(diǎn)集:

你從中任意挑出有限個(gè)點(diǎn),總能發(fā)現(xiàn)其中大部分點(diǎn)是不共線的——

隨便截一段,看起來(lái)都挺正常,但當(dāng)你試圖把這個(gè)無(wú)限集合拆分成有限個(gè)“絕對(duì)沒(méi)有任何三點(diǎn)共線”的子集時(shí),辦不到。

一個(gè)集合的每個(gè)有限局部都正常,但整體頑固得不可拆分。這種全局與局部的張力,是組合幾何里最難的那一類問(wèn)題。

AI把完全圖的每條邊映射到平面上一個(gè)點(diǎn),用二次多項(xiàng)式編碼坐標(biāo),再拉上無(wú)窮Ramsey定理完成證明,把一個(gè)幾何問(wèn)題翻譯成了圖論和邏輯的語(yǔ)言。

除了這三道,還有六道分別在整除集構(gòu)造、范德瓦爾登數(shù)間隙、西頓集孤立點(diǎn)、集合拆分密度等領(lǐng)域。



同時(shí),AlphaProof Nexus還在OEIS整數(shù)序列百科里證明了44個(gè)開(kāi)放猜想,在代數(shù)幾何那邊解決了一道希爾伯特函數(shù)對(duì)數(shù)凹性的15年懸案,凸優(yōu)化那邊改進(jìn)了一個(gè)錨定梯度下降法的理論邊界。



菲爾茲獎(jiǎng)得主陶哲軒曾經(jīng)提醒過(guò),AI目前解決埃爾德什問(wèn)題的實(shí)際成功率大約在1-2%,這次谷歌的系統(tǒng)挑戰(zhàn)了353道題,解開(kāi)9道,比例剛好對(duì)上了。

用幾百美元算力換一道56年難題

AlphaProof Nexus的架構(gòu)核心用一句話就能說(shuō)清楚,Gemini 3.1 Pro生成Lean語(yǔ)言證明步驟→Lean編譯器逐行檢查→報(bào)錯(cuò)直接反饋給模型→模型根據(jù)報(bào)錯(cuò)修改→再檢查→循環(huán)到全部通過(guò)。



好家伙,這有點(diǎn)像平時(shí)寫(xiě)代碼,只不過(guò)現(xiàn)在Debug的是數(shù)學(xué)定理……



在這套框架里,DeepMind設(shè)計(jì)了四個(gè)Agent

最簡(jiǎn)單的Agent A是同時(shí)啟動(dòng)多個(gè)獨(dú)立子Agent,先靠Gemini 3.1 Pro梳理解題思路,動(dòng)手編寫(xiě)證明代碼。

寫(xiě)完立刻交給編譯器核驗(yàn),一旦報(bào)錯(cuò),錯(cuò)誤信息就會(huì)傳回模型,讓它不斷修改、重試,直到通關(guān)。

全程沒(méi)有額外輔助工具,純靠寫(xiě)代碼+查錯(cuò)循環(huán)。



Agent B多了一樣?xùn)|西,AlphaProof。

AlphaProof是DeepMind之前專門(mén)為奧數(shù)級(jí)別題目訓(xùn)練過(guò)的強(qiáng)化學(xué)習(xí)證明工具。

當(dāng)Agent A模式在某個(gè)小步驟上反復(fù)卡住、編譯器反復(fù)報(bào)錯(cuò)也修不過(guò)來(lái)時(shí),Agent B可以調(diào)用AlphaProof做一次強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的樹(shù)搜索,專門(mén)攻擊這個(gè)局部難點(diǎn)。

Agent C引入了進(jìn)化算法的思路。

前面兩種Agent的子Agent都是各自獨(dú)立工作的,互不交流。

Agent C是所有子Agent共享一個(gè)證明草圖種群,每一個(gè)子模塊都會(huì)產(chǎn)出不同的證明草稿。

然后由另一個(gè)模型從合理性、清晰度、新穎性三個(gè)維度給每一份草稿打分,用Elo評(píng)分系統(tǒng)排名。

高分草稿會(huì)相互組合,衍生出新解法,低分草稿直接淘汰,整個(gè)種群在證明空間里做進(jìn)化搜索。

Agent D是全功能完全體,進(jìn)化篩選思路+專項(xiàng)工具攻克難點(diǎn)+大模型邏輯推理,三股力量在一個(gè)框架里協(xié)同,也是這次批量破解難題的主力。



這么看下來(lái),我以為最強(qiáng)的Agent D應(yīng)該會(huì)碾壓一切,Agent A只當(dāng)個(gè)對(duì)照組。

結(jié)果沒(méi)想到論文里表明最簡(jiǎn)單的Agent A,同樣能解出全部9道題

沒(méi)有進(jìn)化算法,沒(méi)有AlphaProof,就一個(gè)LLM循環(huán)加編譯器反饋的Agent A,只是在難題上更費(fèi)錢(qián)一點(diǎn)。



研究團(tuán)隊(duì)把原因歸為兩個(gè):

  • 一是Gemini 3.1 Pro本身的能力已經(jīng)足夠強(qiáng)了;
  • 二是Lean編譯器的那層實(shí)打?qū)嵉募m錯(cuò)反饋,對(duì)AI的引導(dǎo)作用,遠(yuǎn)比人們預(yù)想的更大。

這個(gè)結(jié)果或許也在預(yù)示著,未來(lái)隨著大模型能力持續(xù)升級(jí),復(fù)雜的多工具組合系統(tǒng),可能不再是剛需,只用大模型+專業(yè)校驗(yàn)工具這套簡(jiǎn)單循環(huán),就能搞定大多數(shù)數(shù)學(xué)難題。

而且這套方案的優(yōu)勢(shì)也體現(xiàn)在成本上,單題僅需幾百美元。

埃爾德什生前為這些難題設(shè)置了懸賞,只是他不會(huì)想到——

解開(kāi)這些謎題的可能不是人類智慧,而是算力。

論文地址:https://arxiv.org/abs/2605.22763v1
Github地址:https://github.com/google-deepmind/alphaproof-nexus-results


[1]https://x.com/pushmeet/status/2058936037754224998
[2]https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
香會(huì)現(xiàn)場(chǎng)中日交鋒白熱化!中方代表“驅(qū)逐”日方,日防長(zhǎng)求美表態(tài)

香會(huì)現(xiàn)場(chǎng)中日交鋒白熱化!中方代表“驅(qū)逐”日方,日防長(zhǎng)求美表態(tài)

阿龍聊軍事
2026-05-31 08:22:57
模仿黃仁勛走紅后,“我現(xiàn)在很害怕”

模仿黃仁勛走紅后,“我現(xiàn)在很害怕”

中國(guó)新聞周刊
2026-05-30 18:22:20
賴清德進(jìn)入生死局,武統(tǒng)一觸即發(fā),4大征兆是大陸開(kāi)打的前奏?

賴清德進(jìn)入生死局,武統(tǒng)一觸即發(fā),4大征兆是大陸開(kāi)打的前奏?

聞識(shí)
2026-05-30 14:23:20
格林力挺亞歷山大:你們真覺(jué)得單憑假摔騙罰球 就能蟬聯(lián)MVP?

格林力挺亞歷山大:你們真覺(jué)得單憑假摔騙罰球 就能蟬聯(lián)MVP?

羅說(shuō)NBA
2026-05-31 06:28:31
白撿24TB硬盤(pán)!員工拆開(kāi)公司淘汰設(shè)備后直接樂(lè)壞了

白撿24TB硬盤(pán)!員工拆開(kāi)公司淘汰設(shè)備后直接樂(lè)壞了

游民星空
2026-05-31 12:27:20
離開(kāi)北京陳盈駿道別,發(fā)聲喊話,官宣決定,妻子陪同,合同已到期

離開(kāi)北京陳盈駿道別,發(fā)聲喊話,官宣決定,妻子陪同,合同已到期

阿晞體育
2026-05-29 21:52:16
“榴蓮僅退款”商家受死亡威脅!女孩哥哥揚(yáng)言要滅門(mén),已刑事立案

“榴蓮僅退款”商家受死亡威脅!女孩哥哥揚(yáng)言要滅門(mén),已刑事立案

北緯的咖啡豆
2026-05-31 10:05:15
竇驍佛系性格源自母親,有愛(ài)家庭養(yǎng)出頂級(jí)氣質(zhì)。

竇驍佛系性格源自母親,有愛(ài)家庭養(yǎng)出頂級(jí)氣質(zhì)。

湘潭市律師協(xié)會(huì)
2026-05-31 12:00:55
以色列導(dǎo)彈襲美基地,48小時(shí)內(nèi)斬首三名高官

以色列導(dǎo)彈襲美基地,48小時(shí)內(nèi)斬首三名高官

春之寞陌
2026-05-30 15:19:35
遼寧省氣象臺(tái)發(fā)布強(qiáng)對(duì)流天氣藍(lán)色預(yù)警 注意防范大風(fēng)、冰雹、短時(shí)強(qiáng)降水

遼寧省氣象臺(tái)發(fā)布強(qiáng)對(duì)流天氣藍(lán)色預(yù)警 注意防范大風(fēng)、冰雹、短時(shí)強(qiáng)降水

人民資訊
2026-05-31 12:27:09
恩里克:我們可以談?wù)撊B冠的話題,因?yàn)榫銟?lè)部配得上這一切

恩里克:我們可以談?wù)撊B冠的話題,因?yàn)榫銟?lè)部配得上這一切

懂球帝
2026-05-31 06:05:08
勵(lì)志!方媛原來(lái)是個(gè)安徽農(nóng)家女,曾在上海做過(guò)導(dǎo)購(gòu),母親還曾失業(yè)

勵(lì)志!方媛原來(lái)是個(gè)安徽農(nóng)家女,曾在上海做過(guò)導(dǎo)購(gòu),母親還曾失業(yè)

魔都姐姐雜談
2026-05-19 08:58:40
大結(jié)局將至!日本放棄救美元,中國(guó)反手加倉(cāng)黃金,美聯(lián)儲(chǔ)不敢妄動(dòng)

大結(jié)局將至!日本放棄救美元,中國(guó)反手加倉(cāng)黃金,美聯(lián)儲(chǔ)不敢妄動(dòng)

解鎖世界風(fēng)云
2026-05-30 16:26:50
陳慧琳為何會(huì)看上光頭劉建浩?原因很簡(jiǎn)單

陳慧琳為何會(huì)看上光頭劉建浩?原因很簡(jiǎn)單

南萬(wàn)說(shuō)娛26
2026-05-24 09:25:20
法網(wǎng)第8日賽程:王曦雨生死戰(zhàn)!對(duì)陣18號(hào)種子沖8強(qiáng),再創(chuàng)新紀(jì)錄?

法網(wǎng)第8日賽程:王曦雨生死戰(zhàn)!對(duì)陣18號(hào)種子沖8強(qiáng),再創(chuàng)新紀(jì)錄?

劉姚堯的文字城堡
2026-05-31 10:02:46
中國(guó)防長(zhǎng)不去,美日在晚宴上傳話,赫格塞斯斷言:一個(gè)時(shí)代已結(jié)束

中國(guó)防長(zhǎng)不去,美日在晚宴上傳話,赫格塞斯斷言:一個(gè)時(shí)代已結(jié)束

瀲滟晴方DAY
2026-05-31 13:52:24
800元買(mǎi)貓背上近8000元“貓貸”:女子簽寵物店認(rèn)養(yǎng)協(xié)議暗藏分期賬單,需支付24期"分期付款"總共7152元,市場(chǎng)監(jiān)管部門(mén)已介入調(diào)查

800元買(mǎi)貓背上近8000元“貓貸”:女子簽寵物店認(rèn)養(yǎng)協(xié)議暗藏分期賬單,需支付24期"分期付款"總共7152元,市場(chǎng)監(jiān)管部門(mén)已介入調(diào)查

極目新聞
2026-05-31 10:49:11
今天誰(shuí)才是南寧萬(wàn)象城最大的明星?

今天誰(shuí)才是南寧萬(wàn)象城最大的明星?

草莓解說(shuō)體育
2026-05-31 11:15:31
上頭了?拉亞第五輪點(diǎn)球移動(dòng)過(guò)早,直接讓出射門(mén)空間

上頭了?拉亞第五輪點(diǎn)球移動(dòng)過(guò)早,直接讓出射門(mén)空間

懂球帝
2026-05-31 03:46:29
中央再發(fā)鐵令!領(lǐng)導(dǎo)干部出現(xiàn)這15種情形 , 將不能再擔(dān)任現(xiàn)職!

中央再發(fā)鐵令!領(lǐng)導(dǎo)干部出現(xiàn)這15種情形 , 將不能再擔(dān)任現(xiàn)職!

細(xì)說(shuō)職場(chǎng)
2026-05-14 21:37:29
2026-05-31 15:00:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12712文章數(shù) 176474關(guān)注度
往期回顧 全部

科技要聞

戴爾諾基亞又回來(lái)了!AI重估老牌科技公司

頭條要聞

男子懷疑妻子出軌在車(chē)上裝定位:兄弟不給我借錢(qián)給她借

頭條要聞

男子懷疑妻子出軌在車(chē)上裝定位:兄弟不給我借錢(qián)給她借

體育要聞

阿森納用最悲壯的方式,成就了巴黎王朝

娛樂(lè)要聞

賈玲最新動(dòng)作!侯明昊給虞書(shū)欣抬轎!

財(cái)經(jīng)要聞

醫(yī)學(xué)首席轉(zhuǎn)崗搞科技,A股科技股遭遇巨震

汽車(chē)要聞

900V+3.2秒破百 領(lǐng)克10+&領(lǐng)克10上市16.99萬(wàn)元起

態(tài)度原創(chuàng)

旅游
藝術(shù)
游戲
公開(kāi)課
軍事航空

旅游要聞

廠房老宅變身文旅熱土,古村落何以孕育“新風(fēng)景”

藝術(shù)要聞

Luis Alvarez Roure | 美國(guó)現(xiàn)實(shí)主義畫(huà)家

91歲楊老頭棄坑《生化危機(jī)7》!直言:不嚇自己只想快樂(lè)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

解放軍代表質(zhì)問(wèn)日防衛(wèi)大臣:日本何時(shí)道歉

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版