網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

菲爾茲獎(jiǎng)得主0貢獻(xiàn)！GPT-5.5 Pro兩小時(shí)跑出博士級(jí)證明

2026-05-13 22:34:56　來(lái)源: 超級(jí)數(shù)學(xué)建模

廣東舉報(bào)

分享至

近日，菲爾茲獎(jiǎng)得主Timothy Gowers在個(gè)人博客上發(fā)了一篇長(zhǎng)文——

最近一次使用ChatGPT 5.5 Pro的體驗(yàn)

標(biāo)題平平無(wú)奇，內(nèi)容卻讓整個(gè)數(shù)學(xué)圈坐不住了。

文中，他親手驗(yàn)證了一個(gè)令整個(gè)數(shù)學(xué)界不寒而栗的事實(shí)：

GPT-5.5 Pro，用了不到兩個(gè)小時(shí)，獨(dú)立完成了一項(xiàng)博士論文級(jí)別的數(shù)學(xué)研究。

而Gowers本人在整個(gè)過(guò)程中，數(shù)學(xué)貢獻(xiàn)幾乎為0。

兩個(gè)小時(shí)，一章博士論文級(jí)成果。

全程2小時(shí)，菲爾茲獎(jiǎng)得主貢獻(xiàn)為0

事情是這樣的。

這幾天，Timothy Gowers拿到了ChatGPT 5.5 Pro的測(cè)試權(quán)限，決定搞一次真刀真槍的測(cè)試。

他從數(shù)學(xué)家Melvyn Nathanson的一篇新論文中，挑出了幾個(gè)關(guān)于加法數(shù)論中集合求和的未解問(wèn)題。

這些問(wèn)題的核心是：給定一個(gè)k個(gè)整數(shù)的集合A，它的h重求和集hA的可能大小有哪些？

要實(shí)現(xiàn)特定大小的求和集，集合的「直徑」最小能是多少？

Nathanson自己給出了一個(gè)指數(shù)級(jí)的上界：2^k - 1。

于是，Gowers把問(wèn)題扔給了GPT-5.5 Pro。17分鐘05秒后，AI給出了一個(gè)構(gòu)造，直接把上界從指數(shù)級(jí)干到了二次方級(jí)。

而這，顯然已經(jīng)是最優(yōu)的了。

更讓人坐不住的，是Gowers在整個(gè)過(guò)程中扮演的角色。

他沒(méi)有給出任何數(shù)學(xué)思路，沒(méi)有提供關(guān)鍵引理，更沒(méi)有指出證明方向，

Gowers只是充當(dāng)了一個(gè)「情緒價(jià)值提供者」和「排版助手」，給出的提示詞極其簡(jiǎn)單——

對(duì)，這個(gè)想法不錯(cuò)，試試看能不能成；

把這段推導(dǎo)寫(xiě)成標(biāo)準(zhǔn)的LaTeX論文格式。

博客中，Gowers在反復(fù)強(qiáng)調(diào)：提示詞「不包含任何數(shù)學(xué)輸入」。

AI走的每一步推理、每一個(gè)構(gòu)造、每一處關(guān)鍵轉(zhuǎn)折，都是它自己想出來(lái)的。

僅用了幾個(gè)小時(shí)，AI就完成了人類可能需要數(shù)月，甚至數(shù)年才能完成的工作。

換句話說(shuō)，人類頂級(jí)數(shù)學(xué)家在這場(chǎng)合作中的智力貢獻(xiàn)，約等于0。

AI給出原創(chuàng)想法，震驚MIT博士生

如果故事到這里就結(jié)束了，那頂多算是「AI又解了一道數(shù)學(xué)題」。

但后面發(fā)生的事情，才真正讓人細(xì)思極恐。

Gowers繼續(xù)追問(wèn)ChatGPT：那一般情況的h呢？這個(gè)問(wèn)題的難度陡然上升。

因?yàn)楫?dāng)h=2的時(shí)候，數(shù)學(xué)家們已完全搞清了所有可能的求和集大小。但對(duì)于一般的h，甚至不知道完整的答案是什么。

此前，MIT博士生Isaac Rajagopal已經(jīng)證明了一個(gè)指數(shù)級(jí)的上界。

Gowers于是讓GPT去看看能不能改進(jìn)拉Rajagopal的結(jié)果。

第一輪：GPT思考了16分41秒，把上界從k的指數(shù)級(jí)改進(jìn)到了k^(1/2+ε)的指數(shù)級(jí)。

這是對(duì)拉Rajagopal工作的「常規(guī)修改」。

第二輪：Gowers說(shuō)，能不能再進(jìn)一步，搞到多項(xiàng)式級(jí)？

GPT思考了13分33秒，表示「有戲」，但需要驗(yàn)證兩個(gè)技術(shù)性命題。

Gowers讓它自己驗(yàn)證，9分12秒后，GPT完成了驗(yàn)證，并在隨后的31分40秒內(nèi)寫(xiě)出了完整的預(yù)印本論文。

論文地址：https://drive.google.com/file/d/1IkJBcWYz_3J_QGsESBmMa-jrEHAJDcJB/view

最終結(jié)果：N(h,k) ≤ O(k^{10h3})——從指數(shù)級(jí)，直接躍升到多項(xiàng)式級(jí)。

Rajagopal本人看完后，給出了一個(gè)讓人五味雜陳的評(píng)價(jià)：

ChatGPT這個(gè)想法很原創(chuàng)、很巧妙。如果是我自己想出來(lái)的，我會(huì)非常驕傲。

然而，我需要一兩周才能完成的腦力風(fēng)暴，GPT只用了不到一個(gè)小時(shí)。

更重磅的是，Rajagopal詳細(xì)分析了GPT的核心創(chuàng)新——

它使用了h2-耗散集（h2-dissociated sets）來(lái)控制h階以下的關(guān)系。「這個(gè)思路，據(jù)我所知，完全是原創(chuàng)的」。

不得不說(shuō)，當(dāng)一個(gè)MIT學(xué)生用「我會(huì)為這個(gè)想法感到驕傲」來(lái)評(píng)價(jià)一個(gè)AI的數(shù)學(xué)證明時(shí)，某種范式轉(zhuǎn)移已經(jīng)悄然發(fā)生了。

頂級(jí)數(shù)學(xué)家警告：危機(jī)來(lái)了

菲爾茲獎(jiǎng)得主Gowers沒(méi)有停留在「ChatGPT很厲害」的層面，他直接把話題拉到了最尖銳的問(wèn)題：

博士生怎么辦？

這才是這篇博客真正的重量級(jí)炸彈。

在組合數(shù)學(xué)領(lǐng)域，有大量論文會(huì)提出一系列新的組合參數(shù)，并附帶一串未解問(wèn)題。

這些問(wèn)題通常不是特別難，它們的價(jià)值在于給初入科研的學(xué)生提供一個(gè)「可以攻克的目標(biāo)」，讓他們?cè)诮鉀Q一個(gè)「正式的開(kāi)放問(wèn)題」中獲得信心和成就感。

但現(xiàn)在，這條路被AI截?cái)嗔恕owers的原話說(shuō)得很直白：

過(guò)去，只要有人提出問(wèn)題就夠了。

但現(xiàn)在，僅僅被提出是不夠的，它還必須足夠難，難到LLM解決不了。

2026年至今，已有15個(gè)Erd?s開(kāi)放問(wèn)題被解決，其中11個(gè)明確標(biāo)注了AI的貢獻(xiàn)。

就在幾周前，一個(gè)23歲、沒(méi)有高等數(shù)學(xué)學(xué)位的年輕人Liam Price，用GPT-5.4 Pro在80分鐘內(nèi)解決了一個(gè)困擾數(shù)學(xué)家60年的Erd?s問(wèn)題。

菲爾茲獎(jiǎng)得主陶哲軒親自驗(yàn)證了這個(gè)證明，并將其擴(kuò)展為一個(gè)新理論的起點(diǎn)。

過(guò)去需要數(shù)年訓(xùn)練才能達(dá)到的研究能力門(mén)檻，正在被AI一夜之間碾平。

Gowers直言，「若是AI在數(shù)學(xué)領(lǐng)域以目前這個(gè)速度發(fā)展下去，那么我們將很快面臨一場(chǎng)危機(jī)」。

對(duì)此，OpenAI研究員Sebastien Bubeck深表贊同。

但也有人冷靜指出：這只是一次實(shí)驗(yàn)，不能過(guò)度外推。Nathanson的問(wèn)題雖然是開(kāi)放問(wèn)題，但難度未必代表數(shù)學(xué)前沿的天花板。

Gowers自己也承認(rèn)，他「沒(méi)有完整答案」，只是在記錄自己的經(jīng)歷。

過(guò)去兩年，類似的「AI攻克數(shù)學(xué)」敘事出現(xiàn)過(guò)好幾次，仔細(xì)看都會(huì)發(fā)現(xiàn)具體條件限制不少。

但這一次，說(shuō)話的人是菲爾茲獎(jiǎng)得主，他的判斷標(biāo)準(zhǔn)不需要額外背書(shū)。

AI數(shù)學(xué)加速度，已不可逆轉(zhuǎn)

把時(shí)間線拉長(zhǎng)一點(diǎn)就會(huì)發(fā)現(xiàn)，AI在數(shù)學(xué)領(lǐng)域的進(jìn)步曲線幾乎是垂直的。

2023年，GPT-4做不了大多數(shù)本科數(shù)學(xué)題；2024年，o1在數(shù)學(xué)競(jìng)賽中拿到了金牌水平；2025年，o3在前沿研究中開(kāi)始展現(xiàn)推理能力。

2026年5月，GPT-5.5 Pro獨(dú)立完成了博士論文級(jí)別的證明。

三年，從本科到博士。

Gowers的實(shí)驗(yàn)揭示了一個(gè)臨界點(diǎn)：AI不只是工具了。至少在某些問(wèn)題上，它已經(jīng)是一個(gè)能獨(dú)立產(chǎn)出原創(chuàng)結(jié)果的研究者。

那些曾經(jīng)需要數(shù)年苦修才能叩開(kāi)的大門(mén)，現(xiàn)在只需要一個(gè)提示框和兩個(gè)小時(shí)。

門(mén)檻沒(méi)了。但門(mén)后面的世界，可能比我們想象的更大，也更陌生。

本文轉(zhuǎn)載自新智元

編輯：桃子

參考資料：

https://x.com/wtgowers/status/2052830948685676605?s=20

https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/

何謂數(shù)學(xué)？

數(shù)學(xué)家Eduardo曾這樣回答

“數(shù)學(xué)是永恒，是真理，是一切的答案。”

為了探尋趣味數(shù)學(xué)奧秘

真切感知理性之美

數(shù)學(xué)史上傳奇的數(shù)學(xué)家們，

什么都能給你造出來(lái)。

畢竟，學(xué)數(shù)學(xué)永遠(yuǎn)都不會(huì)落伍。

數(shù)學(xué)好物

最后再來(lái)關(guān)注一下

超模君精心研發(fā)的數(shù)學(xué)文化T恤！

穿在身上的

不僅僅是信仰！

“同理可得”與“顯然易證”文化T恤

數(shù)學(xué)文化中的密碼

信息量爆炸的文字

原價(jià) 269元

超模君特惠價(jià)139元！！！

插播一則

大家好，這是【超模君】項(xiàng)目的主理人中大數(shù)學(xué)博士【大Lee】的個(gè)人Vlog視頻號(hào)，歡迎大家關(guān)注我的視頻號(hào)。

喜歡《數(shù)學(xué)有什么用系列》記得關(guān)注超模君Vlog，點(diǎn)贊和點(diǎn)小愛(ài)心哦，

一路堅(jiān)持，靠的是大家！

在這里我會(huì)爭(zhēng)取日更（大家可以監(jiān)督），一天一個(gè)主題。

在視頻號(hào)，分享知識(shí)，見(jiàn)解，生活碎片，以及家庭生活的日常花絮。

最近在做【優(yōu)質(zhì)國(guó)貨賦能】和【安全產(chǎn)品溯源】。也歡迎大家一起做云股東和云監(jiān)工。

也希望大家可以一起留言互相討論分享進(jìn)步。

點(diǎn)擊長(zhǎng)按關(guān)注

簡(jiǎn)介：超模君，數(shù)學(xué)與交叉科學(xué)教育自媒體博主，中大數(shù)學(xué)博士，有倆崽崽和一潔癖的太太。愛(ài)分享有用的數(shù)學(xué)建模知識(shí)，愛(ài)深挖有趣的交叉科學(xué)人物故事，愛(ài)為靠譜的現(xiàn)代教育、提升幸福感的產(chǎn)品打call。著有《芥子須彌·大科學(xué)家的小故事》、《數(shù)學(xué)之旅：閃耀人類的54個(gè)數(shù)學(xué)家》、《漫畫(huà)數(shù)學(xué)：閃耀人類的54個(gè)數(shù)學(xué)家》、《一份鐘數(shù)學(xué)》（已售罄）、《薛定諤的貓：漫畫(huà)大科學(xué)家的小萌寵》（已售罄）、超模君幽靈魔方、超模君丙烯馬克筆等廣受大人與孩子們喜愛(ài)的作品。

在這里，超模君不定期會(huì)有腦洞大開(kāi)，和你分享一些新研發(fā)出來(lái)的，小而美的，有故事的，有知識(shí)的理工創(chuàng)意產(chǎn)品，期待與您分享。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.