![]()
近日,菲爾茲獎(jiǎng)得主Timothy Gowers在個(gè)人博客上發(fā)了一篇長(zhǎng)文——
最近一次使用ChatGPT 5.5 Pro的體驗(yàn)
標(biāo)題平平無(wú)奇,內(nèi)容卻讓整個(gè)數(shù)學(xué)圈坐不住了。
![]()
文中,他親手驗(yàn)證了一個(gè)令整個(gè)數(shù)學(xué)界不寒而栗的事實(shí):
GPT-5.5 Pro,用了不到兩個(gè)小時(shí),獨(dú)立完成了一項(xiàng)博士論文級(jí)別的數(shù)學(xué)研究。
而Gowers本人在整個(gè)過(guò)程中,數(shù)學(xué)貢獻(xiàn)幾乎為0。
![]()
兩個(gè)小時(shí),一章博士論文級(jí)成果。
![]()
01
全程2小時(shí),菲爾茲獎(jiǎng)得主貢獻(xiàn)為0
事情是這樣的。
這幾天,Timothy Gowers拿到了ChatGPT 5.5 Pro的測(cè)試權(quán)限,決定搞一次真刀真槍的測(cè)試。
他從數(shù)學(xué)家Melvyn Nathanson的一篇新論文中,挑出了幾個(gè)關(guān)于加法數(shù)論中集合求和的未解問(wèn)題。
![]()
這些問(wèn)題的核心是:給定一個(gè)k個(gè)整數(shù)的集合A,它的h重求和集hA的可能大小有哪些?
要實(shí)現(xiàn)特定大小的求和集,集合的「直徑」最小能是多少?
![]()
Nathanson自己給出了一個(gè)指數(shù)級(jí)的上界:2^k - 1。
于是,Gowers把問(wèn)題扔給了GPT-5.5 Pro。17分鐘05秒后,AI給出了一個(gè)構(gòu)造,直接把上界從指數(shù)級(jí)干到了二次方級(jí)。
而這,顯然已經(jīng)是最優(yōu)的了。
更讓人坐不住的,是Gowers在整個(gè)過(guò)程中扮演的角色。
他沒(méi)有給出任何數(shù)學(xué)思路,沒(méi)有提供關(guān)鍵引理,更沒(méi)有指出證明方向,
Gowers只是充當(dāng)了一個(gè)「情緒價(jià)值提供者」和「排版助手」,給出的提示詞極其簡(jiǎn)單——
對(duì),這個(gè)想法不錯(cuò),試試看能不能成;
把這段推導(dǎo)寫(xiě)成標(biāo)準(zhǔn)的LaTeX論文格式。
![]()
博客中,Gowers在反復(fù)強(qiáng)調(diào):提示詞「不包含任何數(shù)學(xué)輸入」。
AI走的每一步推理、每一個(gè)構(gòu)造、每一處關(guān)鍵轉(zhuǎn)折,都是它自己想出來(lái)的。
僅用了幾個(gè)小時(shí),AI就完成了人類可能需要數(shù)月,甚至數(shù)年才能完成的工作。
換句話說(shuō),人類頂級(jí)數(shù)學(xué)家在這場(chǎng)合作中的智力貢獻(xiàn),約等于0。
02
AI給出原創(chuàng)想法,震驚MIT博士生
如果故事到這里就結(jié)束了,那頂多算是「AI又解了一道數(shù)學(xué)題」。
但后面發(fā)生的事情,才真正讓人細(xì)思極恐。
Gowers繼續(xù)追問(wèn)ChatGPT:那一般情況的h呢?這個(gè)問(wèn)題的難度陡然上升。
因?yàn)楫?dāng)h=2的時(shí)候,數(shù)學(xué)家們已完全搞清了所有可能的求和集大小。但對(duì)于一般的h,甚至不知道完整的答案是什么。
此前,MIT博士生Isaac Rajagopal已經(jīng)證明了一個(gè)指數(shù)級(jí)的上界。
![]()
Gowers于是讓GPT去看看能不能改進(jìn)拉Rajagopal的結(jié)果。
第一輪:GPT思考了16分41秒,把上界從k的指數(shù)級(jí)改進(jìn)到了k^(1/2+ε)的指數(shù)級(jí)。
這是對(duì)拉Rajagopal工作的「常規(guī)修改」。
第二輪:Gowers說(shuō),能不能再進(jìn)一步,搞到多項(xiàng)式級(jí)?
GPT思考了13分33秒,表示「有戲」,但需要驗(yàn)證兩個(gè)技術(shù)性命題。
Gowers讓它自己驗(yàn)證,9分12秒后,GPT完成了驗(yàn)證,并在隨后的31分40秒內(nèi)寫(xiě)出了完整的預(yù)印本論文。
![]()
論文地址:https://drive.google.com/file/d/1IkJBcWYz_3J_QGsESBmMa-jrEHAJDcJB/view
最終結(jié)果:N(h,k) ≤ O(k^{10h3})——從指數(shù)級(jí),直接躍升到多項(xiàng)式級(jí)。
![]()
Rajagopal本人看完后,給出了一個(gè)讓人五味雜陳的評(píng)價(jià):
ChatGPT這個(gè)想法很原創(chuàng)、很巧妙。如果是我自己想出來(lái)的,我會(huì)非常驕傲。
然而,我需要一兩周才能完成的腦力風(fēng)暴,GPT只用了不到一個(gè)小時(shí)。
![]()
更重磅的是,Rajagopal詳細(xì)分析了GPT的核心創(chuàng)新——
它使用了h2-耗散集(h2-dissociated sets)來(lái)控制h階以下的關(guān)系。「這個(gè)思路,據(jù)我所知,完全是原創(chuàng)的」。
不得不說(shuō),當(dāng)一個(gè)MIT學(xué)生用「我會(huì)為這個(gè)想法感到驕傲」來(lái)評(píng)價(jià)一個(gè)AI的數(shù)學(xué)證明時(shí),某種范式轉(zhuǎn)移已經(jīng)悄然發(fā)生了。
03
頂級(jí)數(shù)學(xué)家警告:危機(jī)來(lái)了
菲爾茲獎(jiǎng)得主Gowers沒(méi)有停留在「ChatGPT很厲害」的層面,他直接把話題拉到了最尖銳的問(wèn)題:
博士生怎么辦?
這才是這篇博客真正的重量級(jí)炸彈。
![]()
在組合數(shù)學(xué)領(lǐng)域,有大量論文會(huì)提出一系列新的組合參數(shù),并附帶一串未解問(wèn)題。
這些問(wèn)題通常不是特別難,它們的價(jià)值在于給初入科研的學(xué)生提供一個(gè)「可以攻克的目標(biāo)」,讓他們?cè)诮鉀Q一個(gè)「正式的開(kāi)放問(wèn)題」中獲得信心和成就感。
但現(xiàn)在,這條路被AI截?cái)嗔恕owers的原話說(shuō)得很直白:
過(guò)去,只要有人提出問(wèn)題就夠了。
但現(xiàn)在,僅僅被提出是不夠的,它還必須足夠難,難到LLM解決不了。
![]()
![]()
2026年至今,已有15個(gè)Erd?s開(kāi)放問(wèn)題被解決,其中11個(gè)明確標(biāo)注了AI的貢獻(xiàn)。
就在幾周前,一個(gè)23歲、沒(méi)有高等數(shù)學(xué)學(xué)位的年輕人Liam Price,用GPT-5.4 Pro在80分鐘內(nèi)解決了一個(gè)困擾數(shù)學(xué)家60年的Erd?s問(wèn)題。
菲爾茲獎(jiǎng)得主陶哲軒親自驗(yàn)證了這個(gè)證明,并將其擴(kuò)展為一個(gè)新理論的起點(diǎn)。
![]()
過(guò)去需要數(shù)年訓(xùn)練才能達(dá)到的研究能力門(mén)檻,正在被AI一夜之間碾平。
Gowers直言,「若是AI在數(shù)學(xué)領(lǐng)域以目前這個(gè)速度發(fā)展下去,那么我們將很快面臨一場(chǎng)危機(jī)」。
![]()
對(duì)此,OpenAI研究員Sebastien Bubeck深表贊同。
![]()
但也有人冷靜指出:這只是一次實(shí)驗(yàn),不能過(guò)度外推。Nathanson的問(wèn)題雖然是開(kāi)放問(wèn)題,但難度未必代表數(shù)學(xué)前沿的天花板。
Gowers自己也承認(rèn),他「沒(méi)有完整答案」,只是在記錄自己的經(jīng)歷。
過(guò)去兩年,類似的「AI攻克數(shù)學(xué)」敘事出現(xiàn)過(guò)好幾次,仔細(xì)看都會(huì)發(fā)現(xiàn)具體條件限制不少。
但這一次,說(shuō)話的人是菲爾茲獎(jiǎng)得主,他的判斷標(biāo)準(zhǔn)不需要額外背書(shū)。
![]()
AI數(shù)學(xué)加速度,已不可逆轉(zhuǎn)
把時(shí)間線拉長(zhǎng)一點(diǎn)就會(huì)發(fā)現(xiàn),AI在數(shù)學(xué)領(lǐng)域的進(jìn)步曲線幾乎是垂直的。
2023年,GPT-4做不了大多數(shù)本科數(shù)學(xué)題;2024年,o1在數(shù)學(xué)競(jìng)賽中拿到了金牌水平;2025年,o3在前沿研究中開(kāi)始展現(xiàn)推理能力。
![]()
2026年5月,GPT-5.5 Pro獨(dú)立完成了博士論文級(jí)別的證明。
三年,從本科到博士。
Gowers的實(shí)驗(yàn)揭示了一個(gè)臨界點(diǎn):AI不只是工具了。至少在某些問(wèn)題上,它已經(jīng)是一個(gè)能獨(dú)立產(chǎn)出原創(chuàng)結(jié)果的研究者。
那些曾經(jīng)需要數(shù)年苦修才能叩開(kāi)的大門(mén),現(xiàn)在只需要一個(gè)提示框和兩個(gè)小時(shí)。
門(mén)檻沒(méi)了。但門(mén)后面的世界,可能比我們想象的更大,也更陌生。
本文轉(zhuǎn)載自新智元
編輯:桃子
參考資料:
https://x.com/wtgowers/status/2052830948685676605?s=20
https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/
何謂數(shù)學(xué)?
數(shù)學(xué)家Eduardo曾這樣回答
“數(shù)學(xué)是永恒,是真理,是一切的答案。”
為了探尋趣味數(shù)學(xué)奧秘
真切感知理性之美
數(shù)學(xué)史上傳奇的數(shù)學(xué)家們,
什么都能給你造出來(lái)。
畢竟,學(xué)數(shù)學(xué)永遠(yuǎn)都不會(huì)落伍。
數(shù)學(xué)好物
最后再來(lái)關(guān)注一下
超模君精心研發(fā)的數(shù)學(xué)文化T恤!
穿在身上的
不僅僅是信仰!
![]()
“同理可得”與“顯然易證”文化T恤
數(shù)學(xué)文化中的密碼
信息量爆炸的文字
原價(jià) 269元
超模君特惠價(jià)139元!!!![]()
插播一則
大家好,這是【超模君】項(xiàng)目的主理人中大數(shù)學(xué)博士【大Lee】的個(gè)人Vlog視頻號(hào),歡迎大家關(guān)注我的視頻號(hào)。
喜歡《數(shù)學(xué)有什么用系列》記得關(guān)注超模君Vlog,點(diǎn)贊和點(diǎn)小愛(ài)心哦,
一路堅(jiān)持,靠的是大家!
在這里我會(huì)爭(zhēng)取日更(大家可以監(jiān)督),一天一個(gè)主題。
在視頻號(hào),分享知識(shí),見(jiàn)解,生活碎片,以及家庭生活的日常花絮。
最近在做【優(yōu)質(zhì)國(guó)貨賦能】和【安全產(chǎn)品溯源】。也歡迎大家一起做云股東和云監(jiān)工。
也希望大家可以一起留言互相討論分享進(jìn)步。
點(diǎn)擊長(zhǎng)按關(guān)注
簡(jiǎn)介:超模君,數(shù)學(xué)與交叉科學(xué)教育自媒體博主,中大數(shù)學(xué)博士,有倆崽崽和一潔癖的太太。愛(ài)分享有用的數(shù)學(xué)建模知識(shí),愛(ài)深挖有趣的交叉科學(xué)人物故事,愛(ài)為靠譜的現(xiàn)代教育、提升幸福感的產(chǎn)品打call。著有 《芥子須彌·大科學(xué)家的小故事》、《數(shù)學(xué)之旅:閃耀人類的54個(gè)數(shù)學(xué)家》、《漫畫(huà)數(shù)學(xué):閃耀人類的54個(gè)數(shù)學(xué)家》、《一份鐘數(shù)學(xué)》 (已售罄)、《薛定諤的貓:漫畫(huà)大科學(xué)家的小萌寵》(已售罄)、超模君幽靈魔方、超模君丙烯馬克筆等廣受大人與孩子們喜愛(ài)的作品。
在這里,超模君不定期會(huì)有腦洞大開(kāi),和你分享一些新研發(fā)出來(lái)的,小而美的,有故事的,有知識(shí)的理工創(chuàng)意產(chǎn)品,期待與您分享。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.