網易首頁 > 網易號 > 正文 申請入駐

《大西洋月刊》丨陶哲軒:數學的邊界

0
分享至

The Edge of Mathematics

傳奇數學家陶哲軒闡釋生成式人工智能的前景。

作者:馬特奧·王 (Matteo Wong)


插圖:《大西洋月刊》繪制。圖片來源:Kimberly White / Getty Images

2026年2月24日

在過去的幾個月里,幾位研究人員開始提出一個相同的挑釁性主張:他們利用生成式人工智能工具解決了一個此前未解的數學難題。

那些最極端的承諾——即人工智能輔助解決數學界一些最棘手的問題——很可能最終被證明是空洞的炒作。但是,許多由人工智能撰寫的解答(盡管針對的是遠沒那么受贊譽的問題)已經通過了驗證。這些答案針對的是“埃爾德什問題”(Erd?s Problems)中的一部分——這是由匈牙利數學家保羅·埃爾德什(Paul Erd?s)提出的1000多個數學問題——是利用包括ChatGPT在內的生成式人工智能模型寫成的。OpenAI迅速宣布了一場勝利:“GPT-5.2 Pro解決了另一個開放的埃爾德什問題,”OpenAI總裁格雷格·布羅克曼(Greg Brockman)于一月份在X平臺上發帖稱,“這將是數學和科學進步狂野的一年!”

圍繞這一新聞的大部分興奮之情,源于這些人工智能所寫證明的裁決者:陶哲軒。他是加州大學洛杉磯分校(UCLA)的教授,被廣泛認為是當今世界上最偉大的在世數學家。他的認可似乎賦予了生成式人工智能最大的承諾以合法性——即推動人類知識和文明的邊界。當我本月早些時候致電陶哲軒,詢問他對人工智能能為數學帶來什么的看法時,他的態度更為溫和。他告訴我,人工智能生成的埃爾德什問題解答令人印象深刻,但并非壓倒性的:陶哲軒表示,這些機器人實際上只是取得了一些“廉價的勝利”。

陶哲軒長期以來對人工智能工具能為他的領域做些什么感到好奇,但也持保留態度。我們在2024年秋季第一次交談時,陶哲軒將聊天機器人比作“平庸但并非完全無能”的研究生。大約六個月后,他告訴我,這些模型在“某些類型的高層數學推理”方面有所進步,但缺乏創造力且會犯細微的錯誤。但在我們最近的談話中,他的態度更加樂觀。人工智能或許尚未處于解決世界上所有偉大數學問題的邊緣,但聊天機器人已經達到了可以與人類數學家協作的水平。他說,在這個過程中,這項技術正在開辟一種不同的“做數學的方式”。

本次對話經過編輯,以求簡練清晰。

馬特奧·王: 最近,關于ChatGPT解決某些埃爾德什問題的能力引起了極大轟動。在過去一年左右的時間里,您看到生成式人工智能的數學能力是如何演變的?

陶哲軒: 有一大群人非常、非常希望看到人工智能的成功故事。與此同時,也有另一群截然相反的人想要抹殺所有人工智能的進展。而事實介于兩者之間,是一個非常復雜且微妙的故事。

特別是在這些埃爾德什問題中,有一小部分是我們要真正解決的高知名度問題,然后還有長長的尾部,由非常冷僻的問題組成。人工智能非常擅長系統地探索這個長尾部分,并攻克其中最簡單的問題。但這與人類的風格截然不同。人類不會系統地瀏覽所有1000個問題并挑選出最簡單的12個來研究,而這正是人工智能正在做的事情。

這些問題之間確實存在著巨大的難度差異。看看迄今為止人工智能獨立解決的問題,你會發現:哦,好吧,它們使用的是一種標準技術。如果一位專家花半天時間研究此事,也能解決出來。當然也有更復雜的、由人工智能輔助的解決方案。我認為在短期內,我們將通過純人工智能方法在簡單問題上獲得許多快速勝利。而在接下來的幾個月里,我認為我們將看到各種形式的人機混合貢獻。

我也從出現的一些證明中學習。我喜歡閱讀它們——也許它使用了某篇1960年論文中的技巧,而我之前并不知曉。所以它可能不是超級、超級有創造力,但它是新的,并且能做到那些審視該問題的人類專家所忽略的事情。

王: 您曾寫道,當人類數學家面對一個新問題時,無論成功與否,他們都會產生見解供該領域的其他人構建基礎——這是基于人工智能的證明所無法提供的。為什么會這樣?

陶哲軒: 這些問題就像是你需要徒步前往的遙遠地點。在過去,你必須踏上一段旅程。你可以放下路標供他人跟隨,也可以繪制地圖。

人工智能工具就像是用直升機把你直接空降到目的地。你錯過了旅程本身的所有益處。你直接到達了終點,而這實際上只是解決這些問題價值的一部分。

王: 當您思考當今這些模型的能力時,除了讓非數學家能夠處理更高級的問題外,它們還能為您的領域做出什么貢獻?

陶哲軒: 如今有很多非常乏味的數學工作是我們不喜歡做的,所以我們尋找巧妙的方法來繞過它們。但人工智能會很樂意猛沖通過這些繁瑣的計算。當我們把人工智能整合到人類的工作流程中時,我們就可以滑過這些障礙。

我還認為數學家將開始在更大的規模上進行數學研究。想想科學研究中個案研究與人口調查之間的區別。如果你要在18世紀研究一種疾病,如果這是一種罕見病,你可能會研究一位患有此病的病人,記錄其所有癥狀并做詳盡的筆記。但在21世紀,你可以進行臨床試驗,給1000人用藥,進行統計分析,從而獲得關于藥物效率更精確的信息。

數學仍然很大程度上處于個案研究的水平。一篇論文會選取一兩個問題,以一種非常手工打造、高強度的方式對其進行透徹研究。這是我們的風格。但人工智能工具實現的是“群體研究”。

王: 您對人工智能模型在數學能力方面取得的進步感到驚訝嗎?

陶哲軒: 有一點驚訝。發生的很多事情是我預料到的,但它們比我預期的時間表稍微提前了一點。并沒有提前太多。

例如,在2023年,我為微軟寫了一篇文章,預測到2026年,人工智能將成為值得信賴的合著者——即其對技術論文的貢獻將達到合著者的水平。那篇文章反響不一:有人說我太過雄心勃勃,也有人說我太過悲觀。但我認為這基本上幾乎完全符合時間表。我們基本上看到人工智能的使用水平達到了我預期初級人類合著者所能做出的貢獻,尤其是那些非常樂意做苦差事并解決大量繁瑣案例的合著者。

王: 在未來一兩年內,您希望或期待生成式人工智能模型有哪些改進?

陶哲軒: 我們需要找到一個中間地帶,既鼓勵負責任地使用人工智能,又阻止不負責任的使用。這是一條需要小心行走的界線。但我們以前做到過。數學家經常使用計算機進行數值工作,當計算機輔助證明首次出現時,最初遭到了很多反對,因為人們質疑如何信任計算機代碼?但我們在20或30年里解決了這個問題。不幸的是,現在的時間表被大大壓縮了。所以我們必須在幾年內制定出我們的標準。而我們的社區通常不會移動得那么快。

有一件非常基本的事情可以幫助數學社區:當人工智能給你一個問題的答案時,通常它不會很好地表明它對這個答案有多大的把握,或者它總是會說:“我完全確定這是真的。”人類也會這樣做。無論他們對某事是否有信心,這都是非常重要的信息。暫時提出一些你不確定的事情是可以的,但重要的是要標記出你對此不確定。然而,人工智能工具并不能準確地評估它們自己的置信度。這降低了它們的有用性。我們會更欣賞誠實的人工智能。

此外,許多人工智能公司癡迷于“一鍵式”、完全自主的工作流程:你把任務交給人工智能,然后你去喝杯咖啡,回來時問題就解決了。這實際上并不理想。對于困難的問題,你真正想要的是人類與人工智能之間的對話。而人工智能公司并沒有真正促進這種互動。

如果我們能與至少一些愿意開發更多互動平臺的技術公司合作,那將會更容易被人們所接受。我們不想淪為只是按按鈕的角色。

說明:本號刊發來自各方的文章,是為了獲得更全面的信息,不代表本號支持文章中的觀點。由于微信公眾號每天只能推送一次,本站目前在騰訊新聞發布最新的文章,每天24小時不間斷更新,請在騰訊新聞中搜索“邸鈔”,或在瀏覽器中點擊:

https://news.qq.com/omn/author/8QIf3nxc64AYuDfe4wc%3D

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
江西女碩士失蹤,被發現時已在教授實驗室待6年,魔鬼真的存在

江西女碩士失蹤,被發現時已在教授實驗室待6年,魔鬼真的存在

燦爛夏天
2025-02-10 20:20:13
19歲女孩迷上韓劇,嫁給31歲殘疾韓國男人!20年過去她怎么樣了?

19歲女孩迷上韓劇,嫁給31歲殘疾韓國男人!20年過去她怎么樣了?

凡知
2026-04-21 15:34:56
世上最失敗4大工程:損失慘重,中國占倆!卻說有意料之外效果?

世上最失敗4大工程:損失慘重,中國占倆!卻說有意料之外效果?

三毛看世界
2026-04-17 16:43:17
國家出手!“京圈富少”被判入獄,和童瑤關系被扒,真實身份曝光

國家出手!“京圈富少”被判入獄,和童瑤關系被扒,真實身份曝光

林輕吟
2026-03-25 07:23:12
男子出差回國后因瘧疾死亡未被認定工傷,公司起訴人社局 法院判決:應認定為工傷

男子出差回國后因瘧疾死亡未被認定工傷,公司起訴人社局 法院判決:應認定為工傷

紅星新聞
2026-04-23 19:20:09
以色列網友疑問:猶太人若遷至中國,能否掌控這片土地?法國網友回應引發熱議

以色列網友疑問:猶太人若遷至中國,能否掌控這片土地?法國網友回應引發熱議

苗苗情感說
2026-04-22 09:13:00
地球文明已經重啟過9次,地心世界真的存在,入口在布達拉宮地下

地球文明已經重啟過9次,地心世界真的存在,入口在布達拉宮地下

易玄
2024-12-07 02:14:06
今年畢業生1270萬,青年失業率16.9%,不少人又得“靈活就業”了

今年畢業生1270萬,青年失業率16.9%,不少人又得“靈活就業”了

茶余飯好
2026-04-23 17:23:27
歌手好弟現狀:娶了中國美女,女兒長相隨他,來中國多年仍沒綠卡

歌手好弟現狀:娶了中國美女,女兒長相隨他,來中國多年仍沒綠卡

一娛三分地
2026-04-23 17:10:44
iPhone 18"不漲價"?蘋果把屏幕砍回四年前,然后叫它"先進OLED"

iPhone 18"不漲價"?蘋果把屏幕砍回四年前,然后叫它"先進OLED"

互聯網放大鏡
2026-04-23 12:37:46
廣東5歲女童吃香蕉噎死,父母向贈香蕉老人索賠73萬,結果如何?

廣東5歲女童吃香蕉噎死,父母向贈香蕉老人索賠73萬,結果如何?

雍親王府
2026-04-20 20:10:03
中東戰火還沒結束,七國1.7萬大軍壓境中國,距臺灣不足百公里

中東戰火還沒結束,七國1.7萬大軍壓境中國,距臺灣不足百公里

防衛狙擊手
2026-04-22 06:04:51
杜蘭特突然中止訓練!右膝纏滿繃帶返回更衣室,生死戰前傳來最揪心消息

杜蘭特突然中止訓練!右膝纏滿繃帶返回更衣室,生死戰前傳來最揪心消息

隱于山海
2026-04-23 12:42:56
長治31歲研究生萬達墜亡,誘因曝光,全網破防淚目

長治31歲研究生萬達墜亡,誘因曝光,全網破防淚目

洞見小能手
2026-04-23 00:30:03
馬蘇:我和孔令輝同居多年后分手,如今都沒結婚,卻只能做朋友

馬蘇:我和孔令輝同居多年后分手,如今都沒結婚,卻只能做朋友

老赳說歷史
2026-04-22 22:08:26
不知不覺都老了,這兩位演員已經不在了,你還記得他們嗎?

不知不覺都老了,這兩位演員已經不在了,你還記得他們嗎?

阿廢冷眼觀察所
2026-04-11 17:02:28
巴拿馬運河通行費創新高 美國石油運輸激增推高擁堵與成本

巴拿馬運河通行費創新高 美國石油運輸激增推高擁堵與成本

財聯社
2026-04-23 16:58:05
專家提醒:不要買!不要吃!里面含有硼砂,危害健康,別害了自己

專家提醒:不要買!不要吃!里面含有硼砂,危害健康,別害了自己

蜉蝣說
2025-10-31 10:56:39
粉底將軍與豪門已婚少婦糾纏的瓜

粉底將軍與豪門已婚少婦糾纏的瓜

十錘星人
2026-04-22 23:11:02
美國人終于清醒了,質問:特朗普女婿庫什納有什么資格去談判?

美國人終于清醒了,質問:特朗普女婿庫什納有什么資格去談判?

混沌錄
2026-04-23 17:11:07
2026-04-24 03:15:00
邸報
邸報
每天分享有意思的文章。
532文章數 132關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領袖

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領袖

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

普華永道賠償10億 恒大股東見到"回頭錢"

汽車要聞

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態度原創

家居
數碼
教育
親子
軍事航空

家居要聞

浪漫協奏 法式風格

數碼要聞

799元!小米推出米家無線吸塵器4C:170AW大吸力、75分鐘長續航

教育要聞

推薦一款高考志愿卡,五大功能助你解決志愿疑難

親子要聞

新華讀報|打乒乓球有助提高兒童注意力

軍事要聞

人民海軍成立77周年 主力艦艇亮相上海

無障礙瀏覽 進入關懷版