★置頂zzllrr小樂公眾號《小樂數學科普》新鮮送到!
譯者按:
本文屬于關注AI時代一線數學家們的系列報道《AI人工智能時代的數學家們》之一,作者是塔瑪拉?G?科爾達(Tamara G. Kolda),她是美國工業與應用數學學會(SIAM)會士,她的專業領域為數學算法與數據科學計算方法,尤其專注于張量分解和隨機化算法。
![]()
塔瑪拉?G?科爾達(Tamara G. Kolda)
本文最初作為特邀文章(原文標題:《AI人工智能時代的數學研究——未來AI人工智能能否成為真正的合作者?》)發表于Silicon Reckoner博客,并且再次發表在SIAM官網。作者感謝Michael Harris提供機會與讀者分享此文。本文也可在作者的博客MathSci.ai上閱讀。
![]()
圖源:mathsci.ai
作者:Tamara G. Kolda(塔瑪拉?G?科爾達)2026-2-21
譯者:zzllrr小樂(數學科普公眾號)2026-4-3
“首次證明”(First Proof,也即首輪驗證) 實驗的結果已經出爐。首次證明(First Proof)是一個由數學家團隊發起的項目,參閱,負責人包括Mohammed Abouzaid(斯坦福)、Nikhil Srivastava(UC伯克利)、Rachel Ward(UT 奧斯汀)與Lauren Williams(哈佛),旨在測試人工智能系統能否獨立解決研究級別的數學問題。項目提出了10 道原創問題,來自作者們在不同數學領域的真實研究,這些問題已有答案但尚未公開發表。(我本人也是問題貢獻者之一,參閱第10題)這些都是專業級問題,通常需要至少具備專業知識的研究生才能解答。該項目旨在建立一種真實可信的評估方式,衡量 AI 進行真正數學研究的能力 (參閱:),并且計劃未來用新題目重復這項實驗。
那么,AI 系統在第一批問題上表現如何?各大 AI 公司與個人研究者都提交了他們的解題嘗試,其中不少采用了AI 與人類協作的方式。我們自己測試了Gemini Deep Research與ChatGPT 5.2 Pro,它們在 10 道題中解出了2 道 (參閱)。我貢獻的第 10 題正是這兩道之一。積極的一面是,AI 找到了一種已發表的方法,而這種方法并未出現在我的原始解答中。但消極的一面是,AI 并未給出該方法的任何引用來源。我只是因為兩份 AI 生成的答案高度相似,才懷疑它們調用了已知結論,最終不得不自己手動溯源。無論我們從這項實驗中得出什么結論,有一點已經非常明確:現代 AI 的出現,將永遠改變數學研究。
在深入展開之前,我想從數學角度解釋一下什么是現代 AI 系統:它本質上是一組由訓練數據學習得到權重的方程系統。數百年來我們一直在使用數學模型,只不過通常只包含少量參數。在我剛做研究時,我從事電路仿真模型,一般只有十幾個參數。而今天的 AI 模型擁有數十億甚至上萬億參數,大到足以存儲人類知識的總和!關于 AI 是否靠 “記憶訓練數據” 工作,目前存在大量爭論。但無論如何,AI 系統歸根結底是一個確定的數學過程:一組方程生成輸出,而這種形式化也意味著它容易受到數學攻擊。 https://arxiv.org/abs/2307.15043 盡管我尊重其他人可能持有不同觀點,但我個人對 “AI 擁有意識或真正推理能力” 的說法不抱任何幻想;相反,我對 AI 系統在設計與訓練上展現的創造力與突破感到震驚。
事實上,當我在自己的數學研究中不斷嘗試使用 AI 時,我越來越被它們的能力所打動。如果某個解法在 AI 的訓練數據中可獲取,或能通過網絡搜索找到,那么 AI 很有可能解出這道題。令人印象深刻的是,即便解法使用了不同術語,或者需要從多個來源拼湊,AI 往往也能做到。在我看來,AI 做到這一點的可能性,與相關方法在文獻中的普及程度成正比。但有一個問題 —— 而且是致命問題——AI 模型無法可靠地提供知識來源。而缺乏事實核查是一個真正的隱患。AI 可能會自信滿滿地引用不存在、不真實的結論,或者直接剽竊已有文獻,正如我在自己那道題的解答中觀察到的那樣。狀態好的時候,AI 能讓人眼前一亮;狀態差的時候,我見過它歪曲自己實際完成的工作,被指出錯誤時裝作懊悔,然后再次重蹈覆轍。這一切都意味著,很難區分高質量結果與數學垃圾:那些乍一看合理、但深究細節就會崩塌的答案。問題在于,人們太容易不加驗證地接受 AI 的輸出了。
我對未來學術出版的擔憂之一,是“人類–AI 拼湊垃圾”的現象日益增多 —— 人類未經仔細、耗時的驗證,就把 AI 生成的劣質內容胡亂拼接成文。(“拼湊垃圾scrapple”類似肉碎混合制成的廉價食品,是粗制濫造spam的代名詞。)作為SIAM(美國工業與應用數學學會)出版事務副主席,我處理過大量涉及作者誠信的案例,也親眼看到了依賴 AI 走捷徑帶來的代價。編輯與審稿人需要花費更多精力來甄別低劣的學術成果。明顯的情況包括偽造引用;不那么明顯的則包括論證薄弱、引用缺失與邏輯混亂。我們已經在NeurIPS等會議上看到了 “人類–AI 拼湊垃圾” 帶來的負面影響:虛構引用正在危及這個曾經備受贊譽的學術平臺的公信力。
那么,數學的未來將會怎樣?我們不妨假設,目前 AI 系統存在的所有問題(比如引用錯誤與虛構事實)都能被解決。到那時,數學家的角色會是什么?
首先也是最重要的一點:數學家的核心角色是判斷力—— 決定該提出什么問題、該證明什么定理、該編寫什么算法。這需要擁有經驗的人來完成,這也是導師的核心工作:幫助初入研究的學者選擇值得研究的問題。作為一名應用數學家,我的主要職責,是把利益相關方提出的模糊問題,轉化為具體的數學問題。一旦問題被歸約為數學形式,我常常會與才華橫溢的合作者一起尋找答案。
回頭來看,AI 能勝任這個角色嗎?也許 AI 可以解出一個給定的數學問題,但它沒有主動求解的意愿,沒有產生創造性洞見的動力,對問題是否有意義沒有判斷,對正確的研究路徑沒有立場。
與之相反,我的合作者們都有自己的觀點。他們能夠和我辯論我們提出的問題是否恰當,啟發我采用截然不同的方法,有時甚至徹底改變我的數學觀念。
未來的數學家無疑會把 AI 系統當作強大的工具來使用 —— 就像當年他們使用計算機和互聯網一樣 —— 但數學家不會被 AI 取代。
我對數學研究未來的期望是:研究成果將由那些真正關心工作結果、對結果的正確性負有責任感、并愿意付出艱苦努力(包括仔細核查 AI 的輸出)的人來完成。
致謝
我衷心感謝我的同事Mohammed Abouzaid(斯坦福)、Andrew Blumberg(哥倫比亞)、Ernest Davis(NYU紐大)、Gary Marcus(NYU, Emeritus)、Dan Spielman(耶魯)、Nikhil Srivastava(UC伯克利)以及Lauren Williams(哈佛),感謝他們對本文的見解與反饋。
參考資料
https://www.mathsci.ai/post/future-of-math-in-age-of-ai/
https://1stproof.org
https://www.siam.org/publications/siam-news/articles/essay-the-future-of-math-research-in-the-age-of-ai/
https://www.nytimes.com/2026/02/07/science/mathematics-ai-proof-hairer.html
https://www.scientificamerican.com/article/first-proof-is-ais-toughest-math-test-yet-the-results-are-mixed/
https://www.theatlantic.com/technology/2026/01/ai-memorization-research/685552/
https://arxiv.org/abs/2307.15043
https://fortune.com/2026/01/21/neurips-ai-conferences-research-papers-hallucinations/
https://www.nytimes.com/2026/01/25/opinion/ai-human-judgment.html
小樂數學科普近期文章
·開放 · 友好 · 多元 · 普適 · 守拙·![]()
讓數學
更加
易學易練
易教易研
易賞易玩
易見易得
易傳易及
歡迎評論、點贊、在看、在聽
收藏、分享、轉載、投稿
查看原始文章出處
點擊zzllrr小樂
公眾號主頁
右上角
置頂★加星
數學科普不迷路!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.