網易首頁 > 網易號 > 正文申請入駐

AI人工智能時代的數學家們——塔瑪拉?G?科爾達（Tamara G. Kolda）

2026-04-03 00:03:41　來源: 小樂數學科普

江蘇舉報

分享至

★置頂zzllrr小樂公眾號《小樂數學科普》新鮮送到！

譯者按：

本文屬于關注AI時代一線數學家們的系列報道《AI人工智能時代的數學家們》之一，作者是塔瑪拉?G?科爾達（Tamara G. Kolda），她是美國工業與應用數學學會（SIAM）會士，她的專業領域為數學算法與數據科學計算方法，尤其專注于張量分解和隨機化算法。

塔瑪拉?G?科爾達（Tamara G. Kolda）

本文最初作為特邀文章（原文標題：《AI人工智能時代的數學研究——未來AI人工智能能否成為真正的合作者？》）發表于Silicon Reckoner博客，并且再次發表在SIAM官網。作者感謝Michael Harris提供機會與讀者分享此文。本文也可在作者的博客MathSci.ai上閱讀。

圖源：mathsci.ai

作者：Tamara G. Kolda（塔瑪拉?G?科爾達）2026-2-21

譯者：zzllrr小樂（數學科普公眾號）2026-4-3

“首次證明”（First Proof，也即首輪驗證）實驗的結果已經出爐。首次證明（First Proof）是一個由數學家團隊發起的項目，參閱，負責人包括Mohammed Abouzaid（斯坦福）、Nikhil Srivastava（UC伯克利）、Rachel Ward（UT 奧斯汀）與Lauren Williams（哈佛），旨在測試人工智能系統能否獨立解決研究級別的數學問題。項目提出了10 道原創問題，來自作者們在不同數學領域的真實研究，這些問題已有答案但尚未公開發表。（我本人也是問題貢獻者之一，參閱第10題）這些都是專業級問題，通常需要至少具備專業知識的研究生才能解答。該項目旨在建立一種真實可信的評估方式，衡量 AI 進行真正數學研究的能力（參閱：），并且計劃未來用新題目重復這項實驗。

那么，AI 系統在第一批問題上表現如何？各大 AI 公司與個人研究者都提交了他們的解題嘗試，其中不少采用了AI 與人類協作的方式。我們自己測試了Gemini Deep Research與ChatGPT 5.2 Pro，它們在 10 道題中解出了2 道（參閱）。我貢獻的第 10 題正是這兩道之一。積極的一面是，AI 找到了一種已發表的方法，而這種方法并未出現在我的原始解答中。但消極的一面是，AI 并未給出該方法的任何引用來源。我只是因為兩份 AI 生成的答案高度相似，才懷疑它們調用了已知結論，最終不得不自己手動溯源。無論我們從這項實驗中得出什么結論，有一點已經非常明確：現代 AI 的出現，將永遠改變數學研究。

在深入展開之前，我想從數學角度解釋一下什么是現代 AI 系統：它本質上是一組由訓練數據學習得到權重的方程系統。數百年來我們一直在使用數學模型，只不過通常只包含少量參數。在我剛做研究時，我從事電路仿真模型，一般只有十幾個參數。而今天的 AI 模型擁有數十億甚至上萬億參數，大到足以存儲人類知識的總和！關于 AI 是否靠 “記憶訓練數據” 工作，目前存在大量爭論。但無論如何，AI 系統歸根結底是一個確定的數學過程：一組方程生成輸出，而這種形式化也意味著它容易受到數學攻擊。 https://arxiv.org/abs/2307.15043 盡管我尊重其他人可能持有不同觀點，但我個人對 “AI 擁有意識或真正推理能力” 的說法不抱任何幻想；相反，我對 AI 系統在設計與訓練上展現的創造力與突破感到震驚。

事實上，當我在自己的數學研究中不斷嘗試使用 AI 時，我越來越被它們的能力所打動。如果某個解法在 AI 的訓練數據中可獲取，或能通過網絡搜索找到，那么 AI 很有可能解出這道題。令人印象深刻的是，即便解法使用了不同術語，或者需要從多個來源拼湊，AI 往往也能做到。在我看來，AI 做到這一點的可能性，與相關方法在文獻中的普及程度成正比。但有一個問題 —— 而且是致命問題——AI 模型無法可靠地提供知識來源。而缺乏事實核查是一個真正的隱患。AI 可能會自信滿滿地引用不存在、不真實的結論，或者直接剽竊已有文獻，正如我在自己那道題的解答中觀察到的那樣。狀態好的時候，AI 能讓人眼前一亮；狀態差的時候，我見過它歪曲自己實際完成的工作，被指出錯誤時裝作懊悔，然后再次重蹈覆轍。這一切都意味著，很難區分高質量結果與數學垃圾：那些乍一看合理、但深究細節就會崩塌的答案。問題在于，人們太容易不加驗證地接受 AI 的輸出了。

我對未來學術出版的擔憂之一，是“人類–AI 拼湊垃圾”的現象日益增多 —— 人類未經仔細、耗時的驗證，就把 AI 生成的劣質內容胡亂拼接成文。（“拼湊垃圾scrapple”類似肉碎混合制成的廉價食品，是粗制濫造spam的代名詞。）作為SIAM（美國工業與應用數學學會）出版事務副主席，我處理過大量涉及作者誠信的案例，也親眼看到了依賴 AI 走捷徑帶來的代價。編輯與審稿人需要花費更多精力來甄別低劣的學術成果。明顯的情況包括偽造引用；不那么明顯的則包括論證薄弱、引用缺失與邏輯混亂。我們已經在NeurIPS等會議上看到了 “人類–AI 拼湊垃圾” 帶來的負面影響：虛構引用正在危及這個曾經備受贊譽的學術平臺的公信力。

那么，數學的未來將會怎樣？我們不妨假設，目前 AI 系統存在的所有問題（比如引用錯誤與虛構事實）都能被解決。到那時，數學家的角色會是什么？

首先也是最重要的一點：數學家的核心角色是判斷力—— 決定該提出什么問題、該證明什么定理、該編寫什么算法。這需要擁有經驗的人來完成，這也是導師的核心工作：幫助初入研究的學者選擇值得研究的問題。作為一名應用數學家，我的主要職責，是把利益相關方提出的模糊問題，轉化為具體的數學問題。一旦問題被歸約為數學形式，我常常會與才華橫溢的合作者一起尋找答案。

回頭來看，AI 能勝任這個角色嗎？也許 AI 可以解出一個給定的數學問題，但它沒有主動求解的意愿，沒有產生創造性洞見的動力，對問題是否有意義沒有判斷，對正確的研究路徑沒有立場。

與之相反，我的合作者們都有自己的觀點。他們能夠和我辯論我們提出的問題是否恰當，啟發我采用截然不同的方法，有時甚至徹底改變我的數學觀念。

未來的數學家無疑會把 AI 系統當作強大的工具來使用 —— 就像當年他們使用計算機和互聯網一樣 —— 但數學家不會被 AI 取代。

我對數學研究未來的期望是：研究成果將由那些真正關心工作結果、對結果的正確性負有責任感、并愿意付出艱苦努力（包括仔細核查 AI 的輸出）的人來完成。

致謝

我衷心感謝我的同事Mohammed Abouzaid（斯坦福）、Andrew Blumberg（哥倫比亞）、Ernest Davis（NYU紐大）、Gary Marcus（NYU, Emeritus）、Dan Spielman（耶魯）、Nikhil Srivastava（UC伯克利）以及Lauren Williams（哈佛），感謝他們對本文的見解與反饋。

參考資料

https://www.mathsci.ai/post/future-of-math-in-age-of-ai/

https://1stproof.org

https://www.siam.org/publications/siam-news/articles/essay-the-future-of-math-research-in-the-age-of-ai/

https://www.nytimes.com/2026/02/07/science/mathematics-ai-proof-hairer.html

https://www.scientificamerican.com/article/first-proof-is-ais-toughest-math-test-yet-the-results-are-mixed/

https://www.theatlantic.com/technology/2026/01/ai-memorization-research/685552/

https://arxiv.org/abs/2307.15043

https://fortune.com/2026/01/21/neurips-ai-conferences-research-papers-hallucinations/

https://www.nytimes.com/2026/01/25/opinion/ai-human-judgment.html

小樂數學科普近期文章

·開放 · 友好 · 多元 · 普適 · 守拙·

讓數學

更加

易學易練

易教易研

易賞易玩

易見易得

易傳易及

歡迎評論、點贊、在看、在聽

收藏、分享、轉載、投稿

查看原始文章出處

點擊zzllrr小樂

公眾號主頁

右上角

置頂★加星

數學科普不迷路！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.