2026.5數(shù)學(xué)未來研討會系列——菲爾茲圓桌討論主題：價值體系——斯坦福FMS

2026-05-31 16:23:07　來源: 小樂數(shù)學(xué)科普

江蘇舉報

分享至

★置頂zzllrr小樂公眾號，追蹤《小樂數(shù)學(xué)科普》系列報道！

FMS（Future of Mathematics Symposium）“數(shù)學(xué)未來”研討會，于2026年5月1日至2日在斯坦福大學(xué)舉行。本文為菲爾茲圓桌討論全文，研討嘉賓為迪爾德麗?哈斯凱爾（Deirdre Haskell，菲爾茲研究所所長）、瑪麗娜·維亞佐夫斯卡（Maryna Viazovska，2022年菲爾茲獎得主）、陶哲軒（2006年菲爾茲獎得主）、拉維?瓦基爾（Ravi Vakil，美國數(shù)學(xué)會主席）。

人工智能和形式化方法的雙重革命正在改變數(shù)學(xué)。世界知名的數(shù)學(xué)家、計算機科學(xué)家和人工智能研究人員齊聚一堂，舉辦一系列專題講座和專題討論。研討會將探討機器學(xué)習(xí)、形式驗證和前沿推理模型如何開始重塑數(shù)學(xué)實踐。參與者將探索人工智能在純數(shù)學(xué)和應(yīng)用數(shù)學(xué)中的創(chuàng)新應(yīng)用，揭示人工智能作為證明助手、協(xié)作者和數(shù)學(xué)發(fā)現(xiàn)引擎的新興時代。這是一個關(guān)鍵時刻，可以塑造該領(lǐng)域的未來。

本次研討會由斯坦福大學(xué)HAI、SISL聯(lián)合主辦，并與數(shù)學(xué)未來研究所（FMI）合作，并得到文藝復(fù)興慈善Renaissance Philanthropy、BroadRiver Asset Management、OpenAI和KeyBank的支持。

作者：斯坦福數(shù)學(xué)未來FMS（Future of Mathematics Symposium）研討會 2026-5-2

譯者：zzllrr小樂（數(shù)學(xué)科普公眾號）2026-5-31

求喜歡

開場人：

賈里德?杜格爾?利克曼（Jared Duker Lichtman，斯坦福大學(xué)助理教授）

最后一場研討將以圓桌討論形式展開，由哈斯凱爾（Deirdre Haskell）主持。她同時也是菲爾茲數(shù)學(xué)研究所的所長。

主持人：

迪爾德麗?哈斯凱爾（Deirdre Haskell）

感謝賈里德。正如劉易斯所言，我們打算在這場收官研討中，和在座各位杰出數(shù)學(xué)家一同探討價值體系相關(guān)話題。我們珍視什么？人工智能時代下，數(shù)學(xué)領(lǐng)域的價值評判標(biāo)準(zhǔn)正在發(fā)生怎樣的轉(zhuǎn)變？

幾天前我草擬了一些問題，聽完此前所有報告后，部分問題需要稍作調(diào)整，但我還是會依次展開探討。傳統(tǒng)而言，我們非正式交流探討數(shù)學(xué)時，格外看重數(shù)學(xué)直覺與洞察力。猜想往往歸功于提出者，例如存在朗蘭茲綱領(lǐng)這類大型研究項目。但現(xiàn)行體系并不認(rèn)可這類成果，我們只嘉獎完整的證明、學(xué)術(shù)論文與研究結(jié)論。

至少傳統(tǒng)上，僅提出研究思路、規(guī)劃研究框架的論文很難得以發(fā)表。如今形勢顯然即將變化，各類報告都提及AI能夠輔助完成定理證明，這套評判激勵體系勢必迎來變革。

該如何調(diào)整數(shù)學(xué)成果評價激勵機制？調(diào)整的利弊如何？

陶哲軒，你在報告中對此已有深入闡述，不妨由你率先發(fā)言。

陶哲軒：

我不重復(fù)此前講過的內(nèi)容，但人類數(shù)學(xué)家必須提升自身能力。過去完成一篇定理證明論文，只需羅列定理、標(biāo)注參考文獻(xiàn)、附上證明過程，再輔以一頁簡短論述便可定稿，這也是常規(guī)學(xué)術(shù)論文的普遍標(biāo)準(zhǔn)。

如今我撰寫論文時，會增加大量分析論述，補充如今極易獲取的數(shù)值演算內(nèi)容，文獻(xiàn)檢索也做得更為詳盡。同時我會進一步延伸思考，提出更多以往需要耗費大量精力才能鉆研的問題。

整體而言，這是循序漸進的演變過程，無需顛覆論文撰寫、成果署名評定的固有模式。我們可以穩(wěn)步優(yōu)化論文質(zhì)量，現(xiàn)在我參與的論文常達(dá)到五至十人合著規(guī)模。為此我們也借鑒了自然科學(xué)的行文規(guī)范，增設(shè)貢獻(xiàn)說明板塊，每位作者清晰列明自身負(fù)責(zé)的工作內(nèi)容。以往數(shù)學(xué)界默認(rèn)所有合著者對整篇論文全部內(nèi)容負(fù)責(zé)，如今團隊協(xié)作模式愈發(fā)復(fù)雜，有人負(fù)責(zé)數(shù)值運算，有人調(diào)試AI指令，有人執(zhí)筆成文。我們可以借鑒科學(xué)界過往的轉(zhuǎn)型經(jīng)驗，從容適應(yīng)變化。

數(shù)學(xué)人才招聘評審與研究生教育體系的變革

主持人：還有哪位想談?wù)効捶?？瑪麗娜?/p>

瑪麗娜：

我們的工作模式必然會改變，但具體走向我還不清楚。學(xué)術(shù)發(fā)展不止關(guān)乎論文產(chǎn)出，職業(yè)發(fā)展路徑同樣關(guān)鍵，后者甚至更為重要。擁有穩(wěn)定教職后，研究者便能隨心開展研究，行事尺度相對寬松。

但我認(rèn)為數(shù)學(xué)文化的定義，取決于青年學(xué)者對從業(yè)方向的認(rèn)知。

主持人：

這實際上非常重要，這是他們需要做的、他們認(rèn)為他們需要做的，這是文化的一部分。體系引導(dǎo)著年輕人的努力目標(biāo)，這套固有認(rèn)知未來也將迎來變動嗎？拉維，你來聊聊吧。

拉維?瓦基爾：

我認(rèn)同大家的觀點，行業(yè)只會逐步演變而非徹底革新，但改變已然到來，研究者的從業(yè)初心也隨之產(chǎn)生變化。招聘評審環(huán)節(jié)將會涌現(xiàn)諸多新探討，我們需要重新界定人才評判標(biāo)準(zhǔn)。

我認(rèn)為我們的基本原則未曾改變，堅守的理念始終如一，但成果呈現(xiàn)形式、評判側(cè)重點，正如陶哲軒所言，都會有所調(diào)整。不少問題本就該盡早做出優(yōu)化。我相信多數(shù)評審團隊能夠合理應(yīng)對變化，不過受團隊理念差異影響，部分院系會做出不同決策，會做出奇怪的決定，以及嘗試一些實驗，他們會隨決策優(yōu)劣而發(fā)生興衰，尤其因為新穎而做出糟糕決策。

當(dāng)數(shù)學(xué)家們用新的但不全新（取決于你如何看待）的方式證明定理時，如何對其評估影響招聘，但和立場迥異的同事深入探討后，我的想法也常會隨之轉(zhuǎn)變。

陶哲軒：

除卻人才招聘，研究生教育體系也亟待重新評估。如今用于培養(yǎng)研究生成為優(yōu)秀數(shù)學(xué)家的習(xí)題，很多AI都能夠順利解答，這已然成為現(xiàn)實問題。

之所以成為問題，是因為當(dāng)下學(xué)界過度看重論文發(fā)表與初期成果產(chǎn)出，我們需要調(diào)整培養(yǎng)研究生的文化。布置的習(xí)題即便可以借助AI解答，也要求學(xué)生獨立完成。如何順利完成這份觀念轉(zhuǎn)變，是我們亟待解決的問題。

主持人：

既然是循序漸進的變革，我們是否會更加看重內(nèi)容闡釋與解讀能力，而非單純完成命題證明？

陶哲軒：

確實如此，闡釋解讀依舊是人類相較于AI的優(yōu)勢領(lǐng)域。數(shù)學(xué)成果的受眾目前仍是人類，遙遠(yuǎn)未來或許會出現(xiàn)AI之間交互研究的場景，但現(xiàn)階段并非如此。

正如威廉·瑟斯頓所言，數(shù)學(xué)研究的意義不止于破解難題，并非只為完成量化指標(biāo)、刷新年度定理產(chǎn)出數(shù)量。我們更希望向他人闡釋數(shù)理邏輯。過去攻克證明難關(guān)是首要目標(biāo)，內(nèi)容解讀長期處于次要地位，如今恰好迎來改善契機。

拉維?瓦基爾：

我深表贊同，內(nèi)容闡釋在過往就很重要，我們本就該更加重視。在指導(dǎo)博士生的過程中，我最深的教育心得便是錘煉學(xué)生的思維能力。透徹理解知識，才能清晰講解知識；講解知識的過程，又能反過來深化自身理解。

有個事實是，部分研究者數(shù)學(xué)原始功底不相上下，但其中有的人擅長講故事、做出解釋、表達(dá)觀點，有的人卻難以闡述自身想法，二者差距十分明顯。出色的表達(dá)能力能夠推動數(shù)理科學(xué)發(fā)展，現(xiàn)在如此，未來仍將如此，這一能力如今我們愈發(fā)重視，之所以更加關(guān)注，是因為我們剝離了一些表面的裝飾。

關(guān)于這些問題，我認(rèn)為陶哲軒提到的觀點非常關(guān)鍵。我們給學(xué)生布置的問題，AI均可解答，研究生訓(xùn)練模式隨之面臨風(fēng)險。最終能成功的學(xué)生將是那些真正具備堅韌毅力、獨立完成任務(wù)并思維訓(xùn)練良好的人。我們布置問題的原因就是鍛煉思維，這和計算器普及的道理相通，計算工具便捷高效，但培養(yǎng)數(shù)感依舊必不可少。

我們設(shè)立基準(zhǔn)測試的原因，就是讓大模型和人類解答相同問題，但目的不同。給孩童布置算術(shù)習(xí)題，目的是鍛煉思維；計算器算出答案，體現(xiàn)的是技術(shù)進步。同理，競賽題、本科習(xí)題、高中練習(xí)題，人工智能都能作答。危險在于有人會認(rèn)為：太好了，我再也不用學(xué)這個了。我不需要學(xué)習(xí)科學(xué)了，因為我可以隨時問AI任何科學(xué)問題。不需要學(xué)習(xí)科學(xué)思維，也不需要歷史思維。

類似地，在研究生階段，我們常布置“玩具問題”（toy problem），這個說法至少提過一次。設(shè)計優(yōu)質(zhì)的玩具問題就是一門藝術(shù)。其價值就在于琢磨它，甚至未必要解出答案。因此我們必須做出改變，從心理層面強化學(xué)生的能力，就像我們強化小孩子的能力，即便計算器存在，也仍需學(xué)習(xí)乘法運算。

數(shù)學(xué)論文署名方式與借鑒其他學(xué)科

主持人：陶哲軒，你提到了成果署名問題，以及多人合著論文中劃分工作貢獻(xiàn)的方式。你是否認(rèn)為這類標(biāo)注方式應(yīng)當(dāng)全面普及？

陶哲軒：

總體而言，我認(rèn)為提高透明度，如實梳理論文創(chuàng)作全過程、公開貢獻(xiàn)細(xì)節(jié)，會帶來諸多益處。當(dāng)合作規(guī)模超過一定程度，比如5人以上時，就很難維持“所有人參與所有工作”的表象?；蛟S這與論文闡述方式有關(guān)。一篇論文可以有15位作者，但其中有多少人能真正能夠當(dāng)眾講解論文、答疑解惑、吃透全部內(nèi)容？未來，解讀闡釋能力會比單純的證明推演能力更具價值，或許所有演講都會被記錄下來。如今數(shù)學(xué)家的聲望，既源于其學(xué)術(shù)成果，也源自報告宣講與思想表達(dá)方式。重視內(nèi)容闡釋和清晰提煉和解釋能力，也能妥善化解成果歸屬判定的難題。

現(xiàn)場觀眾補充：

有個極佳范例，就是人類基因組計劃采用的公平數(shù)據(jù)準(zhǔn)則，同樣可以應(yīng)用于形式化數(shù)學(xué)研究。這套準(zhǔn)則包含可檢索、可訪問、可兼容、可復(fù)用四大特性，不局限于數(shù)據(jù)范疇。數(shù)學(xué)研究如今的發(fā)展模式，堪比數(shù)學(xué)版基因組計劃。依托這套準(zhǔn)則，便能精準(zhǔn)追溯成果出處。其他領(lǐng)域成熟的規(guī)范體系，值得數(shù)學(xué)界借鑒參考。

關(guān)于數(shù)學(xué)教育和數(shù)學(xué)教學(xué)的問題

主持人：

我們應(yīng)當(dāng)向其他學(xué)科學(xué)習(xí)。接下來聊聊教育教學(xué)相關(guān)話題。拉維此前談及研究生教育，我們將視角下沉至中小學(xué)、本科階段。

或許我們天真地認(rèn)為，我們的研究生都清楚，研習(xí)習(xí)題是為鍛煉思維，理應(yīng)杜絕直接借助人工智能找答案。但低學(xué)段，無論小學(xué)、中學(xué)、本科，各類習(xí)題均可由人工智能解答，學(xué)生很容易貪圖省事，放棄獨立思考。因此我認(rèn)為教學(xué)需要做出調(diào)整，側(cè)重鍛煉解題思路、觀點表達(dá)、邏輯論證的批判性能力。但教學(xué)時長有限，新增內(nèi)容的同時，我們該刪減哪些知識板塊？

瑪麗娜：

抱歉，剛才說我們會增加什么內(nèi)容？

主持人：

我們會將焦點放在問題解決、觀點交流以及批判性的邏輯論證。若要教授這些，哪些現(xiàn)有內(nèi)容需要放棄？

瑪麗娜：

但這些內(nèi)容我們不是已經(jīng)在教了嗎？難道不是嗎，我不確定。

主持人：

希望如此。

陶哲軒：

原則上，借助新技術(shù)，可以在不同階段教授不同部分。解答數(shù)學(xué)應(yīng)用題，分為消化題意、分清所有變量、制定解題策略、確定采用何種代數(shù)變換、運算推導(dǎo)多個步驟。現(xiàn)在一個優(yōu)秀的“老師”可能會說，我來替你完成所有的計算。你精通算術(shù)與代數(shù)運算，但你不擅長構(gòu)建問題模型。智能輔導(dǎo)工具可以針對性分工，協(xié)助完成演算步驟，讓學(xué)生專注構(gòu)思解題思路。依托這類智能工具，能夠?qū)崿F(xiàn)精準(zhǔn)化教學(xué)，根據(jù)學(xué)生短板定制學(xué)習(xí)方案。不同的學(xué)生可以針對各自的薄弱環(huán)節(jié)進行訓(xùn)練。

拉維?瓦基爾：

我完全贊同。數(shù)學(xué)學(xué)科的處境相較其他專業(yè)更為緩和，但正因為我們嘗試傳遞的很相似。正如瑪麗娜所說，這不正是我們已經(jīng)在做的嗎。至少在理想狀態(tài)下，這已涵蓋在我們現(xiàn)有工作中。但特別的是，我們的職責(zé)包括育人。我們追求的教學(xué)目標(biāo)始終沒變，只是教學(xué)形式、考核方式需要優(yōu)化調(diào)整，不意味著要改變評分和評估體系。

數(shù)學(xué)學(xué)習(xí)離不開攻克長期復(fù)雜難題，學(xué)習(xí)者常會陷入思維困境?，F(xiàn)在的問題是，我們始終依賴短時間內(nèi)測試都替代指標(biāo)，它們并不完美，只能間接評判能力，評判本身本就存在局限性。

日常作業(yè)無法杜絕人工智能作弊的情況，學(xué)生可以自主選擇獨立鉆研或是借助工具。心智成熟的學(xué)生會借助AI工具補齊短板，懈怠的學(xué)生則難以得到能力提升，考核階段便能顯現(xiàn)差距。

只要考核與發(fā)展機會向健康思考的學(xué)習(xí)者傾斜，教學(xué)便能穩(wěn)步推進。論文寫作極易借助AI完成，這類長期能力也很難通過短時考核評判。只要秉持嚴(yán)謹(jǐn)?shù)慕虒W(xué)思路，學(xué)生需要掌握的核心知識不會發(fā)生大幅變動，只是學(xué)習(xí)路徑、考核形式有所調(diào)整。

但我們希望學(xué)生能夠擁有數(shù)學(xué)思維、算法邏輯、數(shù)值推演、編程應(yīng)用這些素養(yǎng)。純粹數(shù)學(xué)與應(yīng)用數(shù)學(xué)的劃分本就相對模糊，我們可以借著變革契機，聚焦核心教學(xué)目標(biāo)。我們應(yīng)該將其視為一個機會，專注于我們希望學(xué)生理解的內(nèi)容。

瑪麗娜：

或許我可以再補充一點，我認(rèn)為數(shù)學(xué)核心授課內(nèi)容無需大幅改動，現(xiàn)有知識體系足以滿足你提到的各項能力培養(yǎng)需求。但當(dāng)然新的問題會涌現(xiàn)，例如如何評估學(xué)生。

我每周都會布置課后作業(yè)，優(yōu)秀學(xué)生能夠獨立完成，收獲完整學(xué)習(xí)成效；也有部分作業(yè)行文風(fēng)格明顯出自ChatGPT之手。當(dāng)然如果學(xué)生只是通過指令，確實令人遺憾。直接索要答案的行為難以管控核查。

不過或許他們只是借助ChatGPT梳理解題思路、核對作答內(nèi)容。本科生心智成熟，應(yīng)當(dāng)從自身長遠(yuǎn)發(fā)展角度規(guī)范學(xué)習(xí)行為。我們必須相信他們會做出最有利于自己的選擇。

陶哲軒：

或許需改變的一種文化觀念是，我們應(yīng)該更開放地鼓勵犯錯并擁有失敗的自由。傳統(tǒng)數(shù)學(xué)考核體系向來嚴(yán)苛，對錯直接劃分分?jǐn)?shù)等級，致使學(xué)習(xí)困難者開始隱藏，不愿暴露錯誤，這時轉(zhuǎn)而依靠工具走捷徑獲取答案。

但如果我們營造包容試錯的學(xué)習(xí)氛圍，將失誤視作學(xué)習(xí)契機作為指向正確解題的路徑，或許就會很健壯。這樣學(xué)生便不會一味依賴AI尋求標(biāo)準(zhǔn)答案，因為他們真想?yún)⑴c這個學(xué)習(xí)過程。如果能將解題和從失敗中恢復(fù)的過程變得有趣，許多問題就會迎刃而解。

主持人：

在我看來這完全是一種高度個性化的體驗。要與學(xué)生合作并說服他們，讓他們理解失敗是學(xué)習(xí)過程中不可避免的一部分，實際上需要師生一對一互動。面對三百人的微積分大班課堂，很難實現(xiàn)針對性指導(dǎo)。我認(rèn)為本科教學(xué)模式或許需要徹底革新，深度互動式教學(xué)難以適配大規(guī)模授課場景。不知您是否認(rèn)同這種觀點？

陶哲軒：

理論上AI助教程序可以緩解這一難題。簡易互動設(shè)備已經(jīng)能夠?qū)崿F(xiàn)大班課堂互動，全員搭載AI聊天機器人后，便可快速完成個性化學(xué)情調(diào)研。

新模式探索需要勇敢地嘗試，初期效果或許不及傳統(tǒng)教學(xué)，積累經(jīng)驗后便能打造成熟可行的教學(xué)范本。

主持人：

還有你提到的評估問題，在這個作業(yè)成為某種形式的時代，批改作業(yè)變得毫無意義。因為學(xué)生為取得高分投機取巧，學(xué)習(xí)初衷淪為分?jǐn)?shù)至上而非真正掌握知識。你能想象某種方式優(yōu)化考核機制，引導(dǎo)學(xué)生潛心求知而非追逐分?jǐn)?shù)？

瑪麗娜：

我不確定，我認(rèn)為某種程度上，學(xué)生確實渴望學(xué)習(xí)知識，否則為何選擇這個特定領(lǐng)域？

主持人：

那么您教授微積分的那些大一工科學(xué)生呢？他們會不想學(xué)嗎？

拉維?瓦基爾：

我認(rèn)為精心設(shè)計的常規(guī)測試依舊具備考核價值，備考過程本身就能鞏固知識。

線下閉卷考試是有效的考核方式或許可以恢復(fù)，全程禁止電子設(shè)備使用，杜絕智能工具作弊，規(guī)范更嚴(yán)格的考核機制能夠約束學(xué)生行為。AI也可協(xié)助批改試卷，或許很快就能完美勝任這項工作。

所以我認(rèn)為如果考試設(shè)計得當(dāng)，即使分?jǐn)?shù)驅(qū)動，也仍可通過合理的評估方式引導(dǎo)學(xué)生端正態(tài)度。如果他們想學(xué)，我確信大多數(shù)學(xué)生都渴望學(xué)有所獲，這時精心設(shè)計的考核就能起到引導(dǎo)作用。我想這些都是教學(xué)領(lǐng)域的老問題了，數(shù)百年間教育領(lǐng)域始終在應(yīng)對各類考核難題。

陶哲軒：

也可以設(shè)計更具創(chuàng)意型拓展作業(yè)，允許借助AI完成復(fù)雜任務(wù)。例如代數(shù)課程中，設(shè)計融入代數(shù)元素的桌游，答對問題就能得分。自主制定游戲規(guī)則，借助AI創(chuàng)造3D打印的卡牌、代幣等配套道具。

這類創(chuàng)意項目以往很難直接布置給隨便一個高中生，因為實在太過宏大，但這類非常復(fù)雜的項目或許可行，其復(fù)雜度無法依靠AI工具一鍵生成，能夠調(diào)動學(xué)生鉆研熱情。當(dāng)然這個并非適合所有人，有些學(xué)生可能會望而生畏。或許這是個好課題，可能更容易被接受。

主持人：

這對授課教師提出了更高要求。

陶哲軒：

確實如此，如今AI時代，所有從業(yè)者都需要精進自身能力，這也是當(dāng)下的核心趨勢。

瑪麗娜：

不過根據(jù)我和學(xué)生的交流發(fā)現(xiàn)，當(dāng)大家日常頻繁接觸電子設(shè)備后，黑板板書、紙質(zhì)演算、口頭匯報這類傳統(tǒng)授課形式，反而更具吸引力。我認(rèn)為在某種程度上，當(dāng)我們走進教室時，確實缺少那些基礎(chǔ)元素。

教室里有一位導(dǎo)師，你可以與他交談，而這位導(dǎo)師是真實的人類而非AI，我認(rèn)為這方面仍然存在希望。

主持人：

為了獲得分?jǐn)?shù)，我絕對會選擇口頭報告。但這會耗費大量時間。

瑪麗娜：

也許對于300人的工程課不適用，但對某些課程而言，這實際上是一種很好的訓(xùn)練方式，從人類大腦的角度，何樂而不為呢？

人工智能倫理與抄襲界定

主持人：

OK，我想把話題轉(zhuǎn)向一個可能截然不同的角度，即關(guān)于倫理的思考，探討AI剽竊界定問題。目前有很多討論說，AI依托海量人類知識庫訓(xùn)練生成內(nèi)容，這類創(chuàng)作行為是否構(gòu)成抄襲？這與人類的學(xué)習(xí)方式，二者數(shù)據(jù)規(guī)模差距懸殊，本質(zhì)上是否不同？

陶哲軒：

通常人類引用過往文獻(xiàn)的方法思路，如果他們受過專業(yè)訓(xùn)練，創(chuàng)作時都會主動標(biāo)注出處，遵循學(xué)術(shù)規(guī)范。

AI無法識別自身輸出內(nèi)容的文獻(xiàn)溯源，引用過往研究成果時不會主動標(biāo)注。或許這個問題可以通過更好的提示詞或成本驗證等方式解決，但AI確實有時并未意識到自己正在使用文獻(xiàn)中的已有技術(shù)。這些技術(shù)通過訓(xùn)練被AI吸收消化，然后又從另一頭輸出。

短期內(nèi)的折中辦法，是在AI生成期刊論文后，額外開展人工文獻(xiàn)溯源核查，最好由行業(yè)專家憑其記憶甄別內(nèi)容出處。但論文產(chǎn)出量成千上萬飛速增長后，溯源核查的難度也會大幅增加。

短期內(nèi)期刊很可能直接拒收AI占比高的文稿；如若收錄，則堅持要求作者必須盡到勤勉核查觀點來源的義務(wù)，目前尚未形成完善的溯源規(guī)范。

瑪麗娜：

技術(shù)層面不難實現(xiàn)內(nèi)容檢索、參考文獻(xiàn)匹配，畢竟AI已經(jīng)遍歷了整個互聯(lián)網(wǎng)，它們在網(wǎng)絡(luò)檢索方面表現(xiàn)優(yōu)異，最終能生成優(yōu)質(zhì)的參考文獻(xiàn)列表，或幫我查找相似論文?？赡芪疫@個想法錯了，但這看起來是個技術(shù)可解的問題。從倫理角度，它該被解決，我也有望盡快落地。

拉維?瓦基爾：

我并沒有多少補充，認(rèn)同上述觀點。觀察法律界的應(yīng)對也很有趣。論文署名的人類作者，需要對全部內(nèi)容承擔(dān)責(zé)任，這一點和法律行業(yè)使用AI工具的準(zhǔn)則一致。因此我認(rèn)為這將會成為常態(tài)，當(dāng)使用AI時，不能以AI生成內(nèi)容為由規(guī)避學(xué)術(shù)責(zé)任，不當(dāng)使用工具會損害個人學(xué)術(shù)聲譽，同樣會產(chǎn)生某種軟實力方面的后果。

對于行為不當(dāng)者，這些后果往往可能不會受到懲處，但有時仍會引發(fā)相應(yīng)后果，這會涉及聲譽影響。關(guān)鍵在于，只要論文由人類簽署且人類需承擔(dān)責(zé)任，我們就會看到與人類現(xiàn)有情況類似的現(xiàn)象，不同個體的聲譽存在優(yōu)劣之分。

在此情境下，聲譽將取決于他們使用AI的負(fù)責(zé)程度。因為若AI未標(biāo)明出處，過錯在于人類，生產(chǎn)論文的人類完全應(yīng)當(dāng)負(fù)責(zé)核查來源。不難通過提示詞就能嘗試追溯內(nèi)容來源。因此我認(rèn)為盡管現(xiàn)行社會監(jiān)督體系并不完善，但仍可適用于此。

陶哲軒：

但這也可能讓行業(yè)滋生灰色數(shù)學(xué)學(xué)術(shù)文稿，大量智能生成的真?zhèn)味ɡ砘祀s在正統(tǒng)研究成果中，其他學(xué)科也曾遭遇同類亂象，這可能也是我們的未來。

拉維?瓦基爾：

我認(rèn)為確實如此，這正是我們審稿流程面臨的真正風(fēng)險之一?？赡軙霈F(xiàn)這種灰色論文市場，海量灰色文稿涌入期刊審核環(huán)節(jié)后，編輯會直觀拒收疑似AI生成的內(nèi)容。部分極具價值的突破性證明，也可能因行文風(fēng)格被誤判駁回。但面對海量論文時，我認(rèn)為期刊這么做可能是正確的?；疑袌龅恼撐倪€會流入營利性掠奪性期刊，進入文獻(xiàn)體系，被收錄進學(xué)術(shù)文庫后，情況就會越來越糟，最終我們將陷入某種可怕的反烏托邦。

主持人：

好吧，既然話題如此悲觀，接下來我們可以開放現(xiàn)場提問。

Q&A 問答環(huán)節(jié)

現(xiàn)場觀眾1問：

我有兩個簡短的問題，我想反轉(zhuǎn)一下關(guān)于倫理和引用的問題。問題1：如何引用那些新提出的觀點？問題2：大語言模型如何引用其他大語言模型產(chǎn)出的內(nèi)容或自己的舊版本提出的新觀點？

陶哲軒答：

我認(rèn)為我們的引用范圍，包含正式論文、預(yù)印本、博客論述、會議私下交流內(nèi)容，AI產(chǎn)出內(nèi)容同樣可以依規(guī)引用。

我的近期論文中，就標(biāo)注過AI推導(dǎo)的結(jié)論。公開說明使用情況，遠(yuǎn)比隱瞞信息更為妥當(dāng)，即使披露內(nèi)容看起來有些怪異。我甚至也曾引用麥當(dāng)勞商業(yè)廣告內(nèi)容，雖然它沒有直接啟發(fā)某個偏微分方程的解，其邏輯思路和數(shù)學(xué)解題思路存在相通之處。

現(xiàn)場觀眾2問：

陶哲軒此前提出一個深刻問題：數(shù)學(xué)的本質(zhì)是什么？在我看來，數(shù)學(xué)就像文本語言，是對客觀世界高度抽象的符號語言。計算機領(lǐng)域如今興起世界模型研究，融合視覺數(shù)據(jù)、狀態(tài)安全環(huán)境等多元數(shù)據(jù)，不再局限于文本運算。這類模型能否助力數(shù)學(xué)探索？例如發(fā)現(xiàn)新穎性、具有好的品味和審美判斷，甚至支持推理等等。你認(rèn)為這對數(shù)學(xué)發(fā)現(xiàn)有啟發(fā)嗎？

陶哲軒答：

我并非世界模型的專家，但它們尚未迎來chatGPT時刻，即展現(xiàn)出重大潛力的階段。如果它們到了這個階段，和大語言模型會各有優(yōu)劣。正如你說，數(shù)學(xué)研究高度依托語言邏輯，可以想象某些模擬類問題，例如求解一個偏微分方程，或許這些模型有些用處，我認(rèn)為這是個非常新的領(lǐng)域。

現(xiàn)場觀眾3問：

我想再聊回教學(xué)話題，可能不算提問而是評論，但很想聽聽各位的見解。教學(xué)的藝術(shù)一方面要激發(fā)學(xué)習(xí)動力，結(jié)合重要的開放難題、課堂上實操科學(xué)實驗，另一方面是清晰地闡述解釋內(nèi)容，但如今AI可以清晰講解幾乎所有本科階段各類知識，教師是否可以專職負(fù)責(zé)激發(fā)學(xué)習(xí)動機，說明學(xué)習(xí)這門學(xué)科的意義，并激發(fā)學(xué)生的學(xué)習(xí)熱情？

瑪麗娜：

目前AI講解的準(zhǔn)確性我不確定，我不確定我們是否已經(jīng)到達(dá)這種階段。舉個案例，我兒子有時用Gemini檢查高中微積分作業(yè)，結(jié)果有一半的次數(shù)給出錯誤答案。AI還可能容易誤導(dǎo)某些主題的理解讓學(xué)生困惑。常有學(xué)生拿著AI解析的內(nèi)容求教，知識點和課堂所學(xué)偏差較大。有時的確AI準(zhǔn)確，但并非總是如此。

激發(fā)學(xué)習(xí)熱情確實至關(guān)重要，不同學(xué)科可能有所差異。但就數(shù)學(xué)而言，有位同行的觀點我十分認(rèn)同，教師的口頭教學(xué)，是向?qū)W生展現(xiàn)人類鉆研數(shù)學(xué)的能力，以自身言傳身教。學(xué)生親眼目睹后，或許會因此受到激勵而投身數(shù)學(xué)。

主持人：

從某種有限意義上說，這是一種榜樣作用。

陶哲軒：

維基百科也能講解各類知識，但教師可以針對性梳理重點、剖析核心要義。因此重要的不僅是知識的廣度，更在于內(nèi)容篩選與側(cè)重點把控，這是教學(xué)不可替代的核心價值。

現(xiàn)場觀眾4問：

我想探討合規(guī)證明的判定標(biāo)準(zhǔn)。舉例來看，邁克?弗里德曼（Mike Friedman）證明（四維）龐加萊猜想時，正式論文僅留存證明綱要，他在伯克利大學(xué)連續(xù)多日（12小時或者72小時）開展研討，論證思路獲得業(yè)內(nèi)專家認(rèn)可，也憑此斬獲菲爾茲獎，數(shù)十年后才有學(xué)者出了本《脫嵌定理》The Disc Embedding Theorem完善完整證明細(xì)節(jié)。他的一系列演講，以及其他數(shù)學(xué)家撰寫的專著，這些都算是證明過程的產(chǎn)物，對吧？

如果觀察佩雷爾曼（Perelman）對龐加萊猜想的證明，以及幾何化定理，那算是完整證明嗎？只是一個猜想證明框架。當(dāng)時有3個數(shù)學(xué)家團隊耗費心力補充完整論證過程，可以說貢獻(xiàn)出新的研究思路，在某種程度上也屬于原創(chuàng)貢獻(xiàn)，但學(xué)術(shù)榮譽仍歸屬于佩雷爾曼，他得了菲爾茲獎，被認(rèn)為是解決該猜想的人，盡管實質(zhì)上得益于其他數(shù)學(xué)家對其思想的完善。

部分?jǐn)?shù)學(xué)家（如讓·布爾甘Jean Bourgain）的論文行文簡略、細(xì)節(jié)缺失，研讀時需要耗費大量精力梳理邏輯，這些論文在技術(shù)層面上確實很難讀懂；在讀格爾德·法爾廷斯的論文時，我也有這種類似感覺，對我的技術(shù)性要求太高了，所以我得付出更多的認(rèn)知努力。如果讀格羅滕迪克的EGA（《代數(shù)幾何基礎(chǔ)》），會發(fā)現(xiàn)它的內(nèi)容更成體系，細(xì)節(jié)更豐富。

因此我的問題是，可以想象這樣一個場景，某個霍奇猜想的10億行Lean證明，后續(xù)研究者誰來解讀剖析？付出大量無償勞動梳理完善證明的學(xué)者往往無法獲得相應(yīng)認(rèn)可，或許他們的工作能讓證明更清晰，但成果榮譽大多歸于最初提出證明思路的研究者。

我的夢想是，我對代數(shù)閉鏈很感興趣，期盼相關(guān)猜想得以證明。不過重申一下，我并非一個專業(yè)數(shù)學(xué)家，我認(rèn)為我的觀點無足輕重。但我可以想象，某位青年代數(shù)幾何學(xué)者的思路，有可能被大型實驗室搶先完善論證，但證明不夠嚴(yán)謹(jǐn)，他們不得不耗費大量時間來解讀證明，卻難以收獲學(xué)術(shù)認(rèn)可。

主持人：

這里涉及諸多問題，而我們剩余討論時間有限，不妨選取一個角度展開回應(yīng)即可。

陶哲軒：

你提到的讓·布爾甘，我在研究生階段時通過嘗試研讀他的論文獲益頗豐。雖然當(dāng)時我很恨它，至今我還留著一篇他的論文，上面寫著“我恨讓·布爾甘”。但正是通過這種方式，我掌握了他的研究技巧，這些技巧讓我隨后的十年受益匪淺。

而學(xué)術(shù)成果歸屬并非二元的非黑即白，是個錯綜復(fù)雜的問題。我們掌握的信息越多，披露得越充分，引用越多，我認(rèn)為我們就能以更有機的方式評估各自的貢獻(xiàn)。但我們必須擯棄“X是第一個完成Y的人”作為唯一評判標(biāo)準(zhǔn)，從而不再是個問題。而替代方案將會繁瑣得多。

現(xiàn)場觀眾5問：

數(shù)學(xué)證明中的一個常見現(xiàn)象是，證明最終成文，往往和研究者最初的直覺思路差距極大。存在性證明只需羅列滿足所有條件的數(shù)值即可，構(gòu)造出這個數(shù)字的過程和直覺思考，大多往往被省略而不會記錄。

這類思考素材對AI學(xué)習(xí)極具價值，能夠助力AI優(yōu)化推演邏輯，產(chǎn)出更易消化理解、貼合人類思維的證明過程。我想請教各位見解，是否應(yīng)當(dāng)鼓勵研究者記錄思考全過程，提升AI的消化理解這些證明的能力？

陶哲軒：

這本質(zhì)上是個激勵的問題。你可以試著鼓勵數(shù)學(xué)家們頭戴攝像頭做數(shù)學(xué)，記錄下全過程，但他們?yōu)楹我@樣做？這僅對他人訓(xùn)練AI有益，而對數(shù)學(xué)家自身毫無裨益。這個建議雖是開玩笑，但我認(rèn)為我們需要讓AI送到研究生院，親自經(jīng)歷這個學(xué)習(xí)過程。

現(xiàn)場觀眾6問：

我是本校大三學(xué)生，對今天成績評估的討論感興趣。如今數(shù)學(xué)和工程專業(yè)出現(xiàn)作業(yè)分?jǐn)?shù)上漲、考試成績下滑的現(xiàn)象，校方因此大幅提升期末考試占比，權(quán)重達(dá)到45%至50%。

我很好奇您如何看待未來評估方式的發(fā)展方向。如何優(yōu)化考核模式，包容試錯行為？能否增加低權(quán)重的小測頻次，或是課堂實操解題、課外閱讀考核相結(jié)合？但我更想了解您對未來評估體系的想法。

拉維?瓦基爾答：

我先來說說，她的觀點確實很好。

我確實認(rèn)為作業(yè)價值更低，考試價值更高的原因，并非為了分?jǐn)?shù)，而是基于簡單事實：現(xiàn)在的習(xí)題集。不同學(xué)生在習(xí)題集上做法方式不同，有些同學(xué)通過與難題搏斗獲益更多，有些同學(xué)雖提交完美答案卻未經(jīng)思考而獲益較少。

因此如果我能設(shè)計一門理想課程，理想狀態(tài)應(yīng)該是：

首先，習(xí)題集應(yīng)該允許試錯失敗。遺憾的是，只有最優(yōu)秀的學(xué)習(xí)者，我說的不是那種最聰明的，但具備最佳學(xué)習(xí)態(tài)度、能在長遠(yuǎn)發(fā)展中取得成功的學(xué)生，才能利用好這些習(xí)題集。這是他們首次面對失敗的機會，是與知識交鋒的時刻，從而認(rèn)清自己的知識盲區(qū)。

習(xí)題集以及課程的目標(biāo)都并非追求滿分，真正的目標(biāo)在于掌握知識。通過習(xí)題集，你獲得了與知識搏斗的機會。那些主動來辦公室討論的學(xué)生，即使他們借助AI學(xué)習(xí)也無妨，只要他們自主思考中掙扎學(xué)習(xí)。順帶說一下，那些僅與AI交流的學(xué)生，我十分確信AI現(xiàn)在并不能很好地完成教學(xué)任務(wù)，但我對兩年后的發(fā)展無法作預(yù)測，畢竟技術(shù)變革日新月異。因此習(xí)題集應(yīng)該成為允許失敗的第一關(guān)。

其次，我認(rèn)為持續(xù)的小型評測確實是最理想的方案。

第三，你們可能會遇到這樣的情況，接下來我細(xì)說兩句。100%看期末考試成績的舊英國模式確有缺陷，臨場狀態(tài)會極大影響成績，如果考試當(dāng)天生病，那就太糟糕了。如今提升期末考核占比，不是太讓人高興的事，也是應(yīng)對作業(yè)誠信問題的無奈之舉。

配合期中考核能夠分散壓力，督促學(xué)生穩(wěn)步學(xué)習(xí)，避免考前突擊備考，但每安排一次期中考試，就要耗費一些時間。不過我認(rèn)為你所問的正切中根本，也是我們必須回答的，你們提出這些問題，是因為渴望掌握知識，希望保持學(xué)習(xí)動力。而每周都有任務(wù)意味著你們無法靠最后臨時抱佛腳。與其直接給出一個解答，不如深思一下。這類考核優(yōu)化問題，也是師生共同探討的核心議題。

陶哲軒：

加州大學(xué)洛杉磯分校推行限時復(fù)測考核，作答錯誤后鎖定答題權(quán)限，間隔48小時左右，方可重新嘗試，作答次數(shù)不受限制，僅耗費時間成本，這樣就降低了失敗的代價，學(xué)生不會急于借助AI工具作答，而是愿意自主嘗試解題，因為他們的成績不受影響。

支持人：

本次研討第二次超時5分鐘了。感謝所有圓桌嘉賓，為期兩日的學(xué)術(shù)交流圓滿落幕。我們提出諸多深刻問題，聆聽多場精彩報告，由衷感謝賈里德與劉易斯籌辦本次會議。諸多疑問尚未得出定論，相關(guān)探討仍會持續(xù)推進。

參考資料

https://www.youtube.com/watch?v=78Rjdz1SPYM

小樂數(shù)學(xué)科普本月文章

版權(quán)聲明：本文首發(fā)于微信公眾號“zzllrr小樂”的專欄《小樂數(shù)學(xué)科普》。歡迎個人轉(zhuǎn)發(fā)。如需轉(zhuǎn)載，請在“zzllrr小樂”公眾號后臺回復(fù)“轉(zhuǎn)載”，還可通過公眾號菜單、發(fā)送郵件到zzllrr@gmail.com與我們?nèi)〉寐?lián)系。相關(guān)圖文音視頻內(nèi)容默認(rèn)遵守CC BY-NC 4.0知識共享協(xié)議，未獲作者和譯者授權(quán)，禁止用于營銷宣傳和商業(yè)目的。

·開放 · 友好 · 多元 · 普適 · 守拙·

讓數(shù)學(xué)

更加

易學(xué)易練

易教易研

易賞易玩

易見易得

易傳易及

歡迎評論、點贊、在看、在聽

收藏、分享、轉(zhuǎn)載、投稿

查看原始文章出處

點擊底部一起捐

助力騰訊公益

點擊zzllrr小樂

公眾號主頁

右上角

置頂★加星

數(shù)學(xué)科普不迷路！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.