无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

2026.5數(shù)學(xué)未來研討會系列——菲爾茲圓桌討論主題:價值體系——斯坦福FMS

0
分享至

置頂zzllrr小樂公眾號,追蹤《小樂數(shù)學(xué)科普》系列報道!

FMS(Future of Mathematics Symposium)“數(shù)學(xué)未來”研討會,于2026年5月1日至2日在斯坦福大學(xué)舉行。本文為菲爾茲圓桌討論全文,研討嘉賓為迪爾德麗?哈斯凱爾(Deirdre Haskell,菲爾茲研究所所長)、瑪麗娜·維亞佐夫斯卡(Maryna Viazovska,2022年菲爾茲獎得主)、陶哲軒(2006年菲爾茲獎得主)、拉維?瓦基爾(Ravi Vakil,美國數(shù)學(xué)會主席)。


人工智能和形式化方法的雙重革命正在改變數(shù)學(xué)。世界知名的數(shù)學(xué)家、計算機科學(xué)家和人工智能研究人員齊聚一堂,舉辦一系列專題講座和專題討論。研討會將探討機器學(xué)習(xí)、形式驗證和前沿推理模型如何開始重塑數(shù)學(xué)實踐。參與者將探索人工智能在純數(shù)學(xué)和應(yīng)用數(shù)學(xué)中的創(chuàng)新應(yīng)用,揭示人工智能作為證明助手、協(xié)作者和數(shù)學(xué)發(fā)現(xiàn)引擎的新興時代。這是一個關(guān)鍵時刻,可以塑造該領(lǐng)域的未來。

本次研討會由斯坦福大學(xué)HAI、SISL聯(lián)合主辦,并與數(shù)學(xué)未來研究所(FMI)合作,并得到文藝復(fù)興慈善Renaissance Philanthropy、BroadRiver Asset Management、OpenAI和KeyBank的支持。

作者:斯坦福數(shù)學(xué)未來FMS(Future of Mathematics Symposium)研討會 2026-5-2

譯者:zzllrr小樂(數(shù)學(xué)科普公眾號)2026-5-31

求喜歡

開場人

賈里德?杜格爾?利克曼(Jared Duker Lichtman,斯坦福大學(xué)助理教授)

最后一場研討將以圓桌討論形式展開,由哈斯凱爾(Deirdre Haskell)主持。她同時也是菲爾茲數(shù)學(xué)研究所的所長。

主持人:

迪爾德麗?哈斯凱爾(Deirdre Haskell)

感謝賈里德。正如劉易斯所言,我們打算在這場收官研討中,和在座各位杰出數(shù)學(xué)家一同探討價值體系相關(guān)話題。我們珍視什么?人工智能時代下,數(shù)學(xué)領(lǐng)域的價值評判標(biāo)準(zhǔn)正在發(fā)生怎樣的轉(zhuǎn)變?

幾天前我草擬了一些問題,聽完此前所有報告后,部分問題需要稍作調(diào)整,但我還是會依次展開探討。傳統(tǒng)而言,我們非正式交流探討數(shù)學(xué)時,格外看重數(shù)學(xué)直覺與洞察力。猜想往往歸功于提出者,例如存在朗蘭茲綱領(lǐng)這類大型研究項目。但現(xiàn)行體系并不認(rèn)可這類成果,我們只嘉獎完整的證明、學(xué)術(shù)論文與研究結(jié)論。

至少傳統(tǒng)上,僅提出研究思路、規(guī)劃研究框架的論文很難得以發(fā)表。如今形勢顯然即將變化,各類報告都提及AI能夠輔助完成定理證明,這套評判激勵體系勢必迎來變革。

該如何調(diào)整數(shù)學(xué)成果評價激勵機制?調(diào)整的利弊如何?

陶哲軒,你在報告中對此已有深入闡述,不妨由你率先發(fā)言。

陶哲軒:

我不重復(fù)此前講過的內(nèi)容,但人類數(shù)學(xué)家必須提升自身能力。過去完成一篇定理證明論文,只需羅列定理、標(biāo)注參考文獻(xiàn)、附上證明過程,再輔以一頁簡短論述便可定稿,這也是常規(guī)學(xué)術(shù)論文的普遍標(biāo)準(zhǔn)。

如今我撰寫論文時,會增加大量分析論述,補充如今極易獲取的數(shù)值演算內(nèi)容,文獻(xiàn)檢索也做得更為詳盡。同時我會進一步延伸思考,提出更多以往需要耗費大量精力才能鉆研的問題。

整體而言,這是循序漸進的演變過程,無需顛覆論文撰寫、成果署名評定的固有模式。我們可以穩(wěn)步優(yōu)化論文質(zhì)量,現(xiàn)在我參與的論文常達(dá)到五至十人合著規(guī)模。為此我們也借鑒了自然科學(xué)的行文規(guī)范,增設(shè)貢獻(xiàn)說明板塊,每位作者清晰列明自身負(fù)責(zé)的工作內(nèi)容。以往數(shù)學(xué)界默認(rèn)所有合著者對整篇論文全部內(nèi)容負(fù)責(zé),如今團隊協(xié)作模式愈發(fā)復(fù)雜,有人負(fù)責(zé)數(shù)值運算,有人調(diào)試AI指令,有人執(zhí)筆成文。我們可以借鑒科學(xué)界過往的轉(zhuǎn)型經(jīng)驗,從容適應(yīng)變化。

數(shù)學(xué)人才招聘評審與研究生教育體系的變革

主持人:還有哪位想談?wù)効捶??瑪麗娜?/p>

瑪麗娜:

我們的工作模式必然會改變,但具體走向我還不清楚。學(xué)術(shù)發(fā)展不止關(guān)乎論文產(chǎn)出,職業(yè)發(fā)展路徑同樣關(guān)鍵,后者甚至更為重要。擁有穩(wěn)定教職后,研究者便能隨心開展研究,行事尺度相對寬松。

但我認(rèn)為數(shù)學(xué)文化的定義,取決于青年學(xué)者對從業(yè)方向的認(rèn)知。

主持人:

這實際上非常重要,這是他們需要做的、他們認(rèn)為他們需要做的,這是文化的一部分。體系引導(dǎo)著年輕人的努力目標(biāo),這套固有認(rèn)知未來也將迎來變動嗎?拉維,你來聊聊吧。

拉維?瓦基爾

我認(rèn)同大家的觀點,行業(yè)只會逐步演變而非徹底革新,但改變已然到來,研究者的從業(yè)初心也隨之產(chǎn)生變化。招聘評審環(huán)節(jié)將會涌現(xiàn)諸多新探討,我們需要重新界定人才評判標(biāo)準(zhǔn)。

我認(rèn)為我們的基本原則未曾改變,堅守的理念始終如一,但成果呈現(xiàn)形式、評判側(cè)重點,正如陶哲軒所言,都會有所調(diào)整。不少問題本就該盡早做出優(yōu)化。我相信多數(shù)評審團隊能夠合理應(yīng)對變化,不過受團隊理念差異影響,部分院系會做出不同決策,會做出奇怪的決定,以及嘗試一些實驗,他們會隨決策優(yōu)劣而發(fā)生興衰,尤其因為新穎而做出糟糕決策。

當(dāng)數(shù)學(xué)家們用新的但不全新(取決于你如何看待)的方式證明定理時,如何對其評估影響招聘,但和立場迥異的同事深入探討后,我的想法也常會隨之轉(zhuǎn)變。

陶哲軒:

除卻人才招聘,研究生教育體系也亟待重新評估。如今用于培養(yǎng)研究生成為優(yōu)秀數(shù)學(xué)家的習(xí)題,很多AI都能夠順利解答,這已然成為現(xiàn)實問題。

之所以成為問題,是因為當(dāng)下學(xué)界過度看重論文發(fā)表與初期成果產(chǎn)出,我們需要調(diào)整培養(yǎng)研究生的文化。布置的習(xí)題即便可以借助AI解答,也要求學(xué)生獨立完成。如何順利完成這份觀念轉(zhuǎn)變,是我們亟待解決的問題。

主持人:

既然是循序漸進的變革,我們是否會更加看重內(nèi)容闡釋與解讀能力,而非單純完成命題證明?

陶哲軒:

確實如此,闡釋解讀依舊是人類相較于AI的優(yōu)勢領(lǐng)域。數(shù)學(xué)成果的受眾目前仍是人類,遙遠(yuǎn)未來或許會出現(xiàn)AI之間交互研究的場景,但現(xiàn)階段并非如此。

正如威廉·瑟斯頓所言,數(shù)學(xué)研究的意義不止于破解難題,并非只為完成量化指標(biāo)、刷新年度定理產(chǎn)出數(shù)量。我們更希望向他人闡釋數(shù)理邏輯。過去攻克證明難關(guān)是首要目標(biāo),內(nèi)容解讀長期處于次要地位,如今恰好迎來改善契機。

拉維?瓦基爾

我深表贊同,內(nèi)容闡釋在過往就很重要,我們本就該更加重視。在指導(dǎo)博士生的過程中,我最深的教育心得便是錘煉學(xué)生的思維能力。透徹理解知識,才能清晰講解知識;講解知識的過程,又能反過來深化自身理解。

有個事實是,部分研究者數(shù)學(xué)原始功底不相上下,但其中有的人擅長講故事、做出解釋、表達(dá)觀點,有的人卻難以闡述自身想法,二者差距十分明顯。出色的表達(dá)能力能夠推動數(shù)理科學(xué)發(fā)展,現(xiàn)在如此,未來仍將如此,這一能力如今我們愈發(fā)重視,之所以更加關(guān)注,是因為我們剝離了一些表面的裝飾。

關(guān)于這些問題,我認(rèn)為陶哲軒提到的觀點非常關(guān)鍵。我們給學(xué)生布置的問題,AI均可解答,研究生訓(xùn)練模式隨之面臨風(fēng)險。最終能成功的學(xué)生將是那些真正具備堅韌毅力、獨立完成任務(wù)并思維訓(xùn)練良好的人。我們布置問題的原因就是鍛煉思維,這和計算器普及的道理相通,計算工具便捷高效,但培養(yǎng)數(shù)感依舊必不可少。

我們設(shè)立基準(zhǔn)測試的原因,就是讓大模型和人類解答相同問題,但目的不同。給孩童布置算術(shù)習(xí)題,目的是鍛煉思維;計算器算出答案,體現(xiàn)的是技術(shù)進步。同理,競賽題、本科習(xí)題、高中練習(xí)題,人工智能都能作答。危險在于有人會認(rèn)為:太好了,我再也不用學(xué)這個了。我不需要學(xué)習(xí)科學(xué)了,因為我可以隨時問AI任何科學(xué)問題。不需要學(xué)習(xí)科學(xué)思維,也不需要歷史思維。

類似地,在研究生階段,我們常布置“玩具問題”(toy problem),這個說法至少提過一次。設(shè)計優(yōu)質(zhì)的玩具問題就是一門藝術(shù)。其價值就在于琢磨它,甚至未必要解出答案。因此我們必須做出改變,從心理層面強化學(xué)生的能力,就像我們強化小孩子的能力,即便計算器存在,也仍需學(xué)習(xí)乘法運算。

數(shù)學(xué)論文署名方式與借鑒其他學(xué)科

主持人:陶哲軒,你提到了成果署名問題,以及多人合著論文中劃分工作貢獻(xiàn)的方式。你是否認(rèn)為這類標(biāo)注方式應(yīng)當(dāng)全面普及?

陶哲軒:

總體而言,我認(rèn)為提高透明度,如實梳理論文創(chuàng)作全過程、公開貢獻(xiàn)細(xì)節(jié),會帶來諸多益處。當(dāng)合作規(guī)模超過一定程度,比如5人以上時,就很難維持“所有人參與所有工作”的表象?;蛟S這與論文闡述方式有關(guān)。一篇論文可以有15位作者,但其中有多少人能真正能夠當(dāng)眾講解論文、答疑解惑、吃透全部內(nèi)容?未來,解讀闡釋能力會比單純的證明推演能力更具價值,或許所有演講都會被記錄下來。如今數(shù)學(xué)家的聲望,既源于其學(xué)術(shù)成果,也源自報告宣講與思想表達(dá)方式。重視內(nèi)容闡釋和清晰提煉和解釋能力,也能妥善化解成果歸屬判定的難題。

現(xiàn)場觀眾補充:

有個極佳范例,就是人類基因組計劃采用的公平數(shù)據(jù)準(zhǔn)則,同樣可以應(yīng)用于形式化數(shù)學(xué)研究。這套準(zhǔn)則包含可檢索、可訪問、可兼容、可復(fù)用四大特性,不局限于數(shù)據(jù)范疇。數(shù)學(xué)研究如今的發(fā)展模式,堪比數(shù)學(xué)版基因組計劃。依托這套準(zhǔn)則,便能精準(zhǔn)追溯成果出處。其他領(lǐng)域成熟的規(guī)范體系,值得數(shù)學(xué)界借鑒參考。

關(guān)于數(shù)學(xué)教育和數(shù)學(xué)教學(xué)的問題

主持人:

我們應(yīng)當(dāng)向其他學(xué)科學(xué)習(xí)。接下來聊聊教育教學(xué)相關(guān)話題。拉維此前談及研究生教育,我們將視角下沉至中小學(xué)、本科階段。

或許我們天真地認(rèn)為,我們的研究生都清楚,研習(xí)習(xí)題是為鍛煉思維,理應(yīng)杜絕直接借助人工智能找答案。但低學(xué)段,無論小學(xué)、中學(xué)、本科,各類習(xí)題均可由人工智能解答,學(xué)生很容易貪圖省事,放棄獨立思考。因此我認(rèn)為教學(xué)需要做出調(diào)整,側(cè)重鍛煉解題思路、觀點表達(dá)、邏輯論證的批判性能力。但教學(xué)時長有限,新增內(nèi)容的同時,我們該刪減哪些知識板塊?

瑪麗娜:

抱歉,剛才說我們會增加什么內(nèi)容?

主持人:

我們會將焦點放在問題解決、觀點交流以及批判性的邏輯論證。若要教授這些,哪些現(xiàn)有內(nèi)容需要放棄?

瑪麗娜:

但這些內(nèi)容我們不是已經(jīng)在教了嗎?難道不是嗎,我不確定。

主持人:

希望如此。

陶哲軒:

原則上,借助新技術(shù),可以在不同階段教授不同部分。解答數(shù)學(xué)應(yīng)用題,分為消化題意、分清所有變量、制定解題策略、確定采用何種代數(shù)變換、運算推導(dǎo)多個步驟。現(xiàn)在一個優(yōu)秀的“老師”可能會說,我來替你完成所有的計算。你精通算術(shù)與代數(shù)運算,但你不擅長構(gòu)建問題模型。智能輔導(dǎo)工具可以針對性分工,協(xié)助完成演算步驟,讓學(xué)生專注構(gòu)思解題思路。依托這類智能工具,能夠?qū)崿F(xiàn)精準(zhǔn)化教學(xué),根據(jù)學(xué)生短板定制學(xué)習(xí)方案。不同的學(xué)生可以針對各自的薄弱環(huán)節(jié)進行訓(xùn)練。

拉維?瓦基爾

我完全贊同。數(shù)學(xué)學(xué)科的處境相較其他專業(yè)更為緩和,但正因為我們嘗試傳遞的很相似。正如瑪麗娜所說,這不正是我們已經(jīng)在做的嗎。至少在理想狀態(tài)下,這已涵蓋在我們現(xiàn)有工作中。但特別的是,我們的職責(zé)包括育人。我們追求的教學(xué)目標(biāo)始終沒變,只是教學(xué)形式、考核方式需要優(yōu)化調(diào)整,不意味著要改變評分和評估體系。

數(shù)學(xué)學(xué)習(xí)離不開攻克長期復(fù)雜難題,學(xué)習(xí)者常會陷入思維困境?,F(xiàn)在的問題是,我們始終依賴短時間內(nèi)測試都替代指標(biāo),它們并不完美,只能間接評判能力,評判本身本就存在局限性。

日常作業(yè)無法杜絕人工智能作弊的情況,學(xué)生可以自主選擇獨立鉆研或是借助工具。心智成熟的學(xué)生會借助AI工具補齊短板,懈怠的學(xué)生則難以得到能力提升,考核階段便能顯現(xiàn)差距。

只要考核與發(fā)展機會向健康思考的學(xué)習(xí)者傾斜,教學(xué)便能穩(wěn)步推進。論文寫作極易借助AI完成,這類長期能力也很難通過短時考核評判。只要秉持嚴(yán)謹(jǐn)?shù)慕虒W(xué)思路,學(xué)生需要掌握的核心知識不會發(fā)生大幅變動,只是學(xué)習(xí)路徑、考核形式有所調(diào)整。

但我們希望學(xué)生能夠擁有數(shù)學(xué)思維、算法邏輯、數(shù)值推演、編程應(yīng)用這些素養(yǎng)。純粹數(shù)學(xué)與應(yīng)用數(shù)學(xué)的劃分本就相對模糊,我們可以借著變革契機,聚焦核心教學(xué)目標(biāo)。我們應(yīng)該將其視為一個機會,專注于我們希望學(xué)生理解的內(nèi)容。

瑪麗娜:

或許我可以再補充一點,我認(rèn)為數(shù)學(xué)核心授課內(nèi)容無需大幅改動,現(xiàn)有知識體系足以滿足你提到的各項能力培養(yǎng)需求。但當(dāng)然新的問題會涌現(xiàn),例如如何評估學(xué)生。

我每周都會布置課后作業(yè),優(yōu)秀學(xué)生能夠獨立完成,收獲完整學(xué)習(xí)成效;也有部分作業(yè)行文風(fēng)格明顯出自ChatGPT之手。當(dāng)然如果學(xué)生只是通過指令,確實令人遺憾。直接索要答案的行為難以管控核查。

不過或許他們只是借助ChatGPT梳理解題思路、核對作答內(nèi)容。本科生心智成熟,應(yīng)當(dāng)從自身長遠(yuǎn)發(fā)展角度規(guī)范學(xué)習(xí)行為。我們必須相信他們會做出最有利于自己的選擇。

陶哲軒:

或許需改變的一種文化觀念是,我們應(yīng)該更開放地鼓勵犯錯并擁有失敗的自由。傳統(tǒng)數(shù)學(xué)考核體系向來嚴(yán)苛,對錯直接劃分分?jǐn)?shù)等級,致使學(xué)習(xí)困難者開始隱藏,不愿暴露錯誤,這時轉(zhuǎn)而依靠工具走捷徑獲取答案。

但如果我們營造包容試錯的學(xué)習(xí)氛圍,將失誤視作學(xué)習(xí)契機作為指向正確解題的路徑,或許就會很健壯。這樣學(xué)生便不會一味依賴AI尋求標(biāo)準(zhǔn)答案,因為他們真想?yún)⑴c這個學(xué)習(xí)過程。如果能將解題和從失敗中恢復(fù)的過程變得有趣,許多問題就會迎刃而解。

主持人:

在我看來這完全是一種高度個性化的體驗。要與學(xué)生合作并說服他們,讓他們理解失敗是學(xué)習(xí)過程中不可避免的一部分,實際上需要師生一對一互動。面對三百人的微積分大班課堂,很難實現(xiàn)針對性指導(dǎo)。我認(rèn)為本科教學(xué)模式或許需要徹底革新,深度互動式教學(xué)難以適配大規(guī)模授課場景。不知您是否認(rèn)同這種觀點?

陶哲軒:

理論上AI助教程序可以緩解這一難題。簡易互動設(shè)備已經(jīng)能夠?qū)崿F(xiàn)大班課堂互動,全員搭載AI聊天機器人后,便可快速完成個性化學(xué)情調(diào)研。

新模式探索需要勇敢地嘗試,初期效果或許不及傳統(tǒng)教學(xué),積累經(jīng)驗后便能打造成熟可行的教學(xué)范本。

主持人:

還有你提到的評估問題,在這個作業(yè)成為某種形式的時代,批改作業(yè)變得毫無意義。因為學(xué)生為取得高分投機取巧,學(xué)習(xí)初衷淪為分?jǐn)?shù)至上而非真正掌握知識。你能想象某種方式優(yōu)化考核機制,引導(dǎo)學(xué)生潛心求知而非追逐分?jǐn)?shù)?

瑪麗娜:

我不確定,我認(rèn)為某種程度上,學(xué)生確實渴望學(xué)習(xí)知識,否則為何選擇這個特定領(lǐng)域?

主持人:

那么您教授微積分的那些大一工科學(xué)生呢?他們會不想學(xué)嗎?

拉維?瓦基爾

我認(rèn)為精心設(shè)計的常規(guī)測試依舊具備考核價值,備考過程本身就能鞏固知識。

線下閉卷考試是有效的考核方式或許可以恢復(fù),全程禁止電子設(shè)備使用,杜絕智能工具作弊,規(guī)范更嚴(yán)格的考核機制能夠約束學(xué)生行為。AI也可協(xié)助批改試卷,或許很快就能完美勝任這項工作。

所以我認(rèn)為如果考試設(shè)計得當(dāng),即使分?jǐn)?shù)驅(qū)動,也仍可通過合理的評估方式引導(dǎo)學(xué)生端正態(tài)度。如果他們想學(xué),我確信大多數(shù)學(xué)生都渴望學(xué)有所獲,這時精心設(shè)計的考核就能起到引導(dǎo)作用。我想這些都是教學(xué)領(lǐng)域的老問題了,數(shù)百年間教育領(lǐng)域始終在應(yīng)對各類考核難題。

陶哲軒:

也可以設(shè)計更具創(chuàng)意型拓展作業(yè),允許借助AI完成復(fù)雜任務(wù)。例如代數(shù)課程中,設(shè)計融入代數(shù)元素的桌游,答對問題就能得分。自主制定游戲規(guī)則,借助AI創(chuàng)造3D打印的卡牌、代幣等配套道具。

這類創(chuàng)意項目以往很難直接布置給隨便一個高中生,因為實在太過宏大,但這類非常復(fù)雜的項目或許可行,其復(fù)雜度無法依靠AI工具一鍵生成,能夠調(diào)動學(xué)生鉆研熱情。當(dāng)然這個并非適合所有人,有些學(xué)生可能會望而生畏。或許這是個好課題,可能更容易被接受。

主持人:

這對授課教師提出了更高要求。

陶哲軒:

確實如此,如今AI時代,所有從業(yè)者都需要精進自身能力,這也是當(dāng)下的核心趨勢。

瑪麗娜:

不過根據(jù)我和學(xué)生的交流發(fā)現(xiàn),當(dāng)大家日常頻繁接觸電子設(shè)備后,黑板板書、紙質(zhì)演算、口頭匯報這類傳統(tǒng)授課形式,反而更具吸引力。我認(rèn)為在某種程度上,當(dāng)我們走進教室時,確實缺少那些基礎(chǔ)元素。

教室里有一位導(dǎo)師,你可以與他交談,而這位導(dǎo)師是真實的人類而非AI,我認(rèn)為這方面仍然存在希望。

主持人:

為了獲得分?jǐn)?shù),我絕對會選擇口頭報告。但這會耗費大量時間。

瑪麗娜:

也許對于300人的工程課不適用,但對某些課程而言,這實際上是一種很好的訓(xùn)練方式,從人類大腦的角度,何樂而不為呢?

人工智能倫理與抄襲界定

主持人:

OK,我想把話題轉(zhuǎn)向一個可能截然不同的角度,即關(guān)于倫理的思考,探討AI剽竊界定問題。目前有很多討論說,AI依托海量人類知識庫訓(xùn)練生成內(nèi)容,這類創(chuàng)作行為是否構(gòu)成抄襲?這與人類的學(xué)習(xí)方式,二者數(shù)據(jù)規(guī)模差距懸殊,本質(zhì)上是否不同?

陶哲軒:

通常人類引用過往文獻(xiàn)的方法思路,如果他們受過專業(yè)訓(xùn)練,創(chuàng)作時都會主動標(biāo)注出處,遵循學(xué)術(shù)規(guī)范。

AI無法識別自身輸出內(nèi)容的文獻(xiàn)溯源,引用過往研究成果時不會主動標(biāo)注。或許這個問題可以通過更好的提示詞或成本驗證等方式解決,但AI確實有時并未意識到自己正在使用文獻(xiàn)中的已有技術(shù)。這些技術(shù)通過訓(xùn)練被AI吸收消化,然后又從另一頭輸出。

短期內(nèi)的折中辦法,是在AI生成期刊論文后,額外開展人工文獻(xiàn)溯源核查,最好由行業(yè)專家憑其記憶甄別內(nèi)容出處。但論文產(chǎn)出量成千上萬飛速增長后,溯源核查的難度也會大幅增加。

短期內(nèi)期刊很可能直接拒收AI占比高的文稿;如若收錄,則堅持要求作者必須盡到勤勉核查觀點來源的義務(wù),目前尚未形成完善的溯源規(guī)范。

瑪麗娜:

技術(shù)層面不難實現(xiàn)內(nèi)容檢索、參考文獻(xiàn)匹配,畢竟AI已經(jīng)遍歷了整個互聯(lián)網(wǎng),它們在網(wǎng)絡(luò)檢索方面表現(xiàn)優(yōu)異,最終能生成優(yōu)質(zhì)的參考文獻(xiàn)列表,或幫我查找相似論文??赡芪疫@個想法錯了,但這看起來是個技術(shù)可解的問題。從倫理角度,它該被解決,我也有望盡快落地。

拉維?瓦基爾

我并沒有多少補充,認(rèn)同上述觀點。觀察法律界的應(yīng)對也很有趣。論文署名的人類作者,需要對全部內(nèi)容承擔(dān)責(zé)任,這一點和法律行業(yè)使用AI工具的準(zhǔn)則一致。因此我認(rèn)為這將會成為常態(tài),當(dāng)使用AI時,不能以AI生成內(nèi)容為由規(guī)避學(xué)術(shù)責(zé)任,不當(dāng)使用工具會損害個人學(xué)術(shù)聲譽,同樣會產(chǎn)生某種軟實力方面的后果。

對于行為不當(dāng)者,這些后果往往可能不會受到懲處,但有時仍會引發(fā)相應(yīng)后果,這會涉及聲譽影響。關(guān)鍵在于,只要論文由人類簽署且人類需承擔(dān)責(zé)任,我們就會看到與人類現(xiàn)有情況類似的現(xiàn)象,不同個體的聲譽存在優(yōu)劣之分。

在此情境下,聲譽將取決于他們使用AI的負(fù)責(zé)程度。因為若AI未標(biāo)明出處,過錯在于人類,生產(chǎn)論文的人類完全應(yīng)當(dāng)負(fù)責(zé)核查來源。不難通過提示詞就能嘗試追溯內(nèi)容來源。因此我認(rèn)為盡管現(xiàn)行社會監(jiān)督體系并不完善,但仍可適用于此。

陶哲軒:

但這也可能讓行業(yè)滋生灰色數(shù)學(xué)學(xué)術(shù)文稿,大量智能生成的真?zhèn)味ɡ砘祀s在正統(tǒng)研究成果中,其他學(xué)科也曾遭遇同類亂象,這可能也是我們的未來。

拉維?瓦基爾

我認(rèn)為確實如此,這正是我們審稿流程面臨的真正風(fēng)險之一??赡軙霈F(xiàn)這種灰色論文市場,海量灰色文稿涌入期刊審核環(huán)節(jié)后,編輯會直觀拒收疑似AI生成的內(nèi)容。部分極具價值的突破性證明,也可能因行文風(fēng)格被誤判駁回。但面對海量論文時,我認(rèn)為期刊這么做可能是正確的?;疑袌龅恼撐倪€會流入營利性掠奪性期刊,進入文獻(xiàn)體系,被收錄進學(xué)術(shù)文庫后,情況就會越來越糟,最終我們將陷入某種可怕的反烏托邦。

主持人:

好吧,既然話題如此悲觀,接下來我們可以開放現(xiàn)場提問。

Q&A 問答環(huán)節(jié)

現(xiàn)場觀眾1問:

我有兩個簡短的問題,我想反轉(zhuǎn)一下關(guān)于倫理和引用的問題。問題1:如何引用那些新提出的觀點?問題2:大語言模型如何引用其他大語言模型產(chǎn)出的內(nèi)容或自己的舊版本提出的新觀點?

陶哲軒答:

我認(rèn)為我們的引用范圍,包含正式論文、預(yù)印本、博客論述、會議私下交流內(nèi)容,AI產(chǎn)出內(nèi)容同樣可以依規(guī)引用。

我的近期論文中,就標(biāo)注過AI推導(dǎo)的結(jié)論。公開說明使用情況,遠(yuǎn)比隱瞞信息更為妥當(dāng),即使披露內(nèi)容看起來有些怪異。我甚至也曾引用麥當(dāng)勞商業(yè)廣告內(nèi)容,雖然它沒有直接啟發(fā)某個偏微分方程的解,其邏輯思路和數(shù)學(xué)解題思路存在相通之處。

現(xiàn)場觀眾2問:

陶哲軒此前提出一個深刻問題:數(shù)學(xué)的本質(zhì)是什么?在我看來,數(shù)學(xué)就像文本語言,是對客觀世界高度抽象的符號語言。計算機領(lǐng)域如今興起世界模型研究,融合視覺數(shù)據(jù)、狀態(tài)安全環(huán)境等多元數(shù)據(jù),不再局限于文本運算。這類模型能否助力數(shù)學(xué)探索?例如發(fā)現(xiàn)新穎性、具有好的品味和審美判斷,甚至支持推理等等。你認(rèn)為這對數(shù)學(xué)發(fā)現(xiàn)有啟發(fā)嗎?

陶哲軒答:

我并非世界模型的專家,但它們尚未迎來chatGPT時刻,即展現(xiàn)出重大潛力的階段。如果它們到了這個階段,和大語言模型會各有優(yōu)劣。正如你說,數(shù)學(xué)研究高度依托語言邏輯,可以想象某些模擬類問題,例如求解一個偏微分方程,或許這些模型有些用處,我認(rèn)為這是個非常新的領(lǐng)域。

現(xiàn)場觀眾3問:

我想再聊回教學(xué)話題,可能不算提問而是評論,但很想聽聽各位的見解。教學(xué)的藝術(shù)一方面要激發(fā)學(xué)習(xí)動力,結(jié)合重要的開放難題、課堂上實操科學(xué)實驗,另一方面是清晰地闡述解釋內(nèi)容,但如今AI可以清晰講解幾乎所有本科階段各類知識,教師是否可以專職負(fù)責(zé)激發(fā)學(xué)習(xí)動機,說明學(xué)習(xí)這門學(xué)科的意義,并激發(fā)學(xué)生的學(xué)習(xí)熱情?

瑪麗娜:

目前AI講解的準(zhǔn)確性我不確定,我不確定我們是否已經(jīng)到達(dá)這種階段。舉個案例,我兒子有時用Gemini檢查高中微積分作業(yè),結(jié)果有一半的次數(shù)給出錯誤答案。AI還可能容易誤導(dǎo)某些主題的理解讓學(xué)生困惑。常有學(xué)生拿著AI解析的內(nèi)容求教,知識點和課堂所學(xué)偏差較大。有時的確AI準(zhǔn)確,但并非總是如此。

激發(fā)學(xué)習(xí)熱情確實至關(guān)重要,不同學(xué)科可能有所差異。但就數(shù)學(xué)而言,有位同行的觀點我十分認(rèn)同,教師的口頭教學(xué),是向?qū)W生展現(xiàn)人類鉆研數(shù)學(xué)的能力,以自身言傳身教。學(xué)生親眼目睹后,或許會因此受到激勵而投身數(shù)學(xué)。

主持人:

從某種有限意義上說,這是一種榜樣作用。

陶哲軒:

維基百科也能講解各類知識,但教師可以針對性梳理重點、剖析核心要義。因此重要的不僅是知識的廣度,更在于內(nèi)容篩選與側(cè)重點把控,這是教學(xué)不可替代的核心價值。

現(xiàn)場觀眾4問:

我想探討合規(guī)證明的判定標(biāo)準(zhǔn)。舉例來看,邁克?弗里德曼(Mike Friedman)證明(四維)龐加萊猜想時,正式論文僅留存證明綱要,他在伯克利大學(xué)連續(xù)多日(12小時或者72小時)開展研討,論證思路獲得業(yè)內(nèi)專家認(rèn)可,也憑此斬獲菲爾茲獎,數(shù)十年后才有學(xué)者出了本《脫嵌定理》The Disc Embedding Theorem完善完整證明細(xì)節(jié)。他的一系列演講,以及其他數(shù)學(xué)家撰寫的專著,這些都算是證明過程的產(chǎn)物,對吧?

如果觀察佩雷爾曼(Perelman)對龐加萊猜想的證明,以及幾何化定理,那算是完整證明嗎?只是一個猜想證明框架。當(dāng)時有3個數(shù)學(xué)家團隊耗費心力補充完整論證過程,可以說貢獻(xiàn)出新的研究思路,在某種程度上也屬于原創(chuàng)貢獻(xiàn),但學(xué)術(shù)榮譽仍歸屬于佩雷爾曼,他得了菲爾茲獎,被認(rèn)為是解決該猜想的人,盡管實質(zhì)上得益于其他數(shù)學(xué)家對其思想的完善。

部分?jǐn)?shù)學(xué)家(如讓·布爾甘Jean Bourgain)的論文行文簡略、細(xì)節(jié)缺失,研讀時需要耗費大量精力梳理邏輯,這些論文在技術(shù)層面上確實很難讀懂;在讀格爾德·法爾廷斯的論文時,我也有這種類似感覺,對我的技術(shù)性要求太高了,所以我得付出更多的認(rèn)知努力。如果讀格羅滕迪克的EGA(《代數(shù)幾何基礎(chǔ)》),會發(fā)現(xiàn)它的內(nèi)容更成體系,細(xì)節(jié)更豐富。

因此我的問題是,可以想象這樣一個場景,某個霍奇猜想的10億行Lean證明,后續(xù)研究者誰來解讀剖析?付出大量無償勞動梳理完善證明的學(xué)者往往無法獲得相應(yīng)認(rèn)可,或許他們的工作能讓證明更清晰,但成果榮譽大多歸于最初提出證明思路的研究者。

我的夢想是,我對代數(shù)閉鏈很感興趣,期盼相關(guān)猜想得以證明。不過重申一下,我并非一個專業(yè)數(shù)學(xué)家,我認(rèn)為我的觀點無足輕重。但我可以想象,某位青年代數(shù)幾何學(xué)者的思路,有可能被大型實驗室搶先完善論證,但證明不夠嚴(yán)謹(jǐn),他們不得不耗費大量時間來解讀證明,卻難以收獲學(xué)術(shù)認(rèn)可。

主持人:

這里涉及諸多問題,而我們剩余討論時間有限,不妨選取一個角度展開回應(yīng)即可。

陶哲軒:

你提到的讓·布爾甘,我在研究生階段時通過嘗試研讀他的論文獲益頗豐。雖然當(dāng)時我很恨它,至今我還留著一篇他的論文,上面寫著“我恨讓·布爾甘”。但正是通過這種方式,我掌握了他的研究技巧,這些技巧讓我隨后的十年受益匪淺。

而學(xué)術(shù)成果歸屬并非二元的非黑即白,是個錯綜復(fù)雜的問題。我們掌握的信息越多,披露得越充分,引用越多,我認(rèn)為我們就能以更有機的方式評估各自的貢獻(xiàn)。但我們必須擯棄“X是第一個完成Y的人”作為唯一評判標(biāo)準(zhǔn),從而不再是個問題。而替代方案將會繁瑣得多。

現(xiàn)場觀眾5問:

數(shù)學(xué)證明中的一個常見現(xiàn)象是,證明最終成文,往往和研究者最初的直覺思路差距極大。存在性證明只需羅列滿足所有條件的數(shù)值即可,構(gòu)造出這個數(shù)字的過程和直覺思考,大多往往被省略而不會記錄。

這類思考素材對AI學(xué)習(xí)極具價值,能夠助力AI優(yōu)化推演邏輯,產(chǎn)出更易消化理解、貼合人類思維的證明過程。我想請教各位見解,是否應(yīng)當(dāng)鼓勵研究者記錄思考全過程,提升AI的消化理解這些證明的能力?

陶哲軒:

這本質(zhì)上是個激勵的問題。你可以試著鼓勵數(shù)學(xué)家們頭戴攝像頭做數(shù)學(xué),記錄下全過程,但他們?yōu)楹我@樣做?這僅對他人訓(xùn)練AI有益,而對數(shù)學(xué)家自身毫無裨益。這個建議雖是開玩笑,但我認(rèn)為我們需要讓AI送到研究生院,親自經(jīng)歷這個學(xué)習(xí)過程。

現(xiàn)場觀眾6問:

我是本校大三學(xué)生,對今天成績評估的討論感興趣。如今數(shù)學(xué)和工程專業(yè)出現(xiàn)作業(yè)分?jǐn)?shù)上漲、考試成績下滑的現(xiàn)象,校方因此大幅提升期末考試占比,權(quán)重達(dá)到45%至50%。

我很好奇您如何看待未來評估方式的發(fā)展方向。如何優(yōu)化考核模式,包容試錯行為?能否增加低權(quán)重的小測頻次,或是課堂實操解題、課外閱讀考核相結(jié)合?但我更想了解您對未來評估體系的想法。

拉維?瓦基爾答:

我先來說說,她的觀點確實很好。

我確實認(rèn)為作業(yè)價值更低,考試價值更高的原因,并非為了分?jǐn)?shù),而是基于簡單事實:現(xiàn)在的習(xí)題集。不同學(xué)生在習(xí)題集上做法方式不同,有些同學(xué)通過與難題搏斗獲益更多,有些同學(xué)雖提交完美答案卻未經(jīng)思考而獲益較少。

因此如果我能設(shè)計一門理想課程,理想狀態(tài)應(yīng)該是:

首先,習(xí)題集應(yīng)該允許試錯失敗。遺憾的是,只有最優(yōu)秀的學(xué)習(xí)者,我說的不是那種最聰明的,但具備最佳學(xué)習(xí)態(tài)度、能在長遠(yuǎn)發(fā)展中取得成功的學(xué)生,才能利用好這些習(xí)題集。這是他們首次面對失敗的機會,是與知識交鋒的時刻,從而認(rèn)清自己的知識盲區(qū)。

習(xí)題集以及課程的目標(biāo)都并非追求滿分,真正的目標(biāo)在于掌握知識。通過習(xí)題集,你獲得了與知識搏斗的機會。那些主動來辦公室討論的學(xué)生,即使他們借助AI學(xué)習(xí)也無妨,只要他們自主思考中掙扎學(xué)習(xí)。順帶說一下,那些僅與AI交流的學(xué)生,我十分確信AI現(xiàn)在并不能很好地完成教學(xué)任務(wù),但我對兩年后的發(fā)展無法作預(yù)測,畢竟技術(shù)變革日新月異。因此習(xí)題集應(yīng)該成為允許失敗的第一關(guān)。

其次,我認(rèn)為持續(xù)的小型評測確實是最理想的方案。

第三,你們可能會遇到這樣的情況,接下來我細(xì)說兩句。100%看期末考試成績的舊英國模式確有缺陷,臨場狀態(tài)會極大影響成績,如果考試當(dāng)天生病,那就太糟糕了。如今提升期末考核占比,不是太讓人高興的事,也是應(yīng)對作業(yè)誠信問題的無奈之舉。

配合期中考核能夠分散壓力,督促學(xué)生穩(wěn)步學(xué)習(xí),避免考前突擊備考,但每安排一次期中考試,就要耗費一些時間。不過我認(rèn)為你所問的正切中根本,也是我們必須回答的,你們提出這些問題,是因為渴望掌握知識,希望保持學(xué)習(xí)動力。而每周都有任務(wù)意味著你們無法靠最后臨時抱佛腳。與其直接給出一個解答,不如深思一下。這類考核優(yōu)化問題,也是師生共同探討的核心議題。

陶哲軒:

加州大學(xué)洛杉磯分校推行限時復(fù)測考核,作答錯誤后鎖定答題權(quán)限,間隔48小時左右,方可重新嘗試,作答次數(shù)不受限制,僅耗費時間成本,這樣就降低了失敗的代價,學(xué)生不會急于借助AI工具作答,而是愿意自主嘗試解題,因為他們的成績不受影響。

支持人:

本次研討第二次超時5分鐘了。感謝所有圓桌嘉賓,為期兩日的學(xué)術(shù)交流圓滿落幕。我們提出諸多深刻問題,聆聽多場精彩報告,由衷感謝賈里德與劉易斯籌辦本次會議。諸多疑問尚未得出定論,相關(guān)探討仍會持續(xù)推進。

參考資料

https://www.youtube.com/watch?v=78Rjdz1SPYM

小樂數(shù)學(xué)科普本月文章

版權(quán)聲明:本文首發(fā)于微信公眾號“zzllrr小樂”的專欄《小樂數(shù)學(xué)科普》。歡迎個人轉(zhuǎn)發(fā)。如需轉(zhuǎn)載,請在“zzllrr小樂”公眾號后臺回復(fù)“轉(zhuǎn)載”,還可通過公眾號菜單、發(fā)送郵件到zzllrr@gmail.com與我們?nèi)〉寐?lián)系。相關(guān)圖文音視頻內(nèi)容默認(rèn)遵守CC BY-NC 4.0知識共享協(xié)議,未獲作者和譯者授權(quán),禁止用于營銷宣傳和商業(yè)目的。

·開放 · 友好 · 多元 · 普適 · 守拙·


讓數(shù)學(xué)

更加

易學(xué)易練

易教易研

易賞易玩

易見易得

易傳易及

歡迎評論、點贊、在看、在聽

收藏、分享、轉(zhuǎn)載、投稿

查看原始文章出處

點擊底部一起捐

助力騰訊公益

點擊zzllrr小樂

公眾號主頁

右上角

置頂★加星

數(shù)學(xué)科普不迷路!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
馬斯克:我原來那輛特斯拉目前正在地球火星之間飛行 至少還要飛1000萬年

馬斯克:我原來那輛特斯拉目前正在地球火星之間飛行 至少還要飛1000萬年

快科技
2026-06-10 17:28:07
“別給孩子炸飛了”,高考廉價三件套被人罵醒,不如一千多的手機

“別給孩子炸飛了”,高考廉價三件套被人罵醒,不如一千多的手機

澤澤先生
2026-06-10 19:58:27
29分算個屁啊!逆轉(zhuǎn)絕殺!!3:1!尼克斯真要冠軍了

29分算個屁??!逆轉(zhuǎn)絕殺?。?:1!尼克斯真要冠軍了

柚子說球
2026-06-11 12:23:16
“電梯門”事件升級!宋珍珍當(dāng)年獲得選美冠軍含金量,真的很一般

“電梯門”事件升級!宋珍珍當(dāng)年獲得選美冠軍含金量,真的很一般

火山詩話
2026-06-09 12:58:37
狐貍尾巴藏不住?楊振寧離世7月,翁帆近況被爆,騎馬喝酒很瀟灑

狐貍尾巴藏不?。織钫駥庪x世7月,翁帆近況被爆,騎馬喝酒很瀟灑

粵語音樂噴泉
2026-06-10 12:14:26
6月10日,萬眾期待的人社部2026年調(diào)整基本養(yǎng)老金通知公布了嗎?

6月10日,萬眾期待的人社部2026年調(diào)整基本養(yǎng)老金通知公布了嗎?

云舟史策
2026-06-11 07:44:18
耿同學(xué)登上Science!

耿同學(xué)登上Science!

互聯(lián)網(wǎng)大觀
2026-06-10 22:15:25
高考最“倒霉”考生出現(xiàn)!青島一女生進入考場,竟然就她自己一人

高考最“倒霉”考生出現(xiàn)!青島一女生進入考場,竟然就她自己一人

快樂彼岸
2026-06-10 22:04:57
世界上持續(xù)最久的軍事同盟!簽了640年還管用,救了葡萄牙3次命

世界上持續(xù)最久的軍事同盟!簽了640年還管用,救了葡萄牙3次命

鶴羽說個事
2026-06-09 23:03:52
面對性欲,我們所有人都不是對手

面對性欲,我們所有人都不是對手

長安一孤客
2026-06-09 13:24:36
李在明果然聰明,趁中方訪問朝鮮之際,他一口氣提到了4個國家

李在明果然聰明,趁中方訪問朝鮮之際,他一口氣提到了4個國家

此去經(jīng)年q
2026-06-11 01:36:16
福星!泰勒斯威夫特見證尼克斯翻盤奇跡 甜茶和卡戴珊小妹也來了

福星!泰勒斯威夫特見證尼克斯翻盤奇跡 甜茶和卡戴珊小妹也來了

Emily說個球
2026-06-11 12:19:01
葫蘆嫁接西瓜爛瓤后續(xù):虧損30萬,瓜農(nóng)崩潰砸瓜,種苗方拒不認(rèn)賬

葫蘆嫁接西瓜爛瓤后續(xù):虧損30萬,瓜農(nóng)崩潰砸瓜,種苗方拒不認(rèn)賬

姩姩有娛
2026-06-08 16:35:15
【鋼鐵聚焦】突發(fā)!一鋼廠發(fā)生爆炸致9死11傷!

【鋼鐵聚焦】突發(fā)!一鋼廠發(fā)生爆炸致9死11傷!

新浪財經(jīng)
2026-06-10 13:51:35
我國最大遺憾!1994年將領(lǐng)土劃給俄羅斯,如今還能再收回來嗎?

我國最大遺憾!1994年將領(lǐng)土劃給俄羅斯,如今還能再收回來嗎?

談古論今歷史有道
2026-06-10 09:30:09
潑糞大戰(zhàn)+外掛火車,AI打造印度模擬器走紅,4天播放量直沖935萬

潑糞大戰(zhàn)+外掛火車,AI打造印度模擬器走紅,4天播放量直沖935萬

17173游戲網(wǎng)
2026-06-09 13:52:06
每體:B席的言論讓巴薩感到不滿,他不在引援名單中

每體:B席的言論讓巴薩感到不滿,他不在引援名單中

懂球帝
2026-06-10 19:59:34
主人頂著高溫出去上班快熱熔了,回家一看貓咪…已經(jīng)吹著空調(diào)蓋好被子了!

主人頂著高溫出去上班快熱熔了,回家一看貓咪…已經(jīng)吹著空調(diào)蓋好被子了!

拜見喵主子
2026-06-10 11:25:54
李宗偉帶一家度假,包游艇出海,妻子很美,他體重不到百斤

李宗偉帶一家度假,包游艇出海,妻子很美,他體重不到百斤

大西體育
2026-06-10 20:25:15
為什么在世界杯的廣告牌上,你幾乎看不到汽車品牌?

為什么在世界杯的廣告牌上,你幾乎看不到汽車品牌?

電科技網(wǎng)
2026-06-10 18:14:17
2026-06-11 12:52:49
小樂數(shù)學(xué)科普 incentive-icons
小樂數(shù)學(xué)科普
zzllrr小樂,小樂數(shù)學(xué)科普,讓前沿數(shù)學(xué)流行起來~
417文章數(shù) 7關(guān)注度
往期回顧 全部

教育要聞

第23課-開會說這幾句話,讓你贏得客戶領(lǐng)導(dǎo)贊揚

頭條要聞

媒體:霍爾木茲迎大消息 伊朗向試圖通過的船只開火

頭條要聞

媒體:霍爾木茲迎大消息 伊朗向試圖通過的船只開火

體育要聞

2026世界杯,我們看什么?

娛樂要聞

鬧大了?《奔跑吧》被曝停播,承認(rèn)收費

財經(jīng)要聞

干細(xì)胞生意:17萬一針的希望

科技要聞

淘寶、京東、拼多多、抖音、小紅書被約談

汽車要聞

埃安i60 530寧德時代版上市限時煥新價10.36萬起

態(tài)度原創(chuàng)

游戲
數(shù)碼
親子
公開課
軍事航空

23年前百萬人在線的MMO網(wǎng)游,居然起源于一部“太監(jiān)”漫畫

數(shù)碼要聞

華為成為一季度全球最大腕戴設(shè)備廠商 超越蘋果、小米

親子要聞

你對“養(yǎng)兒防老”是有什么誤解嗎

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普召開戰(zhàn)情室會議討論對伊朗軍事行動

無障礙瀏覽 進入關(guān)懷版