網易首頁 > 網易號 > 正文申請入駐

一個模型背下了50年考題，它算學會了嗎？

2026-06-25 03:36:05　來源: 碼上閑敘

北京舉報

分享至

Naomi Saphra在演講開頭講了一個簡短的故事：她有個學生叫Alex，微積分期末考試拿了A+。那么，Alex現在擅長微積分嗎？如果考試用的是同一份卷子，你可能不會太相信這個分數；可如果老師不怎么偷懶，只是從過去50年的題庫里抽題，Alex又事先刷完了全部50年考題，這時候Alex到底算不算擅長微積分？對人來說，答案是肯定的，因為學會微積分遠比背下50年真題更輕松。

把同樣的場景換到語言模型身上，結論卻截然相反。Saphra給出了第一條規則：語言模型只要有機會就會選擇死記硬背。對它們而言，記住50年微積分考題比真正學會微積分要容易得多，模型永遠挑省力的路走。所以，單憑一個模型在某個題目上做對了，并不能證明它掌握了題目背后的概念。要讓模型學會推廣，就必須用多樣化的訓練數據，讓單純的記憶無法包打天下，同時必須在模型從未見過的保留數據集上進行測試。對于今天這些能力極強的模型，僅僅避開某個完全相同的子集已經不夠了——我們甚至需要重新定義，怎樣才算是強大模型“沒見過的例子”。

一種思路是檢查模型能不能一字不差地輸出你給它的內容。最典型的就是機械重復：讓語言模型復述一段《圣經》引文非常簡單，因為它在訓練中幾乎見過每一句引用數不清的次數。但也存在另一些情況，模型能完整還原出訓練集中極少現身的內容，比如計數序列“28、29、30、4、5”。盡管Pythia系列模型在訓練中只見過這種模式一兩次，它們每次都能準確補全。原因很簡單，這只是在數數，而模型確實學會了把數數的能力泛化。

這引出了一個關鍵分歧。正方會說：既然模型連考試題庫都能背下來，這種高分背后就是記憶的假象，說明模型離真正“理解”還差得遠。反方則會反駁：計數例子證明，只要有足夠多樣化的計數場景作為訓練素材，模型同樣能形成泛化能力，并不是什么都靠死記。兩種觀點對立的實質，在于我們如何定義“沒見過的例子”——不只是一模一樣的字符串出現與否，而是模型是否見過我們關心的概念之間的特定組合。如果模型從未見過某種概念搭配，卻仍能正確處理，那才算是學到了可遷移的東西。

Saphra的判斷更貼近反方的延伸：語言模型的確酷愛走記憶捷徑，但這不妨礙它在面對多樣化樣本時提煉出抽象的規律。關鍵不在模型本身懶惰，而在于我們喂給它的數據是否足夠豐富，迫使它不得不通過學會“為什么”來解決問題，而不是靠復制“是什么”。因此，評估一個模型是否真懂某個領域，不能只靠調換題目表面文字，而要設計那些組合了陌生概念的場景，去檢驗它是否從多樣化的訓練中真正學會了泛化。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.