★置頂zzllrr小樂公眾號(主頁右上角)數學科普不迷路!
中心極限定理最初只是18世紀賭徒們的小竅門,如今卻成為科學家們日常研究的必備工具。
正是中心極限定理,讓鐘形分布在各個領域隨處可見。
![]()
圖源:Irene Pérez
作者:Joseph Howlett(量子雜志特約撰稿人)2026-3-16
譯者:zzllrr小樂(數學科普公眾號)2026-3-26
引言
無論放眼何處,鐘形曲線總在身邊。
每次下雨時在院子里放一個量杯,記錄雨停時的水位高度,所得數據會符合鐘形曲線;收集 100 個人對罐中軟心糖豆數量的猜測,結果也會呈現鐘形曲線;測量足夠多女性的身高、男性的體重,統計 SAT 考試分數、馬拉松完賽時間 —— 你總會得到那條邊緣逐漸收窄、中間圓潤隆起的平滑曲線。
為何鐘形曲線會出現在如此多的數據集中?
答案歸根結底是中心極限定理(central limit theorem)。這一強大的數學規律在初學者眼中往往不可思議,如同大自然的魔術。華盛頓大學的生物統計學家 Daniela Witten 表示:“中心極限定理極為神奇,因為它完全違背直覺、出人意料。” 借助這一定理,看似最隨機、最無法捉摸的混沌現象,也能展現出極具規律性的可預測性。
如今,它已是現代實證科學的重要支柱。科學家幾乎每次通過觀測數據推導世界規律時,研究方法中都暗藏中心極限定理的身影。沒有它,科學便難以滿懷信心地對任何事物下結論。
卡內基梅隆大學的統計學家 Larry Wasserman 稱:“沒有中心極限定理,統計學領域恐怕都無法存在,它就是一切。”
從博弈中誕生的科學規律
人類對隨機現象中規律性的探索始于賭博研究,這或許并不令人意外。
18 世紀初的倫敦咖啡館里,亞伯拉罕?棣莫弗(Abraham de Moivre)的數學天賦早已顯露無遺,艾薩克?牛頓(Isaac Newton)、愛德蒙?哈雷(Edmond Halley)等同時代學者都認可他的才華。
![]()
亞伯拉罕?棣莫弗(Abraham de Moivre,1667 - 1754)
圖源:Joseph Highmore (1736)
De Moivre 是英國皇家學會會員,卻也是一名難民 —— 年輕時因法國的反新教迫害,他被迫逃離故土。作為外來者,他始終無法獲得與才華匹配的穩定學術職位,為了糊口,他成為賭徒們的數學顧問,為他們尋找博弈中的數學優勢。
拋硬幣、擲骰子、抽撲克牌,這些都是隨機行為,每種結果出現的概率均等。而 De Moivre 發現,將大量隨機行為結合起來,最終結果會呈現出穩定的規律。
將一枚硬幣拋擲 100 次,統計正面朝上的次數,結果大概在 50 次左右,卻并非精準的 50 次;重復 10 次這個實驗,可能會得到 10 個不同的數值。
但如果將這個實驗重復 100 萬次,絕大多數結果都會接近 50 次,幾乎不會出現少于 10 次或多于 90 次的情況。若把 0 到 100 之間每個數值出現的次數繪制成圖,你會看到經典的鐘形曲線,50 次正是曲線的中心。實驗重復的次數越多,鐘形曲線就會越平滑、越清晰。
De Moivre 推導出了這條鐘形曲線的精確形態,這一分布后來被命名為正態分布(normal distribution)。借助正態分布,無需實際進行實驗,就能推算出不同結果出現的概率。例如,拋 100 次硬幣,正面朝上次數在 45 到 55 次之間的概率約為 68%。
De Moivre 帶著近乎虔誠的心情,驚嘆于這種 “宇宙中永恒的秩序”—— 它最終能克服一切偏離鐘形曲線的不規則現象。他寫道:“假以時日,這些不規則現象與這種源于固有設計的秩序的反復出現相比,便會顯得微不足道。”
![]()
1718 年首次出版的《機會論》The Doctrine of Chances是概率論領域的第一本教科書,1738 年的第二版中,收錄了為中心極限定理奠定基礎的研究成果。
De Moivre 憑借這些研究成果在倫敦勉強維持生計:他撰寫的《機會論》成了賭徒們的 “圣經”,還在著名的老斯勞特咖啡館開設了非正式的咨詢時段。但即便如此,De Moivre 也未能意識到自己發現的全部價值。直到他去世數十年后,皮埃爾-西蒙·拉普拉斯(Pierre-Simon Laplace,1749 - 1827) 在 1810 年進一步發展了這一思想,中心極限定理的完整內涵才得以被揭示。
我們再舉一個比拋硬幣稍復雜的例子:擲骰子。單次擲骰子有 6 種等概率的結果,若反復擲骰子并統計結果,會得到一條平坦的分布圖 —— 點數 1、2、4、6 出現的次數大致相等。
但如果將骰子擲 10 次并計算平均值,結果大概率在 3.5 左右;多次重復這一實驗并將所有結果繪制成圖,會得到一條以 3.5 為峰值的鐘形曲線,曲線兩側的形態也有著精確的規律。
這就是中心極限定理的魔力:從毫無規律的隨機結果分布(擲出 1 到 6 點的概率均等)出發,通過對多次觀測結果取平均值,并反復進行這一過程,就能得到精準、可預測的數學形態 —— 鐘形曲線。
Laplace 將這一規律提煉為一個簡潔的公式,這便是后來的中心極限定理。無論隨機過程多么無規律,即便根本無法建立模型,大量結果的平均值都會遵循這一定理所描述的分布。Witten 說:“這一定理的強大之處在于,我們無需關注被取平均值的變量本身遵循何種分布,唯一關鍵的是,平均值本身會服從正態分布。”
無處不在的實用工具
取平均值看似是人類主動進行的計算行為,但中心極限定理卻會無形地作用于世間所有可觀測的現象,比如人類的身高。多倫多大學的統計學家 Jeffrey Rosenthal 解釋道:“一個人的身高可能受父親身高、母親身高、基因、營養狀況等諸多微小因素的共同影響,而這些因素彼此獨立 —— 通常來說,父親的身高和一個人攝入的食物毫無關聯。這就相當于對一系列微小影響取平均值,這也是身高大致遵循正態分布的原因。”
這也是各類數據集會自發呈現出這一優美形態的根源。Witten 表示:“只要背后存在取平均值的過程,且參與平均的變量足夠多,最終結果就會服從正態分布。”
![]()
華盛頓大學生物統計學家丹妮拉?威滕( Daniela Witten)
圖源:Elizar Mercado
中心極限定理還能讓統計學家發現異常現象。試想,你正在老斯勞特咖啡館喝咖啡,一位客人遞給你一枚硬幣,打賭你拋 100 次硬幣正面朝上的次數達不到 45 次。你嘗試后,只得到了 20 次正面朝上的結果。如何判斷對方給的是一枚做了手腳的硬幣,且整個過程并非真正的隨機?借助中心極限定理可知,20 次及以下的結果僅占鐘形曲線下面積的 0.15%,也就是說,一枚公平的硬幣出現這樣結果的概率只有 0.15%,你幾乎肯定被算計了。
這正是 Laplace 提出的公式的真正威力:他發現,對任意過程取平均值都會得到鐘形曲線,即便不深入了解過程本身的運作原理,也能借助這一規律對過程做出判斷。
謹慎使用
盡管中心極限定理是現代科學的核心,但它也有自身的局限性。它僅適用于大量獨立樣本的組合分析,若樣本不獨立 —— 例如,僅在緬因州的一個小鎮開展全國總統大選民意調查 —— 即便重復實驗,結果也無法接近預期的鐘形曲線。
在科學研究中,有時異常值比平均值更重要。威廉姆斯學院的應用統計學家 Richard D. De Veaux 表示:“原本百年一遇的洪水,如今發生的頻率越來越高。如今,對極端事件的建模可能和對平均值的建模同等重要。”
幸運的是,中心極限定理背后的核心思想 —— 平均值的有效性和穩定性 —— 已被廣泛應用,極大拓展了統計學的應用范圍。統計學家會針對研究中遇到的具體問題,構建適用于該場景的中心極限定理變體。Wasserman 說:“許多復雜問題,只要思路巧妙,都能轉化為樣本均值加誤差的形式,這時就能借助定理的變體簡化問題。”
中心極限定理最終能成為現代科學的支柱,本質上是因為它本身就是我們所處世界的支柱。當我們整合大量獨立的觀測數據時,數據會呈現出聚集性規律;只要善于運用這一規律,我們就能從這些規律中,探尋到產生這些數據的背后過程的奧秘。
參考資料
https://www.quantamagazine.org/the-math-that-explains-why-bell-curves-are-everywhere-20260316/
小樂數學科普近期文章
·開放 · 友好 · 多元 · 普適 · 守拙·![]()
讓數學
更加
易學易練
易教易研
易賞易玩
易見易得
易傳易及
歡迎評論、點贊、在看、在聽
收藏、分享、轉載、投稿
查看原始文章出處
點擊zzllrr小樂
公眾號主頁
右上角
置頂★加星
數學科普不迷路!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.