大家好,我是小川。
很多人都有過猜世界杯冠軍的經歷,賭球網站的賠率、球隊的名氣、球星的狀態,總能成為投注的理由。
![]()
2023 年英國一名男子花 5 英鎊猜中 30 場賽事狂攬 48.6 萬英鎊,2015 年萊斯特城以 1 賠 5000 爆冷奪冠也有人押中,這讓不少人想找科學的世界杯預測方法。我最近就用泊松分布、蒙特卡洛算法搭了模型,結果還真有點顛覆認知。
要預測世界杯冠軍,核心要先搞定單場比賽的勝負。畢竟 48 支球隊的淘汰賽,最終都要看每場對決的結果。而單場勝負的本質,是比分的博弈。
比如阿根廷的預期進球數設為 2.49,那么進 1 球的概率約為 20.64%,進 2 球的概率約為 25.7%,進 3 球的概率約為 21.33%。如果對手美國的預期進球數是 0.873,同樣算出其進球概率,將兩隊的概率相乘,就能得到不同比分的獲勝概率。
關鍵問題來了,預期進球數怎么算?我用了迪科斯科模型,將其拆解為進攻預期、防守預期和其他修正系數三個部分。
![]()
先抓取 2015 年以來所有國家隊的國際比賽比分作為基礎數據,賽事參考價值每兩年衰減一半,越近的比賽權重越高。再通過最大釋然估計的迭代計算,也就是不斷調整參數貼合歷史結果,最終算出每支球隊的進攻和防守數值。
最后還要加上修正系數,比如巴西隊有多名主力傷病,就下調其進攻系數 0.9;西班牙隊預選賽因亞馬爾缺席較多,但正賽他可回歸,就上調系數 1.1。
有意思的是,國足的相關數據也被算出來了,在模型里排在第 104 名,和世界排名基本吻合,也驗證了這個模型的靠譜程度。
美加墨世界杯共有 48 支球隊,分為 12 個小組,每組 4 支球隊打單循環,每個小組有 6 場比賽。理論上,每個小組的排名結果有 24 種可能,12 個小組的組合就是 24 的 12 次方,換算下來約有 3.6 億億種可能,根本沒法一一計算。
這時候就得用到蒙特卡洛算法了。聽起來名字唬人,其實就是根據之前算出的概率,把世界杯在平行世界里模擬幾千上萬次。我總共模擬了 2 萬次,最終統計出各隊奪冠的概率。
![]()
最終結果顯示,阿根廷奪冠概率最高,其次是西班牙、巴西、英格蘭,法國僅排第五。這個結果和博彩公司的賠率參考相去甚遠,莊家給出的前兩位是西班牙和法國。
有意思的是,博彩公司的模型其實更精細,比如用 xg boost 模型分析每一次射門的距離、防守人員情況、射門方式,收集海量數據來優化預測。但現實情況是,他們的預測也經常翻車。
回看最近三屆世界杯,博彩公司的熱門預測幾乎從未應驗:2014 年巴西世界杯,莊家第一熱門是巴西,結果半決賽被德國 7-1 血洗,最終奪冠的是德國;2018 年俄羅斯世界杯,巴西和德國并列第一,結果奪冠的是沒進前三的法國;2022 年卡塔爾世界杯,巴西仍是第一熱門,最終奪冠的是阿根廷。
這背后藏著足球運動的本質:充滿隨機性。世界杯單場淘汰賽定勝負的賽制,更是放大了這種變數。一場比賽的一個單刀、一次誤判,都能改變最終結果,這也是世界杯迷人的原因之一。
![]()
這意味著,普通人只要避開非理性投注的誤區,用理性的方式分析,理論上可能賺到差價。但請務必注意,世界杯的偶然性太強,所有預測都僅供娛樂,切勿當真。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.