界面新聞?dòng)浾?| 張蕊
界面新聞編輯 | 任雪松
一個(gè)德國(guó)人,連續(xù)猜對(duì)了最近三屆世界杯冠軍。他不是足球評(píng)論員,也不是博彩精算師,甚至不太看球員數(shù)據(jù)。他的模型里裝的不是球星名字,而是人均GDP、人口規(guī)模、足球在一個(gè)國(guó)家社會(huì)中的位置。今年,他的預(yù)測(cè)指向荷蘭。
這位德國(guó)經(jīng)濟(jì)學(xué)家叫約阿希姆·克萊門(mén)特(Joachim Klement)。2014年他的模型選中德國(guó),2018年選中法國(guó),2022年選中阿根廷,三屆全部命中,無(wú)一失手。對(duì)于即將開(kāi)賽的美加墨世界杯,克萊門(mén)特的結(jié)論是:荷蘭將在決賽中擊敗葡萄牙,捧起大力神杯。
一個(gè)用經(jīng)濟(jì)和社會(huì)數(shù)據(jù)的人,憑什么預(yù)測(cè)足球比賽?
克萊門(mén)特供職于英國(guó)券商Panmure Liberum,他構(gòu)建的預(yù)測(cè)模型包含五個(gè)變量:人均GDP、人口規(guī)模、氣候、東道主身份,以及一個(gè)隨機(jī)性因子。
人均GDP的邏輯在于,一個(gè)國(guó)家只有足夠富裕,才能建得起像樣的球場(chǎng)、培養(yǎng)得出好教練、支撐起完善的青訓(xùn)體系,這是足球人才出產(chǎn)的底層硬件;人口規(guī)模決定了人才基數(shù)的上限;氣候影響的則是足球訓(xùn)練和比賽的物理?xiàng)l件,克萊門(mén)特評(píng)估認(rèn)為最適合的溫度約在14°C;東道主身份,則是因?yàn)橹鲌?chǎng)球迷的支持能給球隊(duì)帶來(lái)微弱優(yōu)勢(shì),而這可能就是勝、平、負(fù)之間的區(qū)別;隨機(jī)性因子,是模型對(duì)人自身不可預(yù)測(cè)性的認(rèn)賬:比賽終歸是人踢的,不是機(jī)器算的。
![]()
克萊門(mén)特預(yù)測(cè)的淘汰賽樹(shù)狀圖
這套邏輯在克萊門(mén)特過(guò)去三屆預(yù)測(cè)中得到了驗(yàn)證。但試圖用模型“破解”世界杯的,遠(yuǎn)不止他一人。
華爾街投行高盛也有自己的傳統(tǒng):從2010年起,這家投行每逢世界杯都會(huì)發(fā)布預(yù)測(cè)報(bào)告,今年也不例外。世界杯開(kāi)幕前兩周,高盛首席經(jīng)濟(jì)學(xué)家簡(jiǎn)·哈齊烏斯(Jan Hatzius)帶著團(tuán)隊(duì)發(fā)布了2026年世界杯預(yù)測(cè)報(bào)告。
高盛的模型選了與克萊門(mén)特完全不同的路徑:它不關(guān)心GDP,核心是Elo等級(jí)分體系。Elo原本是用來(lái)衡量國(guó)際象棋選手實(shí)力的評(píng)分系統(tǒng),后來(lái)被移植到足球領(lǐng)域,根據(jù)每場(chǎng)比賽的結(jié)果和對(duì)手強(qiáng)弱,動(dòng)態(tài)調(diào)整球隊(duì)分值。
截至高盛發(fā)布報(bào)告時(shí),西班牙在Elo榜單上位居全球第一,比第二名阿根廷高出52分,比法國(guó)高出84分,幾乎是斷層式領(lǐng)先。高盛在此基礎(chǔ)上疊加上進(jìn)攻天賦、球隊(duì)狀態(tài)、地理因素和抽簽路徑四個(gè)邊際變量,對(duì)著48支球隊(duì)、104場(chǎng)比賽做了5萬(wàn)次模擬。結(jié)果:西班牙以26%的奪冠概率成為最大熱門(mén),法國(guó)19%、阿根廷14%、巴西8%、英格蘭和荷蘭各約5%。
兩套經(jīng)濟(jì)學(xué)模型,給出了兩個(gè)不同的冠軍。這不是誰(shuí)對(duì)誰(shuí)錯(cuò)的問(wèn)題,而是一場(chǎng)“用哪把尺子量世界”的選擇。克萊門(mén)特的問(wèn)題是關(guān)于經(jīng)濟(jì)基礎(chǔ)的,即一個(gè)國(guó)家有沒(méi)有長(zhǎng)出好球員的條件?高盛的問(wèn)題則是關(guān)于競(jìng)技實(shí)力的,即一支球隊(duì)當(dāng)下到底有多強(qiáng)?同一項(xiàng)賽事,從不同的角度建模,得到了不同的答案。
![]()
圖源:FIFA世界杯官方微博
經(jīng)濟(jì)模型之外,還有其他人在用自己的方式押注答案。
美國(guó)統(tǒng)計(jì)學(xué)家、《信號(hào)與噪聲》的作者納特·西爾弗(Nate Silver),帶著名為PELE的新模型登場(chǎng)了。他在傳統(tǒng)Elo評(píng)分里嵌入球員市場(chǎng)價(jià)值,并引入了一個(gè)"Tilt"因子,即近幾屆冠軍往往在前一屆表現(xiàn)的基礎(chǔ)上獲得額外模型增益。PELE跑完10萬(wàn)次模擬后,給西班牙的奪冠概率約22%,法國(guó)18%,阿根廷12%,每日更新。三個(gè)熱門(mén)與高盛的排序一致,但西爾弗對(duì)衛(wèi)冕冠軍阿根廷的態(tài)度比高盛更為積極。
科技媒體的做法更直接——Decrypt把同樣的任務(wù)交給了七個(gè)AI模型,讓它們各自預(yù)測(cè)世界杯冠軍。結(jié)果是四個(gè)選了西班牙、三個(gè)選了阿根廷。
而比結(jié)果更有意思的,是分歧的源頭。順藤摸瓜查下去發(fā)現(xiàn),分歧根本不在于足球分析水平的高低,而在于每個(gè)模型抓取的是哪個(gè)Elo評(píng)級(jí)源:選用實(shí)時(shí)足球Elo評(píng)分(西班牙排第一)的Opus、GPT、Stepfun、Nemotron,無(wú)一例外地把票投給了西班牙;而參考FIFA排名或俱樂(lè)部加權(quán)評(píng)分(阿根廷、法國(guó)、巴西均排在西班牙之前)的DeepSeek、MiniMax、Qwen,則更傾向于阿根廷。
![]()
7個(gè)AI模型的預(yù)測(cè)結(jié)果
中國(guó)AI公司也加入了這場(chǎng)競(jìng)賽。Kimi(月之暗面)調(diào)動(dòng)了300個(gè)AI智能體,從戰(zhàn)術(shù)、球員、賽程、歷史等維度預(yù)測(cè)每一場(chǎng)比賽,甚至還專(zhuān)門(mén)設(shè)置了一個(gè)“反方組”,由一批與主流預(yù)測(cè)持相反意見(jiàn)的智能體專(zhuān)職尋找翻車(chē)風(fēng)險(xiǎn)。
Kimi的首期預(yù)測(cè)指向了一個(gè)出人意料的方向——德國(guó)可能“爆冷”奪冠。理由是:德國(guó)連續(xù)兩屆小組出局的“近因偏差”持續(xù)壓低了市場(chǎng)定價(jià),而穆西亞拉和維爾茨組成的新前場(chǎng)已經(jīng)解決了此前的攻堅(jiān)難題。38歲的主帥納格爾斯曼恰好是將AI深度融入訓(xùn)練的代表人物,這一因素也被納入了模型。
Kimi在官宣文章里開(kāi)門(mén)見(jiàn)山:“我們的預(yù)測(cè)很可能是錯(cuò)的。”但他們把整個(gè)分析過(guò)程、預(yù)測(cè)結(jié)果和賽后復(fù)盤(pán)放在了同一套透明框架中,任憑外界檢驗(yàn)。
此外,還有一條預(yù)測(cè)線索來(lái)自虛擬世界。6月初,美國(guó)藝電(Electronic Arts)旗下體育游戲品牌EA Sports基于FC 26游戲引擎完成了最新一屆世界杯模擬。結(jié)果也將冠軍指向了西班牙隊(duì)。值得一提的是,EA Sports的模擬歷史相當(dāng)漂亮:2010年選西班牙、2014年選德國(guó)、2018年選法國(guó)、2022年選阿根廷,近四屆全部命中。
至于真金白銀的預(yù)測(cè)市場(chǎng),則是另一套讀數(shù)。截至6月9日,Polymarket平臺(tái)上西班牙奪冠概率約16%,法國(guó)約16%,阿根廷約10%,前十之外的其余球隊(duì)合計(jì)約占兩成。與高盛26%的評(píng)估相比,市場(chǎng)對(duì)西班牙的信心明顯更低——但市場(chǎng)定價(jià)是動(dòng)態(tài)的,開(kāi)賽后的每一場(chǎng)比賽都可能改變這些數(shù)字。預(yù)測(cè)市場(chǎng)的邏輯和經(jīng)濟(jì)學(xué)模型截然不同:后者的優(yōu)勢(shì)是“有道理”,前者的優(yōu)勢(shì)是“押注者真的會(huì)輸錢(qián)”,因此會(huì)把各種隱性的場(chǎng)外信息也納入定價(jià)。
![]()
Polymarket平臺(tái)數(shù)據(jù)
這些模型預(yù)測(cè)得到底準(zhǔn)不準(zhǔn)?歷史成績(jī)稱(chēng)不上漂亮。
2022年卡塔爾世界杯前,高盛的模型把巴西排在第一(24%),阿根廷第二(21%),法國(guó)第三(19%)。最終阿根廷奪冠,巴西止步八強(qiáng)。高盛確實(shí)把冠軍鎖定在了前三名,但排序是錯(cuò)的——球迷如果按概率投注,恐怕輸多贏少。
克萊門(mén)特連續(xù)三屆命中,從純概率角度看,即便每次猜對(duì)的概率只有25%,三連中的幾率也不過(guò)1.6%左右——主要靠運(yùn)氣的可能性已經(jīng)很小。但連續(xù)三屆的樣本終究有限,他的模型的“真本事”還需要接下來(lái)的比賽進(jìn)一步驗(yàn)證。
模型自己也清楚這些局限。高盛在報(bào)告中列出了四類(lèi)模型盲區(qū):無(wú)法有效衡量非進(jìn)攻端才能(如中場(chǎng)厚度和守門(mén)員點(diǎn)球價(jià)值),不考慮球員傷病狀態(tài)和個(gè)人賽季狀態(tài)變化,也難以捕捉主教練因素的潛在影響。報(bào)告結(jié)尾處的類(lèi)比頗為直白:足球的內(nèi)在不可預(yù)測(cè)性,使得統(tǒng)計(jì)顯著性始終有限,這與押注高波動(dòng)資產(chǎn)時(shí)的處境如出一轍。
Stepfun 3.7模型在二次修正之前,也跑出了一個(gè)荒誕的結(jié)果:排名前三的熱門(mén)球隊(duì)是墨西哥、南非和韓國(guó)。它的開(kāi)發(fā)者沒(méi)有遮掩這次翻車(chē),而是公開(kāi)解釋了整個(gè)過(guò)程:用人工生成的預(yù)期進(jìn)球數(shù)來(lái)擬合國(guó)家隊(duì)數(shù)據(jù),反而抹平了強(qiáng)隊(duì)與弱隊(duì)之間的真實(shí)差距,發(fā)現(xiàn)問(wèn)題后干脆全盤(pán)推倒,改用純Elo評(píng)分重建。
所有這些模型,本質(zhì)上都在探索同一個(gè)問(wèn)題:世界杯的結(jié)果,到底能不能被算出來(lái)?克萊門(mén)特說(shuō)經(jīng)濟(jì)基礎(chǔ)決定上層建筑,高盛說(shuō)競(jìng)技實(shí)力見(jiàn)真章,Kimi說(shuō)別忘了人是會(huì)犯錯(cuò)的。答案不唯一,就像即將在明日凌晨開(kāi)幕的世界杯本身——48支球隊(duì)、104場(chǎng)比賽,很快會(huì)給出它自己版本的答案。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.