網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

從經(jīng)濟(jì)學(xué)家到AI智能體，誰(shuí)能算準(zhǔn)世界杯?

2026-06-11 08:58:58　來(lái)源: 界面新聞

上海舉報(bào)

分享至

界面新聞?dòng)浾?| 張蕊
界面新聞編輯 | 任雪松

一個(gè)德國(guó)人，連續(xù)猜對(duì)了最近三屆世界杯冠軍。他不是足球評(píng)論員，也不是博彩精算師，甚至不太看球員數(shù)據(jù)。他的模型里裝的不是球星名字，而是人均GDP、人口規(guī)模、足球在一個(gè)國(guó)家社會(huì)中的位置。今年，他的預(yù)測(cè)指向荷蘭。

這位德國(guó)經(jīng)濟(jì)學(xué)家叫約阿希姆·克萊門(mén)特（Joachim Klement）。2014年他的模型選中德國(guó)，2018年選中法國(guó)，2022年選中阿根廷，三屆全部命中，無(wú)一失手。對(duì)于即將開(kāi)賽的美加墨世界杯，克萊門(mén)特的結(jié)論是：荷蘭將在決賽中擊敗葡萄牙，捧起大力神杯。

一個(gè)用經(jīng)濟(jì)和社會(huì)數(shù)據(jù)的人，憑什么預(yù)測(cè)足球比賽？

克萊門(mén)特供職于英國(guó)券商Panmure Liberum，他構(gòu)建的預(yù)測(cè)模型包含五個(gè)變量：人均GDP、人口規(guī)模、氣候、東道主身份，以及一個(gè)隨機(jī)性因子。

人均GDP的邏輯在于，一個(gè)國(guó)家只有足夠富裕，才能建得起像樣的球場(chǎng)、培養(yǎng)得出好教練、支撐起完善的青訓(xùn)體系，這是足球人才出產(chǎn)的底層硬件；人口規(guī)模決定了人才基數(shù)的上限；氣候影響的則是足球訓(xùn)練和比賽的物理?xiàng)l件，克萊門(mén)特評(píng)估認(rèn)為最適合的溫度約在14°C；東道主身份，則是因?yàn)橹鲌?chǎng)球迷的支持能給球隊(duì)帶來(lái)微弱優(yōu)勢(shì)，而這可能就是勝、平、負(fù)之間的區(qū)別；隨機(jī)性因子，是模型對(duì)人自身不可預(yù)測(cè)性的認(rèn)賬：比賽終歸是人踢的，不是機(jī)器算的。

克萊門(mén)特預(yù)測(cè)的淘汰賽樹(shù)狀圖

這套邏輯在克萊門(mén)特過(guò)去三屆預(yù)測(cè)中得到了驗(yàn)證。但試圖用模型“破解”世界杯的，遠(yuǎn)不止他一人。

華爾街投行高盛也有自己的傳統(tǒng)：從2010年起，這家投行每逢世界杯都會(huì)發(fā)布預(yù)測(cè)報(bào)告，今年也不例外。世界杯開(kāi)幕前兩周，高盛首席經(jīng)濟(jì)學(xué)家簡(jiǎn)·哈齊烏斯（Jan Hatzius）帶著團(tuán)隊(duì)發(fā)布了2026年世界杯預(yù)測(cè)報(bào)告。

高盛的模型選了與克萊門(mén)特完全不同的路徑：它不關(guān)心GDP，核心是Elo等級(jí)分體系。Elo原本是用來(lái)衡量國(guó)際象棋選手實(shí)力的評(píng)分系統(tǒng)，后來(lái)被移植到足球領(lǐng)域，根據(jù)每場(chǎng)比賽的結(jié)果和對(duì)手強(qiáng)弱，動(dòng)態(tài)調(diào)整球隊(duì)分值。

截至高盛發(fā)布報(bào)告時(shí)，西班牙在Elo榜單上位居全球第一，比第二名阿根廷高出52分，比法國(guó)高出84分，幾乎是斷層式領(lǐng)先。高盛在此基礎(chǔ)上疊加上進(jìn)攻天賦、球隊(duì)狀態(tài)、地理因素和抽簽路徑四個(gè)邊際變量，對(duì)著48支球隊(duì)、104場(chǎng)比賽做了5萬(wàn)次模擬。結(jié)果：西班牙以26%的奪冠概率成為最大熱門(mén)，法國(guó)19%、阿根廷14%、巴西8%、英格蘭和荷蘭各約5%。

兩套經(jīng)濟(jì)學(xué)模型，給出了兩個(gè)不同的冠軍。這不是誰(shuí)對(duì)誰(shuí)錯(cuò)的問(wèn)題，而是一場(chǎng)“用哪把尺子量世界”的選擇。克萊門(mén)特的問(wèn)題是關(guān)于經(jīng)濟(jì)基礎(chǔ)的，即一個(gè)國(guó)家有沒(méi)有長(zhǎng)出好球員的條件？高盛的問(wèn)題則是關(guān)于競(jìng)技實(shí)力的，即一支球隊(duì)當(dāng)下到底有多強(qiáng)？同一項(xiàng)賽事，從不同的角度建模，得到了不同的答案。

圖源：FIFA世界杯官方微博

經(jīng)濟(jì)模型之外，還有其他人在用自己的方式押注答案。

美國(guó)統(tǒng)計(jì)學(xué)家、《信號(hào)與噪聲》的作者納特·西爾弗（Nate Silver），帶著名為PELE的新模型登場(chǎng)了。他在傳統(tǒng)Elo評(píng)分里嵌入球員市場(chǎng)價(jià)值，并引入了一個(gè)"Tilt"因子，即近幾屆冠軍往往在前一屆表現(xiàn)的基礎(chǔ)上獲得額外模型增益。PELE跑完10萬(wàn)次模擬后，給西班牙的奪冠概率約22%，法國(guó)18%，阿根廷12%，每日更新。三個(gè)熱門(mén)與高盛的排序一致，但西爾弗對(duì)衛(wèi)冕冠軍阿根廷的態(tài)度比高盛更為積極。

科技媒體的做法更直接——Decrypt把同樣的任務(wù)交給了七個(gè)AI模型，讓它們各自預(yù)測(cè)世界杯冠軍。結(jié)果是四個(gè)選了西班牙、三個(gè)選了阿根廷。

而比結(jié)果更有意思的，是分歧的源頭。順藤摸瓜查下去發(fā)現(xiàn)，分歧根本不在于足球分析水平的高低，而在于每個(gè)模型抓取的是哪個(gè)Elo評(píng)級(jí)源：選用實(shí)時(shí)足球Elo評(píng)分（西班牙排第一）的Opus、GPT、Stepfun、Nemotron，無(wú)一例外地把票投給了西班牙；而參考FIFA排名或俱樂(lè)部加權(quán)評(píng)分（阿根廷、法國(guó)、巴西均排在西班牙之前）的DeepSeek、MiniMax、Qwen，則更傾向于阿根廷。

7個(gè)AI模型的預(yù)測(cè)結(jié)果

中國(guó)AI公司也加入了這場(chǎng)競(jìng)賽。Kimi（月之暗面）調(diào)動(dòng)了300個(gè)AI智能體，從戰(zhàn)術(shù)、球員、賽程、歷史等維度預(yù)測(cè)每一場(chǎng)比賽，甚至還專(zhuān)門(mén)設(shè)置了一個(gè)“反方組”，由一批與主流預(yù)測(cè)持相反意見(jiàn)的智能體專(zhuān)職尋找翻車(chē)風(fēng)險(xiǎn)。

Kimi的首期預(yù)測(cè)指向了一個(gè)出人意料的方向——德國(guó)可能“爆冷”奪冠。理由是：德國(guó)連續(xù)兩屆小組出局的“近因偏差”持續(xù)壓低了市場(chǎng)定價(jià)，而穆西亞拉和維爾茨組成的新前場(chǎng)已經(jīng)解決了此前的攻堅(jiān)難題。38歲的主帥納格爾斯曼恰好是將AI深度融入訓(xùn)練的代表人物，這一因素也被納入了模型。

Kimi在官宣文章里開(kāi)門(mén)見(jiàn)山：“我們的預(yù)測(cè)很可能是錯(cuò)的。”但他們把整個(gè)分析過(guò)程、預(yù)測(cè)結(jié)果和賽后復(fù)盤(pán)放在了同一套透明框架中，任憑外界檢驗(yàn)。

此外，還有一條預(yù)測(cè)線索來(lái)自虛擬世界。6月初，美國(guó)藝電（Electronic Arts）旗下體育游戲品牌EA Sports基于FC 26游戲引擎完成了最新一屆世界杯模擬。結(jié)果也將冠軍指向了西班牙隊(duì)。值得一提的是，EA Sports的模擬歷史相當(dāng)漂亮：2010年選西班牙、2014年選德國(guó)、2018年選法國(guó)、2022年選阿根廷，近四屆全部命中。

至于真金白銀的預(yù)測(cè)市場(chǎng)，則是另一套讀數(shù)。截至6月9日，Polymarket平臺(tái)上西班牙奪冠概率約16%，法國(guó)約16%，阿根廷約10%，前十之外的其余球隊(duì)合計(jì)約占兩成。與高盛26%的評(píng)估相比，市場(chǎng)對(duì)西班牙的信心明顯更低——但市場(chǎng)定價(jià)是動(dòng)態(tài)的，開(kāi)賽后的每一場(chǎng)比賽都可能改變這些數(shù)字。預(yù)測(cè)市場(chǎng)的邏輯和經(jīng)濟(jì)學(xué)模型截然不同：后者的優(yōu)勢(shì)是“有道理”，前者的優(yōu)勢(shì)是“押注者真的會(huì)輸錢(qián)”，因此會(huì)把各種隱性的場(chǎng)外信息也納入定價(jià)。

Polymarket平臺(tái)數(shù)據(jù)

這些模型預(yù)測(cè)得到底準(zhǔn)不準(zhǔn)？歷史成績(jī)稱(chēng)不上漂亮。

2022年卡塔爾世界杯前，高盛的模型把巴西排在第一（24%），阿根廷第二（21%），法國(guó)第三（19%）。最終阿根廷奪冠，巴西止步八強(qiáng)。高盛確實(shí)把冠軍鎖定在了前三名，但排序是錯(cuò)的——球迷如果按概率投注，恐怕輸多贏少。

克萊門(mén)特連續(xù)三屆命中，從純概率角度看，即便每次猜對(duì)的概率只有25%，三連中的幾率也不過(guò)1.6%左右——主要靠運(yùn)氣的可能性已經(jīng)很小。但連續(xù)三屆的樣本終究有限，他的模型的“真本事”還需要接下來(lái)的比賽進(jìn)一步驗(yàn)證。

模型自己也清楚這些局限。高盛在報(bào)告中列出了四類(lèi)模型盲區(qū)：無(wú)法有效衡量非進(jìn)攻端才能（如中場(chǎng)厚度和守門(mén)員點(diǎn)球價(jià)值），不考慮球員傷病狀態(tài)和個(gè)人賽季狀態(tài)變化，也難以捕捉主教練因素的潛在影響。報(bào)告結(jié)尾處的類(lèi)比頗為直白：足球的內(nèi)在不可預(yù)測(cè)性，使得統(tǒng)計(jì)顯著性始終有限，這與押注高波動(dòng)資產(chǎn)時(shí)的處境如出一轍。

Stepfun 3.7模型在二次修正之前，也跑出了一個(gè)荒誕的結(jié)果：排名前三的熱門(mén)球隊(duì)是墨西哥、南非和韓國(guó)。它的開(kāi)發(fā)者沒(méi)有遮掩這次翻車(chē)，而是公開(kāi)解釋了整個(gè)過(guò)程：用人工生成的預(yù)期進(jìn)球數(shù)來(lái)擬合國(guó)家隊(duì)數(shù)據(jù)，反而抹平了強(qiáng)隊(duì)與弱隊(duì)之間的真實(shí)差距，發(fā)現(xiàn)問(wèn)題后干脆全盤(pán)推倒，改用純Elo評(píng)分重建。

所有這些模型，本質(zhì)上都在探索同一個(gè)問(wèn)題：世界杯的結(jié)果，到底能不能被算出來(lái)？克萊門(mén)特說(shuō)經(jīng)濟(jì)基礎(chǔ)決定上層建筑，高盛說(shuō)競(jìng)技實(shí)力見(jiàn)真章，Kimi說(shuō)別忘了人是會(huì)犯錯(cuò)的。答案不唯一，就像即將在明日凌晨開(kāi)幕的世界杯本身——48支球隊(duì)、104場(chǎng)比賽，很快會(huì)給出它自己版本的答案。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.