无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

加權(quán)貝葉斯共形預(yù)測

0
分享至

Weighted Bayesian Conformal Prediction

加權(quán)貝葉斯共形預(yù)測

https://arxiv.org/pdf/2604.06464


摘要


1 引言

共形預(yù)測(CP)[Vovk et al., 2005] 提供了具有有限樣本覆蓋率保證的無分布預(yù)測區(qū)間:對(duì)于任何模型和未覆蓋率(miscoverage level) α ,構(gòu)建的預(yù)測集包含真實(shí)結(jié)果的概率至少為 1 ? α 。這一優(yōu)雅的保證使 CP 成為現(xiàn)代不確定性量化的基石 [Lei et al., 2018, Romano et al., 2019]。



加權(quán)共形預(yù)測。 當(dāng)測試分布和校準(zhǔn)分布不同(協(xié)變量偏移)時(shí),Tibshirani 等人 [2019] 引入了加權(quán)可交換性(weighted exchangeability)的概念,并證明了通過似然比對(duì)校準(zhǔn)分?jǐn)?shù)進(jìn)行重加權(quán)可以保持有效的覆蓋率保證。這一基礎(chǔ)性結(jié)果已被應(yīng)用于空間設(shè)置 [Lou et al., 2025]、域適應(yīng)(domain adaptation)和公平感知預(yù)測。但是,加權(quán) CP 仍然是純粹頻率學(xué)派的:它用加權(quán)分位數(shù) 替換了均勻分位數(shù),這仍然是每個(gè)權(quán)重剖面下的單一確定性閾值。它解決了協(xié)變量偏移問題,但完全沒有解決元不確定性問題。

差距。 現(xiàn)有方法均未同時(shí)提供 (i) BQ-CP 關(guān)于閾值的貝葉斯后驗(yàn)和數(shù)據(jù)條件保證,以及 (ii) 加權(quán) CP 的分布偏移魯棒性。這一差距不僅僅是理論上的:例如,在空間預(yù)測中,基于 200 個(gè)附近可比銷售數(shù)據(jù)的預(yù)測區(qū)間,與基于 5 個(gè)遙遠(yuǎn)銷售數(shù)據(jù)的區(qū)間,其可靠性有著根本的不同——然而,無論是 BQ-CP(完全忽略了空間結(jié)構(gòu))還是加權(quán) CP(不提供元不確定性)都無法區(qū)分這些情況。

我們的貢獻(xiàn):加權(quán)貝葉斯共形預(yù)測(WBCP)。 我們通過將 BQ-CP 推廣到任意的重要性加權(quán)設(shè)置來彌合這一差距。我們的關(guān)鍵見解是,那些為加權(quán) CP 提供覆蓋率保證的重要性權(quán)重 [Tibshirani et al., 2019],通過加權(quán)貝葉斯自助法(weighted Bayesian bootstrap)[Newton and Raftery, 1994] 自然地映射到狄利克雷集中參數(shù),其中 Kish 有效樣本量 充當(dāng)集中縮放因子。至關(guān)重要的是,WBCP 沒有引入新的假設(shè):它繼承了加權(quán) CP 的加權(quán)可交換性假設(shè),并用完整的后驗(yàn)分布豐富了由此產(chǎn)生的點(diǎn)估計(jì)閾值。具體而言,我們做出了以下貢獻(xiàn):


2 背景

2.1 分裂共形預(yù)測


2.2 加權(quán)共形預(yù)測

標(biāo)準(zhǔn) CP 要求訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)具有可交換性,這在分布偏移(distribution shift)下會(huì)失效。Tibshirani 等人 [2019] 通過引入加權(quán)可交換性(weighted notion of exchangeability)概念,將 CP 擴(kuò)展到了可交換性之外,并證明了適當(dāng)重加權(quán)的共形過程能夠保留覆蓋率保證。


該框架涵蓋了協(xié)變量偏移校正、空間加權(quán)(GeoCP, Lou et al., 2025)以及局部共形預(yù)測(localized CP)[Guan, 2023]。在所有情況下,輸出都是每個(gè)權(quán)重剖面下的單一確定性閾值——加權(quán)分位數(shù)沒有提供關(guān)于其自身可靠性的任何信息。

2.3 作為貝葉斯求積的共形預(yù)測(BQ-CP)

Snell 和 Griffiths [2025] 表明,共形閾值選擇可以被視為針對(duì)期望損失的貝葉斯求積。期望損失的隨機(jī)上界為:



3 加權(quán)貝葉斯共形預(yù)測

3.1 通用框架





3.2 有效樣本量作為集中參數(shù)


3.3 通過蒙特卡洛采樣獲取 HPD 閾值

算法 1 總結(jié)了 WBCP 過程。關(guān)于閾值的后驗(yàn)分布是通過狄利克雷采樣獲得的,而 HPD 閾值提供了數(shù)據(jù)條件保證。



3.4 形式化元不確定性

WBCP 的輸出形式化了 §1 中引入的兩個(gè)不確定性層級(jí)之間的區(qū)別。我們現(xiàn)在使這一區(qū)別在數(shù)學(xué)上精確化。




表 1 總結(jié)了每種方法提供的不確定性輸出。WBCP 是唯一一種同時(shí)處理非均勻權(quán)重并提供關(guān)于閾值的后驗(yàn)分布的方法。


4 理論結(jié)果


4.1 校準(zhǔn)一致性



4.2 后驗(yàn)集中速率


4.3 加權(quán)隨機(jī)占優(yōu)



4.4 條件覆蓋率界限


5 應(yīng)用:地理貝葉斯共形預(yù)測

我們將 WBCP 實(shí)例化用于空間預(yù)測,其中重要性權(quán)重源于地理核函數(shù)。這一實(shí)例化與 Tibshirani 等人 [2019] 的局部條件覆蓋率(local conditional coverage)框架有著自然的理論聯(lián)系。



6 實(shí)驗(yàn)

我們?cè)u(píng)估了五種變體:標(biāo)準(zhǔn) CP、加權(quán) CP (GeoCP)、WBCP (GeoBCP)、自適應(yīng)加權(quán) CP (AdaGeoCP) 以及自適應(yīng) WBCP (AdaGeoBCP)。所有方法均使用 α = 0.1 , β = 0.9 ,以及 M = 1000 個(gè) MC 樣本。

6.1 合成空間數(shù)據(jù)




6.2 現(xiàn)實(shí)世界空間數(shù)據(jù)




7 相關(guān)工作

共形預(yù)測。 CP [Vovk et al., 2005] 及其分裂變體 [Papadopoulos et al., 2002, Lei et al., 2018] 提供了無分布覆蓋率。擴(kuò)展包括共形分位數(shù)回歸 [Romano et al., 2019]、共形風(fēng)險(xiǎn)控制 [Angelopoulos et al., 2024, Bates et al., 2021] 以及分布共形 CP [Chernozhukov et al., 2021]。

加權(quán)和局部 CP。 Tibshirani 等人 [2019] 引入了加權(quán)可交換性,并證明了重加權(quán)共形過程在協(xié)變量偏移下能保持覆蓋率,確立了 WBCP 所構(gòu)建的理論基礎(chǔ)。Guan [2023] 提出了基于核的局部化方法。Lou 等人 [2025] 將空間加權(quán)應(yīng)用于地理預(yù)測。所有這些方法仍然屬于頻率學(xué)派,僅提供點(diǎn)估計(jì)閾值,而不包含元不確定性。

CP 的貝葉斯方法。 Fong 和 Holmes [2021] 探索了共形貝葉斯計(jì)算。Snell 和 Griffiths [2025] 建立了在獨(dú)立同分布(i.i.d.)數(shù)據(jù)下具有數(shù)據(jù)條件保證的 BQ-CP。我們的工作直接將 BQ-CP 擴(kuò)展到了加權(quán)設(shè)置。

空間 UQ(不確定性量化)。 克里金法(Kriging)[Fotheringham et al., 2002] 在高斯假設(shè)下提供空間預(yù)測方差。GeoCP [Lou et al., 2025] 是無分布的,但屬于頻率學(xué)派。WBCP 結(jié)合了兩者的優(yōu)勢。

8 討論與結(jié)論


原文鏈接:https://arxiv.org/pdf/2604.06464

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
日本爆發(fā)大規(guī)??棺h,高市終于低頭,中國外交部冷言:不糾錯(cuò)免談

日本爆發(fā)大規(guī)模抗議,高市終于低頭,中國外交部冷言:不糾錯(cuò)免談

貴州霖霖
2026-05-17 09:30:17
英國250萬穆斯林中,1/3年輕人正放棄約會(huì):Halal Marriage為何成新選擇

英國250萬穆斯林中,1/3年輕人正放棄約會(huì):Halal Marriage為何成新選擇

時(shí)光慢郵啊
2026-05-17 01:29:56
美退役軍官曾宣稱:中國殲16D電子戰(zhàn)機(jī),簡直是美國海軍的噩夢(mèng)!

美退役軍官曾宣稱:中國殲16D電子戰(zhàn)機(jī),簡直是美國海軍的噩夢(mèng)!

華史談
2026-05-17 08:57:13
在泰華人目擊“火車撞公交致8死32傷”:看著火車駛來懷疑它能否剎住,公交被拖行數(shù)十米起火,殃及多輛摩托車和私家車

在泰華人目擊“火車撞公交致8死32傷”:看著火車駛來懷疑它能否剎住,公交被拖行數(shù)十米起火,殃及多輛摩托車和私家車

極目新聞
2026-05-17 13:09:18
海風(fēng):聽到特朗普這句話,臺(tái)灣當(dāng)局該醒了

海風(fēng):聽到特朗普這句話,臺(tái)灣當(dāng)局該醒了

環(huán)球網(wǎng)資訊
2026-05-16 17:37:05
三位美女你喜歡哪位我看中右邊,頗為賢惠、穩(wěn)重大方,氣質(zhì)美滿

三位美女你喜歡哪位我看中右邊,頗為賢惠、穩(wěn)重大方,氣質(zhì)美滿

科學(xué)發(fā)掘
2026-05-17 15:56:57
活塞G7傷情報(bào)告出爐,哈登迎來尷尬里程碑,阿特金森該變陣了

活塞G7傷情報(bào)告出爐,哈登迎來尷尬里程碑,阿特金森該變陣了

世界體育圈
2026-05-17 13:16:49
馬斯克黃仁勛在空軍一號(hào)熱聊照曝光,喝了可樂,皮衣黃疑似用三星

馬斯克黃仁勛在空軍一號(hào)熱聊照曝光,喝了可樂,皮衣黃疑似用三星

譯言
2026-05-16 10:38:32
空軍一號(hào)飛機(jī)即將起飛返航時(shí),現(xiàn)場工作人員有人直接倒地!

空軍一號(hào)飛機(jī)即將起飛返航時(shí),現(xiàn)場工作人員有人直接倒地!

阿龍聊軍事
2026-05-17 06:43:05
老板娘問我她屁股大不大?我該怎么回答?

老板娘問我她屁股大不大?我該怎么回答?

太急張三瘋
2026-03-28 12:35:10
44%進(jìn)度,慢就是快

44%進(jìn)度,慢就是快

閃存獵手
2026-05-16 04:52:09
特斯拉國內(nèi)新品上架,全球最低價(jià)來了!

特斯拉國內(nèi)新品上架,全球最低價(jià)來了!

XCiOS俱樂部
2026-05-17 16:32:44
斯維托麗娜奪得羅馬冠軍后,孟菲爾斯為妻子寫下溫情告白

斯維托麗娜奪得羅馬冠軍后,孟菲爾斯為妻子寫下溫情告白

網(wǎng)球之家
2026-05-17 13:29:52
霍爾木茲海峽,突傳大消息

霍爾木茲海峽,突傳大消息

第一財(cái)經(jīng)資訊
2026-05-17 10:43:53
特朗普剛訪華,美媒察覺不對(duì):最強(qiáng)殲20已部署,解放軍劍指臺(tái)海

特朗普剛訪華,美媒察覺不對(duì):最強(qiáng)殲20已部署,解放軍劍指臺(tái)海

時(shí)光流轉(zhuǎn)追夢(mèng)人
2026-05-17 02:41:07
訪華已經(jīng)結(jié)束,特朗普回到白宮,用6句話談中國之行,措辭不尋常

訪華已經(jīng)結(jié)束,特朗普回到白宮,用6句話談中國之行,措辭不尋常

阿校談史
2026-05-17 15:12:43
蘋果防線全線血崩!Mythos5天攻破最強(qiáng)硬件,全球20億臺(tái)設(shè)備危了

蘋果防線全線血崩!Mythos5天攻破最強(qiáng)硬件,全球20億臺(tái)設(shè)備危了

新智元
2026-05-15 12:33:48
這場頂級(jí)晚宴,真正的主角不是馬斯克、黃仁勛,而是一方中式桌面

這場頂級(jí)晚宴,真正的主角不是馬斯克、黃仁勛,而是一方中式桌面

魔都姐姐雜談
2026-05-15 00:53:47
固態(tài)電池一旦上車,最先被淘汰的不是燃油車,而是現(xiàn)在的新能源車

固態(tài)電池一旦上車,最先被淘汰的不是燃油車,而是現(xiàn)在的新能源車

老特有話說
2026-05-17 13:11:49
國宴待了32年的老國貨礦泉水!喝一次,娃哈哈農(nóng)夫山泉都不香了

國宴待了32年的老國貨礦泉水!喝一次,娃哈哈農(nóng)夫山泉都不香了

老特有話說
2026-05-17 13:15:19
2026-05-17 17:11:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1406文章數(shù) 19關(guān)注度
往期回顧 全部

科技要聞

三大運(yùn)營商即將免月租?多方回應(yīng)

頭條要聞

女子的奔馳4S店不愿回收 丈夫:賭100萬 找專業(yè)機(jī)構(gòu)查

頭條要聞

女子的奔馳4S店不愿回收 丈夫:賭100萬 找專業(yè)機(jī)構(gòu)查

體育要聞

生死戰(zhàn)只拿3分的核心,還有留的必要嗎?

娛樂要聞

《主角》劉浩存上線,死別猝不及防

財(cái)經(jīng)要聞

OpenAI和蘋果的“聯(lián)盟”即將破裂

汽車要聞

大五座SUV卷王!樂道L80上市 租電15.68萬元起

態(tài)度原創(chuàng)

教育
數(shù)碼
本地
藝術(shù)
公開課

教育要聞

第14課-如何寫好倒裝句和強(qiáng)調(diào)句

數(shù)碼要聞

紅魔游戲平板5 Pro或?qū)⒀悠??姜超吐槽要“被迫”重新定義5月

本地新聞

用蘇繡的方式,打開江西婺源

藝術(shù)要聞

新地標(biāo)!中國牙雕藝術(shù)館,意向東方建筑設(shè)計(jì)新作

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版