Bayesian change-plane regression
貝葉斯變平面回歸
https://arxiv.org/pdf/2604.23851
![]()
![]()
摘要:
變平面回歸通過一個可解釋的線性閾值規則識別子群體,但針對硬閾值邊界的基于似然的推斷是非正則的:目標函數非光滑,在無異質性情形下邊界呈弱識別,且標準大樣本近似具有脆弱性。我們開發了一種新的貝葉斯推斷框架,該框架基于一個probit門控工作似然——這是一個計算上正則的替代模型,且對于任意固定的平滑尺度而言均被有意誤設。因此,在固定平滑尺度下,后驗摘要應被解釋為針對一個明確定義的平滑偽真實目標;僅當平滑尺度趨于零時,方能恢復針對硬閾值目標的推斷,此時近似偏差由協變量分布的邊界邊際條件所控制。所得理論將誤設情形下的Bernstein–von Mises論證適配于貝葉斯變平面回歸,并明確揭示了將平滑尺度趨于零所引發的三角陣列權衡:更尖銳的門控會惡化高斯近似所需的導數界,而近似偏差則隨邊界附近協變量概率質量的局部大小而遞減。基于所得的聯合后驗分布,我們進一步提出了一種基于決策論的報告規范,該規范將臨床有意義異質性的證據與亞群邊界的報告相分離,并通過后驗成員概率將邊界不確定性傳播至協變量層面。模擬研究表明,與頻率學派對應方法相比,我們的新方法在準確性與不確定性量化方面表現更優;在一項隨機生活方式干預試驗中的應用進一步證實了貝葉斯變平面回歸在解析治療效應異質性方面的實用價值。
關鍵詞:變平面回歸;貝葉斯推斷;切片采樣;亞群識別;后驗收縮
1 引言
臨床試驗通常旨在檢測完整研究人群中的平均治療效應。然而,治療反應在患者之間往往存在異質性;一種新療法可能僅在特定亞群中有效,或比標準護理更有效。因此,臨床試驗中的監管決策越來越需要能夠檢測和量化異質性治療效應的方法,同時保持對方案指定終點和亞群的可解釋性和有效推斷 [ICH E20, European Medicines Agency, 2025]。利用患者特異性協變量,亞組分析旨在識別具有增強治療效應的患者,縮小療法的目標人群,并指導未來的研究設計。傳統的亞組分析通常一次測試一個變量,或者僅依賴簡單參數模型中的交互項。這些策略往往效能不足,容易出現假陽性,并且忽略了多個個體屬性可以共同塑造風險和反應這一事實 [Wang et al., 2007]。
變平面回歸模型通過線性規則 1 { Z ? θ ≥ 0 } 定義亞組成員資格,并允許治療效應在產生的兩種機制中有所不同,從而應對了這一挑戰。這產生了一個臨床上可交流的決策規則——一個以零為截止值的單一得分 以及對治療效應異質性的簡約總結。盡管具有直觀的吸引力,但針對硬閾值邊界參數的推斷本質上是非正則的。似然函數及相關的優化目標在 θ θ 中是非光滑的,以至于在無異質性情況下識別會失效,且標準的大樣本近似可能會失敗或難以校準 [Fan et al., 2017, Kang et al., 2017, Wei and Kosorok, 2018]。這些挑戰在有限樣本中因多峰性以及對調優和初始化的敏感性而進一步加劇 [Lee et al., 2021]。
解決這些估計挑戰的一種常見變通方法是用平滑對應物替換硬指示函數,以恢復可微性并促進優化 [Li et al., 2021, Zhang et al., 2022, Ge et al., 2023, Wei et al., 2023, Mukherjee et al., 2023]。雖然平滑提高了數值穩定性,但它也改變了推斷目標:對于任何固定的平滑水平,所得模型通常不能與原始的硬閾值數據生成機制完美重合,且相關的估計可能在很大程度上依賴于調優選擇(帶寬、溫度或懲罰項)。此外,在選擇邊界后的不確定性量化非常棘手:將估計邊界視為固定的兩階段程序可能會低估估計亞群效應中的不確定性,特別是在邊界被弱識別的零假設附近。
在本文中,我們為變平面回歸貢獻了一個全貝葉斯框架,我們的新穎貢獻是多方面的。首先,我們定義了貝葉斯變平面回歸模型本身。核心推斷對象是一個正則化的、平滑索引的變平面規則的聯合后驗。在任何固定的平滑尺度下,該后驗靶向 probit 門控工作模型的 Kullback-Leibler 偽真參數,而不是不連續的硬閾值參數本身;硬閾值目標是通過平滑消失機制來逼近的。這種區分對于解釋很重要:平滑不被視為字面上的數據生成假設或自動選擇的 nuisance 參數,而是作為一個將被報告的透明正則化水平。為了實現后驗推斷,我們開發了一種采樣算法,該算法結合了產生條件高斯塊的潛變量增強(在 Gibbs 采樣器內)以及針對邊界方向的免調優大圓橢圓切片更新。其次,我們建立了誤設 probit 門控后驗的大樣本理論。據我們所知,這是貝葉斯變平面回歸后驗推斷的首個漸近處理。固定平滑結果刻意建立在標準的誤設后驗理論之上,特別是 Kleijn 和 van der Vaart [2012] 的 Bernstein–von Mises 框架;變平面特有的貢獻在于識別當使用平滑代理來近似非正則硬閾值時必須添加的內容。在平滑消失機制下,似然形成一個三角陣列:隨著平滑減少,probit 門的導數變得越來越大,而偽真參數以由局部邊界幾何確定的速率漂向硬閾值目標。所得的邊際分析產生了一個由普通參數波動加上依賴幾何的平滑偏差組成的后驗收縮率,并給出了多項式平滑計劃的顯式可行性計算。在用于高斯近似的充分導數包絡條件下,該計算表明移除確定性中心偏移需要高邊際幾何。該理論闡明了何時硬閾值解釋在漸近上是合理的,以及何時有限樣本后驗摘要應被解讀為針對平滑目標的推斷。第三,在貝葉斯變平面回歸框架下,我們形式化了一個用于在弱識別下獲得可解釋亞組結果的基于決策論的報告協議。僅當后驗為預定義的臨床有意義異質性事件分配足夠高的概率時,才報告亞組邊界,邊界不確定性通過后驗硬成員概率傳播到協變量水平。異質性證據、效應量可信區間摘要和亞組成員資格不確定性均源自同一聯合后驗,為頻率學派工作流中所需的分離且不同校準的程序提供了一致的替代方案。最后,我們通過廣泛的模擬研究評估了所提出的貝葉斯變平面回歸,涵蓋了正確指定和誤設的基線以及低維和高維效應修飾因子設置,展示了相對于頻率學派對應方法在治療效應對比和邊界方向上的有利準確性和不確定性量化。我們進一步通過對 PREMIER 臨床試驗的應用說明了該框架。
2 變平面回歸的貝葉斯推斷
假設我們要觀察獨立同分布(i.i.d.)數據 ![]()
,并假設結果是由以下硬閾值數據生成過程(DGP)生成的:
![]()
![]()
![]()
![]()
![]()
2.1 后驗推斷
![]()
![]()
![]()
2.2 處理高維效應修飾因子的擴展
![]()
![]()
3 貝葉斯漸近理論
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
4 基于決策論的報告框架
![]()
。。。。。。。。。
原文鏈接:https://arxiv.org/pdf/2604.23851
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.