動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)聚類的穩(wěn)定距離持續(xù)同調(diào)
A Stable Distance Persistence Homology for Dynamic Bayesian
Network Clustering
https://arxiv.org/pdf/2605.11226
研究背景與現(xiàn)有方法痛點(diǎn)
- 動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(DBN)的特性DBN通過固定底層有向無環(huán)圖(DAG)結(jié)構(gòu)、僅隨時(shí)間變化條件概率表(CPT)的方式,對概率依賴關(guān)系隨時(shí)間演化的復(fù)雜系統(tǒng)進(jìn)行建模。其核心價(jià)值在于用少量隨機(jī)變量間的概率依賴捕捉系統(tǒng)行為。
- 傳統(tǒng)推斷與聚類方法的局限
- 局部視角限制:標(biāo)準(zhǔn)推斷(如濾波)聚焦局部條件分布,難以捕捉變量間依賴關(guān)系在大尺度上的組織與演化模式。
- 計(jì)算瓶頸:信念狀態(tài)規(guī)模隨變量數(shù)呈指數(shù)增長,精確推斷在一般情況下不可行(intractable)。
- 啟發(fā)式缺陷:現(xiàn)有貝葉斯網(wǎng)絡(luò)聚類算法多為啟發(fā)式方法,未充分利用底層DAG的固有拓?fù)浣Y(jié)構(gòu),缺乏追蹤聚類隨時(shí)間演化或跨網(wǎng)絡(luò)定量比較的原則性框架。
![]()
![]()
摘要
動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(DBNs)是一種廣泛用于對概率結(jié)構(gòu)隨時(shí)間演化的系統(tǒng)進(jìn)行建模的框架。標(biāo)準(zhǔn)推斷方法主要關(guān)注局部條件分布,可能會(huì)忽略變量間依賴關(guān)系隨時(shí)間組織與演變的更大尺度模式。針對這一問題,我們引入了一種拓?fù)鋵W(xué)方法。我們將每個(gè)DBN關(guān)聯(lián)到一個(gè)時(shí)變圖,稱為動(dòng)態(tài)貝葉斯圖(DBG),具體做法是為每條邊分配一個(gè)強(qiáng)度值,該值衡量其在不同父節(jié)點(diǎn)配置下條件依賴的變化程度,并保留強(qiáng)度超過選定閾值的邊。我們證明該構(gòu)造方法契合Kim和Mémoli[3]提出的動(dòng)態(tài)圖框架,從而得以應(yīng)用拓?fù)鋽?shù)據(jù)分析工具。對DBG應(yīng)用持續(xù)同調(diào)可生成一個(gè)條形碼,它記錄了強(qiáng)依賴變量構(gòu)成的連通組隨時(shí)間的合并與消失過程。我們證明了該條形碼具有穩(wěn)定性:DBN條件概率表中的微小擾動(dòng)僅會(huì)導(dǎo)致所得條形碼發(fā)生微小變化。由此,我們得到了一種具有理論依據(jù)且抗噪聲的總結(jié),用于刻畫動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)中依賴結(jié)構(gòu)的演化過程。
引言
概率圖模型的一大效用在于能夠利用隨機(jī)變量之間的一組少量概率依賴關(guān)系來捕捉看似復(fù)雜系統(tǒng)的行為。動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(DBNs)在時(shí)間維度上實(shí)現(xiàn)了這一點(diǎn):它們通過對狀態(tài)通過貝葉斯網(wǎng)絡(luò)的連續(xù)副本進(jìn)行演化的系統(tǒng)進(jìn)行建模 [4],其中條件概率表(CPTs)可能會(huì)從一個(gè)時(shí)間步變化到下一個(gè)時(shí)間步。它們已在計(jì)算生物學(xué)、神經(jīng)科學(xué)、流行病學(xué)和工程學(xué)等多種領(lǐng)域找到了應(yīng)用。DBNs 的一個(gè)關(guān)鍵結(jié)構(gòu)特征是,其底層有向圖是固定的(只有 CPT 值發(fā)生變化),然而正是這些變化導(dǎo)致了節(jié)點(diǎn)間依賴結(jié)構(gòu)的演化。理解和追蹤這些結(jié)構(gòu)是 DBN 分析的核心。
DBN 上的結(jié)構(gòu)
![]()
![]()
我們的方法彌補(bǔ)了這一點(diǎn)。我們利用穩(wěn)定距離持續(xù)同調(diào)(SDPH)構(gòu)建了一個(gè)形式化框架,旨在識別并追蹤動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(DBN)中隨時(shí)間變化的關(guān)鍵聚類結(jié)構(gòu)。該框架植根于 Kim 和 Mémoli [3] 的拓?fù)鋽?shù)據(jù)分析(TDA)機(jī)制,該機(jī)制引入了動(dòng)態(tài)圖(dynamic graphs)和形態(tài)圖(formigrams),用于追蹤連通分量(在此處即讀作聚類)在圖隨時(shí)間連續(xù)演化過程中的誕生、合并與解散。將之字形持續(xù)同調(diào)(zigzag persistence)應(yīng)用于形態(tài)圖會(huì)產(chǎn)生一個(gè)條形碼(barcode),這是一個(gè)區(qū)間多重集,其長度記錄了各個(gè)聚類事件的持久性。SDPH 方法特別適用于 DBN,因?yàn)樗x取的是編碼在有向無環(huán)圖(DAG)中的演化條件獨(dú)立結(jié)構(gòu),而不是將網(wǎng)絡(luò)視為需按外部標(biāo)準(zhǔn)進(jìn)行聚類的原始數(shù)據(jù)。
主要結(jié)果
將 [3] 的框架應(yīng)用于 DBN 的核心障礙在于結(jié)構(gòu)層面:DBN 帶有有向邊并在離散時(shí)間上運(yùn)行,而 [3] 中的動(dòng)態(tài)圖是無向的、連續(xù)時(shí)間的對象,且需滿足四個(gè)公理:自環(huán)(self-loops)、溫和性(tameness)、區(qū)間壽命(interval lifespan),以及最為微妙的可比性(comparability)。我們的主要貢獻(xiàn)是構(gòu)建了一個(gè)動(dòng)態(tài)貝葉斯圖(Dynamic Bayesian Graph, DBG),這是一種從 DBN 規(guī)范導(dǎo)出的動(dòng)態(tài)圖,解決了這種不匹配問題(第 4 節(jié))。
![]()
組織結(jié)構(gòu)
第 1 節(jié)總結(jié)了 [3] 中的相關(guān)背景:動(dòng)態(tài)圖、形態(tài)圖、之字形持續(xù)同調(diào)和穩(wěn)定性。第 2 節(jié)回顧了遵循 [4] 的貝葉斯網(wǎng)絡(luò)和動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的標(biāo)準(zhǔn)定義。第 3 節(jié)介紹了遵循 [6] 的邊強(qiáng)度函數(shù)。第 4 節(jié)展示了 DBG 的構(gòu)建和主要結(jié)果。第 5-7 節(jié)將該構(gòu)建置于現(xiàn)有貝葉斯網(wǎng)絡(luò)(BN)聚類方法的背景下,發(fā)展了聚類解釋,并討論了邊強(qiáng)度函數(shù)的設(shè)計(jì)靈活性。
第 1 節(jié):穩(wěn)定距離持續(xù)同調(diào)
以下部分總結(jié)了由 Kim 和 Mémoli [3] 開發(fā)的框架;除非另有說明,本節(jié)中的所有定義和結(jié)果均引自該參考文獻(xiàn)。
1.1 介紹 SDPH
![]()
此外,[3] 提出了形態(tài)圖(formigram)的概念,用于描述動(dòng)態(tài)圖(DG)的聚類。該形態(tài)圖用于獲得具有魯棒代數(shù)解釋的 DG 的持續(xù)條形碼。
雖然利用這種之字形持續(xù)同調(diào)方法有許多不同的方式,但該算法成為 DBN 分析關(guān)鍵的途徑有幾種不同的方式:
(i) 動(dòng)態(tài)圖(DG)的之字形持續(xù)同調(diào)圖的時(shí)間變化性質(zhì)反映了其聚類特征隨時(shí)間的推移過程。
(ii) 形態(tài)圖有效地表示了 DG 中的出生和死亡事件。因此,由形態(tài)圖表示的聚類特征可以表達(dá)具有無限壽命和有限壽命的點(diǎn)。
(iii) 在 DG 的聚類條形碼與 DG 之間的實(shí)際距離之間建立了一種穩(wěn)定性概念。這使得它們的結(jié)果對于數(shù)據(jù)分析的目的特別令人滿意。
(iv) 聚類依賴于一個(gè)自規(guī)定的邊強(qiáng)度函數(shù),該函數(shù)可以為聚類條形碼的整體解釋增加豐富性和多樣性。
給定一個(gè)動(dòng)態(tài)圖,完全獲得一個(gè)持續(xù)條形碼以及穩(wěn)定性結(jié)果需要三個(gè)步驟。步驟 1 包括將動(dòng)態(tài)圖提升(lifting)為形態(tài)圖。步驟 2 包括仔細(xì)地將形態(tài)圖表示為之字形持續(xù)條形碼。步驟 3 包括證明我們的之字形持續(xù)條形碼的穩(wěn)定性。
1.2 步驟 1:從動(dòng)態(tài)圖到形態(tài)圖
1.2.1 動(dòng)態(tài)圖
。。。。。。。。。。。。。
原文鏈接:https://arxiv.org/pdf/2605.11226
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.