![]()
導語
復雜網絡的鏈路預測,一直是橫跨生物、社交、信息系統等領域的核心難題。在算法層出不窮的背后,網絡本身究竟存在怎樣的可預測極限?結構與可預測性之間又有怎樣的定量關聯?2026年4月發表于PNAS的這項研究,將統計物理中的自旋玻璃理論與網絡科學相結合,構建了一套描述網絡可預測性的理論框架。通過把鏈路預測映射到自旋玻璃模型,該研究從物理角度刻畫了復雜網絡可預測性的內在約束,定義了可預測性指數,為鏈路預測給出理論上的性能上界,并提供了基于局部信息的高效評估方法。這一工作為理解網絡可預測性提供了新的理論視角,也為后續算法設計與性能評估提供了物理驅動的基準。
關鍵詞:復雜網絡,鏈路預測,自旋玻璃,空腔方法(cavity method),可預測性指數
王璇丨作者
趙思怡丨審校
![]()
論文題目:Predictability of complex networks 論文鏈接:https://www.pnas.org/doi/10.1073/pnas.2535161123 發表時間:2026年4月20日 論文來源:PNAS
引言:被算法困住的網絡可預測性
群體智能與復雜系統研究中,網絡是描述復雜系統的重要工具,而鏈路預測則是理解網絡結構與演化規律的重要問題之一。它的目標表述并不復雜:根據已有的連接,推斷缺失的邊、預測未來的連接、復原被破壞的拓撲。這直接支撐生物網絡重構、社交推薦、異常檢測、故障預警等無數場景。
長期以來,鏈路預測領域偏重算法迭代與模型創新,相關理論體系發展相對滯后。研究者不斷提出新指標、新模型、新學習框架,更根本的問題在于:一個網絡是否天然具有可預測性?哪些結構決定了它的預測上限?現有算法距離這一上限還有多遠?此外,對于大規模網絡,又該如何高效評估這種可預測性?
靜態結構與動態演化、局部特征與全局性能、真實網絡與人工模型之間,長期存在難以彌合的理論鴻溝。這項研究借助統計物理思想打通了這一研究隔閡:將網絡可預測性從經驗化的算法性能指標,升維為可解析、可分解、可橫向比對的理論量化物理量,為鏈路預測及網絡可預測性研究建立起統一的基準標尺。
物理跨界:
把鏈路預測“翻譯”成自旋玻璃系統
這項研究最具創新性的突破,是完成了一次嚴格且合理的近似跨學科映射:將鏈路預測問題,近似對應到統計物理中的自旋玻璃模型,為復雜網絡可預測性的理論解析提供了全新切入點。
具體而言,研究者為網絡中的每條邊賦予一個自旋變量,該變量的取值直接對應這條邊在鏈路預測訓練/測試劃分中的歸屬:其中+1 代表這條邊被隱藏,作為待預測的缺失鏈路,?1 代表這條邊被保留,作為模型訓練與驗證的觀測結構。在此映射框架下,網絡所有可能的訓練/測試劃分方式,對應自旋玻璃模型中自旋組態的系綜。而預測算法區分真實邊與非邊的能力,則近似等價于該自旋系統在高溫極限下的平均能量,從而將鏈路預測的性能評估,轉化為可通過統計物理方法解析的物理量。
![]()
圖 1. 自旋玻璃模型示意圖。
Marc Mézard、Giorgio Parisi等人于1987年提出空腔方法,這是統計物理中用于解析無序系統的經典數學方法。其核心思路是通過在大規模系統中構建“空腔方法”(即隔離單個自旋或局部單元),建模該單元與系統其余部分的自洽相互作用,進而近似解析系統的宏觀特性,相比其他方法更具直觀性且數學復雜度更低。
依托這一方法,該研究給出了具有重要意義的結論:網絡的全局可預測性,可以精確分解為每條鏈路的獨立貢獻之和。這意味著每條鏈路的可預測性只由它的局部鄰域決定,與網絡遠端無關,全局可預測性就是所有單鏈路可預測性的平均值。而共同鄰居、優先連接等局部算法并非權宜之計,而是符合物理本質的最優策略。這一分解從根源上解釋了為什么有些網絡天生更易預測,也革新了可預測性的計算范式,讓大規模網絡的可預測性評估變得切實可行。
方法革命:
局部采樣算法,讓大規模網絡評估成為現實
傳統評估方法需要反復劃分全網絡、多次運行算法,計算量呈爆炸式增長,難以適配大規模網絡場景。基于上述局部分解結論,該研究提出了局部采樣算法,其核心邏輯是:僅在目標鏈路的局部鄰域內進行隨機劃分,鄰域以外的邊全部固定不變。需要注意的是,該算法的結果與全網絡模擬高度一致,是存在明確條件限制的,即網絡需滿足“局部樹近似”假設,且鏈路的局部鄰域需包含足夠多的關鍵節點與邊,能夠完整反映該鏈路的固有可預測性特征,同時網絡不存在強全局關聯性。在此前提下,該算法的計算規模僅隨網絡平均度增長,而非總邊數,效率可提升幾個數量級,成功將超大規模網絡的可預測性評估從不可能變為日常工具,具備極強的工程應用價值。
在此基礎上,研究提出可預測性指數(PI)作為網絡的固有性能上限,它是信息幾乎完整時可預測性能達到的最大值,不受信息缺失影響,在高缺失比例下依然精準預測實際性能,并且可以跨網絡、跨算法比較,一把尺子量盡所有預測潛力。拿到一個網絡先算 PI,就能立刻知道能不能預測、最多能多準、算法還差多遠,徹底告別盲目迭代與算力浪費。
普適定律:
三大經典網絡,可預測性被結構精準控制
此外,該研究還針對三大經典網絡模型,給出了嚴格、可復現的針對性結論,具體如下:
隨機網絡節點連接完全隨機、無任何拓撲結構偏好,節點間的連接概率均勻分布,不存在局部聚類、度異質性等特征,可預測性恒為0.5。該結論可作為全領域鏈路預測的隨機基準,用于衡量其他網絡可預測性的高低。
無標度網絡的hub節點擁有大量連接,其局部鄰域包含的網絡結構信息遠多于普通節點,而根據研究提出的局部分解結論,鏈路可預測性由局部鄰域決定。因此無標度網絡的可預測性呈現明確單調趨勢,度異質性越強、hub節點(中心節點)越集中,可預測性越高。
小世界網絡的可預測性與局部聚類系數、重連概率密切相關。局部聚類越強,可預測性越高,而重連概率增大時,網絡的可預測性會逐步跌落至0.5。重連概率提升會破壞小世界網絡原有的局部密集連接結構,削弱局部鄰域的結構信息關聯性,使網絡拓撲逐漸趨近于隨機網絡,最終可預測性趨近于隨機網絡的基準值0.5。
![]()
圖 2. 先前參數對網絡可預測性的影響。
這清晰證明,可預測性不是玄學,而是由結構參數嚴格控制的定量屬性。在社交、生物、技術等真實網絡中,這一框架得到了廣泛驗證。可預測性指數與實測性能高度線性相關,即便在高信息缺失下依然保持穩定,度異質性與局部結構模式對真實網絡的可預測性表現出較強的解釋力,局部采樣算法同樣高效可靠,完全滿足實際應用需求。這充分說明,這套基于物理的理論不只是數學推導,而是真實復雜系統背后的客觀規律。
總結與展望
這項研究真正打通了統計物理與網絡科學的邊界,讓復雜網絡可預測性研究徹底走出算法迭代的困境,正式邁入理論驅動的全新階段。它首次從底層原理上系統回答了網絡可預測性的來源、上限與高效評估方式,不僅為鏈路預測劃定了不可突破的理論邊界,更提供了可直接落地的高效分析工具。未來,這一統一框架將進一步拓展至圖神經網絡等全局預測算法,并向動態演化網絡、多層耦合網絡等更復雜的場景延伸,最終有望建立與算法無關的絕對可預測上限,幫助人類更精準地理解、重構與預測現實世界中無處不在的復雜網絡。
復雜網絡動力學讀書會
集智俱樂部聯合合肥工業大學物理系教授李明、同濟大學副教授張毅超、北京師范大學特聘副研究員史貴元與在讀博士生邱仲普、張章共同發起 。本次讀書會將探討:同步相變的臨界性、如何普適地刻畫多穩態與臨界點、如何識別并預測臨界轉變、如何通過局部干預來調控系統保持或回到期望穩態、爆炸逾滲臨界行為的關鍵特征、不同類型的級聯過程對逾滲相變的影響有何異同、高階相互作用的影響能否等效為若干簡單機制的疊加、如何有效地促進人類個體間的合作等問題。讀書會已完結,現在報名可加入社群并解鎖回放視頻權限。
詳情請見:
1.
2.
3.
4.
5.
6.
7.
8.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.