![]()
系列簡介
這是我們一系列原創技術貼,從易到難,每天學習一點。所有內容均為疾控數據分析、科研論文相關,或者說很多和現在的熱門監測預警相關,所以我們這個系列就叫“監測預警基礎”。
今天是第31節,綜合指數法第2篇,如果大家覺得不錯,歡迎轉發點贊!
綜合指數法5大步驟,我們昨天看過,
今天先說第一步
綜合,綜合,
那么多指標,我到底綜合哪些?
氣象、經濟、人口流動等風險因素也都能納入嗎?
![]()
![]()
能。確實理論上是可以的,三類指標都能納入:
第一,直接指標:病例數、陽性率、聚集性疫情、門急診量;
第二,間接指標:網絡搜索、學校缺勤、藥品銷售、輿情監測;
第三,風險因素指標:溫度、濕度、疫苗接種率、人口密度、病媒生物密度。
從方法學原理上講,綜合指數法本來就是一個"大籮筐",只要跟傳染病流行有關,理論上都可以扔進來做加權。這也是它區別于 CUSUM、EWMA 等單指標模型的核心優勢。
但問題是:理論上能進,不等于實操里建議進。
![]()
在搭建一套可運轉的、每周自動出數的預警系統時,我建議的優先級如下:
![]()
為什么這么排?
因為綜合指數法最終要每周算一個數、每周劃一個等級(當然,也不是非要以周為單位,但是疾控傳染病監測預警一般都是這么做)。如果你的指標里有月度更新的疫苗接種率,你怎么辦?復制 4 份填進每周?這會讓綜合指數在這個月里被一條平線"綁架",前面幾周疫情已經起來了,指數卻紋絲不動。
氣象因素也是同理。溫度和流感確實相關,但它是"背景板"而不是"信號燈"。當綜合指數飆升時,你很難區分這周的風險升高是因為病毒真的在傳播,還是因為這周突然降溫了。
溫度不直接等于"傳播風險",它只是一個遠端影響因素。
![]()
我之前提到的四個原則,現在展開講透:
第一道篩:可獲得(Availability)
這不是廢話。很多聽起來很美的指標,在實際疾控系統里根本拿不到干凈的數據。
1、互聯網搜索指數:能拿到,但不同平臺口徑不一,且關鍵詞設置主觀性強;
2、學校缺勤數據:教育部門和衛健部門數據打通了嗎?是實時上報還是學期末匯總?
3、污水監測:有監測點嗎?檢測周期是周還是月?
如果某指標在過去一年里有超過 10% 的缺失周,建議暫時放棄。綜合指數法要求每周都能算,缺一周就得插值或回退,預警系統的穩定性會被拖垮。
第二道篩:周更新(Weekly Refreshability)
這是實操中最硬的一條約束。綜合指數法目前對于疾控主流是周預警,意味著你的所有指標原則上應該同步周更新。
如果只有月數據怎么辦?
1、不要復制填充:把本月疫苗接種率復制 4 份塞進每周,是偽數據,會抹殺周波動;
2、不要強行拼接:周頻指標在動,月頻指標不動,綜合指數會被那條"平線"稀釋或拉偏;
正確做法要么整套系統按月跑(放棄周預警的靈敏度,換取數據真實性),要么找周替代指標(比如用周更新的門急診量替代月更新的疫苗接種率)。
第三道篩:與流行強度直接相關(Direct Relevance)
這是因果鏈條長短的問題。鏈條越短,指標越"靈敏";鏈條越長,越容易產生偽信號。
![]()
我們選擇的原則就是優先選"近端指標"(直接反映疾病活動),慎用"遠端指標"(通過復雜因果鏈才影響到流行的)。
第四道篩:指標間相對獨立(Independence)
這是防重復計算的底線。如果你選了"門急診流感樣病例數"和"發熱門診就診量",這兩個指標在流感季里幾乎是同漲同跌的,同時納入就相當于給"就診壓力"這個維度加了雙倍權重,其他維度被壓縮。
怎么判斷獨立性?
第一,用歷史數據跑一下相關性分析(Pearson 或 Spearman),如果兩個指標的相關系數>0.7,建議只留一個;
第二,理想狀態是三個指標分別代表不同維度:比如一個代表病原活動(陽性率)、一個代表就診壓力(ILI)、一個代表社會面傳播(聚集性疫情/學校缺勤)。
但是也要注意,綜合指數法在數學上是一個加權求和模型,不是回歸模型,不存在“系數估計因共線性而失真”的問題。一般可能不會或者說不強求把“多重共線性檢驗”列為操作步驟。指標相關不相關,對與綜合指數法,關鍵看是不是“重復計算同一個維度”。
![]()
目前常見的分析和論文,選擇指標幾乎都是2~3 個,最多不超過 4 個。
1 個:退化成單指標預警,沒必要用綜合指數法;
2~3 個:維度覆蓋夠,計算量可控,標準值和權重都好解釋;
5 個以上:標準值難定、權重難賦、指標間獨立性難保證,系統越復雜,每周跑不通的概率越高。
記住,綜合指數法的威力不在于"指標多",而在于"選得準、融得穩"。
最后總結,綜合指數法在理論上是個"大籮筐",但實操中是個"精密儀器"。選指標不是逛菜市場,不是看見什么新鮮就往里扔。過了"可獲得、周更新、直接相關、相對獨立"這四道篩,你的預警系統才能從"能跑"變成"跑得準"。
![]()
參考文獻和書籍:
[1]楊鵬, 王小莉. [M]傳染病預測預警技術及實踐案例分析.[M] 人民衛生出版社: 267-275.
[2] 張莉, 吳雙勝, 石偉先, 等. 綜合指數法建立北京市流感流行水平分級評價體系的研究[J]. 中華流行病學雜志, 2018, 39(8): 1096-1099. DOI: 10.3760/cma.j.issn.0254-6450.2018.08.016.
[3]王宇, 賈蕾, 高志勇, 等. 綜合指數法建立北京市諾如病毒急性胃腸炎流行水平分級標準[J]. 國際病毒學雜志, 2019, 26(4): 225-228. DOI: 10.3760/cma.j.issn.1673-4092.2019.04.004.
[4]王宇, 吳雙勝, 張莉, 等. 應用移動流行區間法和綜合指數建立北京市流感流行分級預警標準[J]. 國際病毒學雜志, 2020, 27(4): 271-274. DOI: 10.3760/cma.j.issn.1673-4092.2020.04.002.
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創
說明 | 轉載只為分享,如有侵權聯系刪除
?版權聲明 | 部分信息和圖片來自公開網絡
轉載請注明
再次轉載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構從業者運營
重點關注國內外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創內容,文章為個人理解所學,不涉及疫情信息及內部保密數據,發表的目的為自我總結及給有需求的人士學習使用。如有不妥之處,歡迎聯系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.