精神病性障礙和雙相障礙占全球青少年及年輕成人疾病負擔的近10%,給個人、家庭和社會帶來沉重負擔。這類疾病發病后常持續或復發,縮短預期壽命10–20年,主要因自殺及軀體疾病風險增高所致。早期識別處于風險狀態的個體,是改善預后的關鍵步驟。
目前已有“精神病臨床高危”(CHR-P)和“雙相障礙高危”(CHR-BD)狀態的概念,且兩者的前驅期和臨床特征存在大量重疊(例如,雙相I型患者一生中精神病性癥狀的患病率達63%,雙相II型為22%)。因此,從預防性精神醫學角度,開發一個能夠同時檢測精神病性障礙或雙相障礙風險的跨診斷預測模型,具有重要的臨床價值。
既往雖有單獨針對精神病性障礙或雙相障礙的預測模型,但聯合模型極少。2025年發表的一項研究僅有一個跨診斷模型,外部驗證中AUC僅0.64(對雙相障礙更低至0.62),難以臨床應用。
本研究旨在利用電子健康記錄(EHR)和自然語言處理(NLP)技術,開發并驗證一個可在真實世界臨床實踐中同時預測精神病性障礙或雙相障礙6年風險的個體化預測模型。
方法
數據來源于英國南倫敦與莫茲利(SLaM)NHS信托基金會,該機構為約130萬居民提供精神科二級醫療服務。研究納入2008年1月1日至2021年8月10日期間在SLaM就診的所有年齡患者,其索引診斷為非器質性、非精神病性、非雙相障礙的ICD-10精神障礙(或CHR-P狀態)。
最終納入127,868例患者。男性占50.8%,女性49.0%,平均年齡33.4歲。白人占55.8%,黑人14.1%,亞裔4.9%,混合種族3.9%,其他5.7%,15.6%種族信息缺失。
結局事件為首次診斷為精神病性障礙或雙相障礙(兩者中先發生者),隨訪時間6年。結局日期定義為首次出現相應ICD-10診斷日期,或首次處方達到最低有效劑量的抗精神病藥(對于精神病性障礙)或心境穩定劑(對于雙相障礙)的日期,但必須有ICD-10診斷才算事件。
預測因子共77個,分為五類:
社會人口學與臨床(5個):年齡、性別、年齡×性別交互項、種族、索引診斷(ICD-10診斷分組或CHR-P狀態)
藥物(4個):抗精神病藥、心境穩定劑(均低于最低有效劑量)、抗抑郁藥、抗焦慮/鎮靜催眠藥
住院(2個):因精神/非精神原因住院天數
NLP衍生的癥狀與體征(66個):從臨床文本中自動提取,涵蓋精神病和雙相障礙的核心精神病理特征
物質使用(包含在上述66個NLP因子中)
采用LASSO正則化的Cox比例風險模型進行預測。由于數據為真實世界EHR,存在缺失值,但模型通過LASSO自動篩選變量。驗證策略采用“內部-外部交叉驗證”:按SLaM覆蓋的5個行政區(Croydon、Lambeth、Lewisham、Southwark、其他)進行地理分區,依次輪換一個區作為測試集,其余四個區作為訓練集,最后將5次驗證結果通過隨機效應薈萃分析合并。
結果
在平均隨訪622天(中位數315天)內,共有3150例患者發生結局事件(占2.5%),其中精神病性障礙2466例(1.9%),雙相障礙809例(0.6%)。6年累積風險為0.0827(95% CI 0.0784–0.0870)。
LASSO自動剔除了10個預測因子(包括年齡-性別交互項、其他性別、抗精神病藥、因精神問題住院、攻擊、內疚感、敵意、情緒不穩、注意力不集中、可卡因使用),最終模型保留28個預測因子。模型未違反比例風險假設。
圖 跨診斷臨床預測模型的預測因素及其危害比
![]()
原始非NLP預測因子包括(社會人口學/臨床 + 藥物 + 住院):年齡、性別(男性)、種族、索引診斷(ICD-10診斷分組);抗抑郁藥,抗焦慮藥,鎮靜催眠藥,心境穩定劑;非精神疾病相關住院天數。NLP預測因子包括:妄想、幻覺、思維紊亂、情感平淡、意志缺乏、社交退縮、抑郁情緒、焦慮、易激惹、自傷行為、怪異行為、功能下降、酒精使用、大麻使用、其他違禁藥物使用(可卡因除外)等。
模型性能:
總體C-index為0.80(95% CI 0.78–0.81),屬于“優秀”水平。
校準斜率均值1.02(SD 0.14),校準均值0.06(SD 0.02),提示無顯著校準偏差。
6年Brier評分均值0.03(SD 0.01),表明模型精確度良好。
決策曲線分析:在0–50%的風險閾值范圍內,該模型的凈獲益均優于“全部篩查”或“全不篩查”的默認策略。以10%風險閾值為例(即認為漏診風險比不必要的評估嚴重9倍),使用該模型每篩查100名患者可比默認策略多早期檢出3例精神病性障礙或雙相障礙患者。
敏感性分析:
去除種族變量或去除所有NLP預測因子后,模型性能無明顯下降。
分別構建單獨預測精神病性障礙和單獨預測雙相障礙的診斷特異性模型,其區分度分別為C=0.82和C=0.73。而本研究跨診斷模型在單獨預測精神病性障礙時C=0.82,單獨預測雙相障礙時C=0.72,與診斷特異性模型無統計學差異(p均>0.05),表明跨診斷模型并未損失預測準確性。
這是首個在真實世界臨床環境中開發并驗證的、用于聯合檢測精神病性障礙或雙相障礙風險的跨診斷預測模型,具有優秀的性能(C-index 0.80)。該模型完全基于常規臨床EHR數據和NLP技術,無需額外進行腦影像、血液檢測等昂貴或侵入性檢查,具有良好的可擴展性和成本效益。
臨床實施路徑:可嵌入EHR系統,自動提取相關變量,對新就診患者實時計算風險評分。當患者風險超過預設閾值(例如2年內風險>10%),系統向臨床醫生發出警報,促使將高危患者轉診至專業預防服務,進行深入評估(如使用CAARMS、SIBARS等工具)和預防性干預(如認知行為療法、人際與社會節律療法)。
局限性:平均隨訪622天短于6年,長時點估計不確定性增加;需進一步外部驗證和前瞻性療效試驗;NLP提取精度最高80%,可能存在噪聲;未納入家族史、創傷史等重要風險因子;模型不適用于初級保健或普通人群。
結論
本研究成功開發并驗證了一個跨診斷臨床預測模型,能夠有效識別處于精神病性障礙或雙相障礙風險的患者。這一新方法將促進對高危青少年的系統性早期檢測,推動真實世界臨床實踐中的預防性精神醫學發展。
參考文獻
Arribas M, de Micheli A, Krakowski K et al.Joint detection of risk for psychotic disorders or bipolar disorders in clinical practice in the UK: development and validation of a clinical prediction model.The Lancet Psychiatry, 2025; 13, 14-23
大話精神編譯,轉載請聯系編輯部。
投稿請聯系:dahuajingshen@126.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.