文/陳根
用AI問診,為什么可能把小病問成大禍?
2026年,生成式AI已廣泛進入醫療領域:患者用它初步問診、醫生用它輔助診斷、研究者用它檢索文獻。然而,一個致命隱患正在悄然放大——AI幻覺。它讓AI在醫學場景中一本正經地編造癥狀解釋、診斷結論、治療方案,甚至偽造不存在的臨床研究和藥物說明。
上個月,全國首例AI幻覺引發的醫療相關侵權糾紛案宣判,標志著AI幻覺已從技術缺陷升級為現實的醫療風險和社會問題。
![]()
AI問診的“幻覺”本質:統計概率,而非醫學理解
大語言模型的核心機制是下一詞預測。它通過海量文本學習詞語之間的統計關聯,而不是真正理解醫學知識、病理機制和個體差異。
例如,當患者描述“反復頭痛、夜間盜汗”,AI可能會根據訓練數據中的高頻關聯,流暢地輸出“可能為淋巴瘤早期表現,建議立即化療”,而完全忽略患者實際年齡、家族史和其他關鍵體征。
換言之,AI不是在“診斷”,而是在拼湊最可能的詞語序列。在醫學這種高度專業、個體化、容錯率極低的領域,這種機制會帶來嚴重后果。
· 事實性幻覺:編造不存在的檢查指標、藥物相互作用或臨床指南。
· 邏輯性幻覺:給出看似合理、實則自相矛盾的建議(如同時推薦相互沖突的治療方案)。
研究顯示,即使是當前最先進的醫療大模型,在復雜問診場景下的幻覺率仍可達到15%-35%,遠高于普通對話場景。而目前,中文大模型語境下的醫療大模型,其幻覺問題不可忽視。
真實風險:AI問診可能誤導生命
醫學不同于其他領域,一句幻覺就可能導致:
· 延誤真正疾病的診斷(如把早期癌癥當成“壓力性頭痛”)
· 錯誤用藥(推薦存在嚴重禁忌癥的藥物)
· 患者過度焦慮或盲目自信(把良性問題夸大成絕癥,或把嚴重問題輕描淡寫)
更危險的是,許多患者把AI當作“免費第二意見”,尤其是夜間急癥或基層醫療資源不足時,直接依賴AI生成的內容做決策。而AI幻覺往往以極度專業、自信的語氣呈現,讓人難以辨別真偽。
![]()
當前技術緩解手段與局限
行業正在積極應對——
· 檢索增強生成(RAG):讓AI先檢索權威醫學數據庫(如PubMed、UpToDate、中國知網指南),再生成回答,顯著降低幻覺。
· 多智能體辯論:多個AI相互質疑驗證。
· 臨床驗證層:增加事實核查和不確定性聲明機制。
但這些方法仍無法完全消除風險。醫學知識更新極快、醫學論文本身存在造假、臨床指南存在利益導向、個體差異極大、訓練數據存在偏差等問題,使得AI在疾病診斷、罕見病、復雜共病、新發疾病上的表現依然不穩定。
AI可以輔助,但絕不能替代
AI幻覺在醫學領域的持續存在,深刻提醒我們:當前AI仍是“統計智能”,而非真正的醫學智能。它擅長模式匹配,卻缺乏真正的臨床判斷力、倫理意識和對生命的敬畏。
在AI越來越普及的時代,我們需要更高的醫學素養和AI素養——既要充分利用AI提升效率,更要清醒地認識到它的邊界。
真正的醫療安全,永遠建立在專業醫生、嚴謹證據和人文關懷之上。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.