撰文丨王聰
編輯丨王多魚
排版丨水成文
基于大語言模型(LLM)的人工智能(AI)系統(tǒng),在臨床環(huán)境中展現(xiàn)出日益增長(zhǎng)的潛力,不僅能實(shí)現(xiàn)精準(zhǔn)診斷,還能通過自然且富有同理心的對(duì)話方式收集病史,有助于與患者建立可信賴的關(guān)系。
盡管已開發(fā)出多種用于診斷推理的 AI 模型,但它們?cè)诙啻尉驮\疾病管理方面的能力,例如跨多次臨床就診監(jiān)測(cè)疾病進(jìn)展和治療反應(yīng)以及安全用藥處方,仍探索不足。
2026 年 6 月 17 日,谷歌 DeepMind 和谷歌研究院在國(guó)際頂尖學(xué)術(shù)期刊Nature上發(fā)表了題為:Towards Conversational AI for Disease Management 的研究論文。
該研究強(qiáng)調(diào)了基于大語言模型醫(yī)療 AI 系統(tǒng)AMIE作為多次就診疾病管理工具的巨大潛力,其在疾病的管理推理任務(wù)中的表現(xiàn)可與人類醫(yī)生相當(dāng),甚至更優(yōu)。
![]()
此前,谷歌開發(fā)了一款基于大語言模型(LLM)的醫(yī)療 AI 系統(tǒng)——AMIE(Articulate Medical Intelligence Explorer),其在對(duì)話式診斷任務(wù)中展現(xiàn)出與醫(yī)生相當(dāng)?shù)谋憩F(xiàn)水平。
在這項(xiàng)最新研究中,為了提升AMIE在管理推理方面的能力,研究團(tuán)隊(duì)開發(fā)了一種基于大語言模型的新型智能體系統(tǒng),該系統(tǒng)包含一個(gè)用于同步文本聊天患者對(duì)話的共情對(duì)話智能體(Dialogue Agent),以及一個(gè)執(zhí)行更深入推理并交叉參考最新臨床實(shí)踐指南和藥物目錄的管理推理智能體(Mx Agent)。
![]()
AMIE 系統(tǒng)概述
![]()
系統(tǒng)架構(gòu)
為將推理根植于權(quán)威臨床知識(shí),AMIE 利用谷歌的大語言模型Gemini的長(zhǎng)上下文能力,將上下文檢索與結(jié)構(gòu)化推理相結(jié)合,使其輸出與最新的臨床實(shí)踐指南及藥物處方集保持一致。
接下來,研究團(tuán)隊(duì)在一項(xiàng)隨機(jī)、盲法的虛擬客觀結(jié)構(gòu)化臨床考試(OSCE)研究中,將 AMIE 與 21 名初級(jí)保健醫(yī)生(PCP)在 100 個(gè)多訪視病例場(chǎng)景中進(jìn)行了比較,這些場(chǎng)景旨在反映英國(guó) NICE 指南和 BMJ Best Practice 指南。在由專科醫(yī)生評(píng)估的整體管理決策方面,AMIE 的表現(xiàn)不劣于初級(jí)保健醫(yī)生,而在治療與檢查的精確度、以及與臨床指南的一致性和依據(jù)性方面,AMIE 均得分更高。
![]()
疾病管理質(zhì)量評(píng)估
![]()
疾病管理推理能力評(píng)估
為基準(zhǔn)測(cè)試藥物推理能力,研究團(tuán)隊(duì)開發(fā)了RxQA,這是一個(gè)源自兩個(gè)國(guó)家(美國(guó)、英國(guó))藥物處方集的多項(xiàng)選擇題基準(zhǔn)數(shù)據(jù)集,并經(jīng)委員會(huì)認(rèn)證的藥劑師驗(yàn)證。結(jié)果顯示,在“開卷”(可通過檢索獲取外部信息)情境下和“閉卷”(均不可獲取外部信息)情境下,AMIE 和初級(jí)保健醫(yī)生均受益于獲取外部信息的能力,但在較高度的問題上,AMIE 的表現(xiàn)優(yōu)于初級(jí)保健醫(yī)生。
![]()
藥物推理能力評(píng)估
總的來說,這項(xiàng)研究清晰地展示了谷歌的 AMIE 系統(tǒng)的演進(jìn)軌跡——從最初的對(duì)話式診斷 AI 系統(tǒng),逐步發(fā)展為能夠處理多次就診疾病管理的推理系統(tǒng)。
值得一提的是,Nature同期還發(fā)表了一篇題為:Towards autonomous medical artificial intelligence agents 的研究論文。
該研究開發(fā)了一個(gè)名為MIRA(Medical Intelligence for Reasoning and Action)的自主 AI 智能體,它在沙盒化的電子健康記錄(EHR)環(huán)境中運(yùn)行,能夠遍歷廣泛的臨床操作空間,獲取患者病史,下達(dá)并解讀實(shí)驗(yàn)室、影像學(xué)和微生物學(xué)檢查,生成鑒別診斷,并制定包括開具藥物、安排手術(shù)和住院計(jì)劃在內(nèi)的治療方案。在涵蓋多種診斷的真實(shí)患者病例模擬中,MIRA 在診斷準(zhǔn)確性方面優(yōu)于人類醫(yī)生,并做出了符合指南、用藥安全且合理的住院決策。這項(xiàng)研究表明,集成了 EHR 的 AI 智能體能夠?qū)⑴R床意圖轉(zhuǎn)化為結(jié)構(gòu)化且可執(zhí)行的 EHR 操作,可能使其成為醫(yī)生更有效的決策支持伙伴。
![]()
論文鏈接:
1. https://www.nature.com/articles/s41586-026-10764-5
2. https://www.nature.com/articles/s41586-026-10675-5
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.