網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

谷歌最新Nature論文：AI智能體醫(yī)生，在疾病管理中勝過人類醫(yī)生

2026-06-23 17:05:54　來源: 生物世界

上海舉報(bào)

分享至

撰文丨王聰

編輯丨王多魚

排版丨水成文

基于大語言模型（LLM）的人工智能（AI）系統(tǒng)，在臨床環(huán)境中展現(xiàn)出日益增長(zhǎng)的潛力，不僅能實(shí)現(xiàn)精準(zhǔn)診斷，還能通過自然且富有同理心的對(duì)話方式收集病史，有助于與患者建立可信賴的關(guān)系。

盡管已開發(fā)出多種用于診斷推理的 AI 模型，但它們?cè)诙啻尉驮\疾病管理方面的能力，例如跨多次臨床就診監(jiān)測(cè)疾病進(jìn)展和治療反應(yīng)以及安全用藥處方，仍探索不足。

2026 年 6 月 17 日，谷歌 DeepMind 和谷歌研究院在國(guó)際頂尖學(xué)術(shù)期刊Nature上發(fā)表了題為：Towards Conversational AI for Disease Management 的研究論文。

該研究強(qiáng)調(diào)了基于大語言模型醫(yī)療 AI 系統(tǒng)AMIE作為多次就診疾病管理工具的巨大潛力，其在疾病的管理推理任務(wù)中的表現(xiàn)可與人類醫(yī)生相當(dāng)，甚至更優(yōu)。

此前，谷歌開發(fā)了一款基于大語言模型（LLM）的醫(yī)療 AI 系統(tǒng)——AMIE（Articulate Medical Intelligence Explorer），其在對(duì)話式診斷任務(wù)中展現(xiàn)出與醫(yī)生相當(dāng)?shù)谋憩F(xiàn)水平。

在這項(xiàng)最新研究中，為了提升AMIE在管理推理方面的能力，研究團(tuán)隊(duì)開發(fā)了一種基于大語言模型的新型智能體系統(tǒng)，該系統(tǒng)包含一個(gè)用于同步文本聊天患者對(duì)話的共情對(duì)話智能體（Dialogue Agent），以及一個(gè)執(zhí)行更深入推理并交叉參考最新臨床實(shí)踐指南和藥物目錄的管理推理智能體（Mx Agent）。

AMIE 系統(tǒng)概述

系統(tǒng)架構(gòu)

為將推理根植于權(quán)威臨床知識(shí)，AMIE 利用谷歌的大語言模型Gemini的長(zhǎng)上下文能力，將上下文檢索與結(jié)構(gòu)化推理相結(jié)合，使其輸出與最新的臨床實(shí)踐指南及藥物處方集保持一致。

接下來，研究團(tuán)隊(duì)在一項(xiàng)隨機(jī)、盲法的虛擬客觀結(jié)構(gòu)化臨床考試（OSCE）研究中，將 AMIE 與 21 名初級(jí)保健醫(yī)生（PCP）在 100 個(gè)多訪視病例場(chǎng)景中進(jìn)行了比較，這些場(chǎng)景旨在反映英國(guó) NICE 指南和 BMJ Best Practice 指南。在由專科醫(yī)生評(píng)估的整體管理決策方面，AMIE 的表現(xiàn)不劣于初級(jí)保健醫(yī)生，而在治療與檢查的精確度、以及與臨床指南的一致性和依據(jù)性方面，AMIE 均得分更高。

疾病管理質(zhì)量評(píng)估

疾病管理推理能力評(píng)估

為基準(zhǔn)測(cè)試藥物推理能力，研究團(tuán)隊(duì)開發(fā)了RxQA，這是一個(gè)源自兩個(gè)國(guó)家（美國(guó)、英國(guó)）藥物處方集的多項(xiàng)選擇題基準(zhǔn)數(shù)據(jù)集，并經(jīng)委員會(huì)認(rèn)證的藥劑師驗(yàn)證。結(jié)果顯示，在“開卷”（可通過檢索獲取外部信息）情境下和“閉卷”（均不可獲取外部信息）情境下，AMIE 和初級(jí)保健醫(yī)生均受益于獲取外部信息的能力，但在較高度的問題上，AMIE 的表現(xiàn)優(yōu)于初級(jí)保健醫(yī)生。

藥物推理能力評(píng)估

總的來說，這項(xiàng)研究清晰地展示了谷歌的 AMIE 系統(tǒng)的演進(jìn)軌跡——從最初的對(duì)話式診斷 AI 系統(tǒng)，逐步發(fā)展為能夠處理多次就診疾病管理的推理系統(tǒng)。

值得一提的是，Nature同期還發(fā)表了一篇題為：Towards autonomous medical artificial intelligence agents 的研究論文。

該研究開發(fā)了一個(gè)名為MIRA（Medical Intelligence for Reasoning and Action）的自主 AI 智能體，它在沙盒化的電子健康記錄（EHR）環(huán)境中運(yùn)行，能夠遍歷廣泛的臨床操作空間，獲取患者病史，下達(dá)并解讀實(shí)驗(yàn)室、影像學(xué)和微生物學(xué)檢查，生成鑒別診斷，并制定包括開具藥物、安排手術(shù)和住院計(jì)劃在內(nèi)的治療方案。在涵蓋多種診斷的真實(shí)患者病例模擬中，MIRA 在診斷準(zhǔn)確性方面優(yōu)于人類醫(yī)生，并做出了符合指南、用藥安全且合理的住院決策。這項(xiàng)研究表明，集成了 EHR 的 AI 智能體能夠?qū)⑴R床意圖轉(zhuǎn)化為結(jié)構(gòu)化且可執(zhí)行的 EHR 操作，可能使其成為醫(yī)生更有效的決策支持伙伴。

論文鏈接：

1. https://www.nature.com/articles/s41586-026-10764-5

2. https://www.nature.com/articles/s41586-026-10675-5

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.