4月14日,斯坦福大學(xué)以人為本人工智能研究院(Stanford Institute for Human-Centered Artificial Intelligence,簡(jiǎn)稱“斯坦福HAI”)發(fā)布了重磅年度報(bào)告《2026 年人工智能指數(shù)報(bào)告》(The 2026 AI Index Report)。
![]()
報(bào)告 自2017年以來已連續(xù)更新了9年,是成為人工智能領(lǐng)域最全面的年度快照,有“AI體檢單”之稱。
報(bào)告長(zhǎng)達(dá)423頁(yè),下文中我們重點(diǎn)概括了“第六章-醫(yī)學(xué)”部分,內(nèi)容概述了人工智能在醫(yī)學(xué)領(lǐng)域的進(jìn)展,包括科學(xué)發(fā)現(xiàn)、臨床應(yīng)用、患者參與度及倫理考量。
![]()
小模型碾壓大模型
報(bào)告首先關(guān)注到分子生物學(xué)領(lǐng)域,并提出了核心觀點(diǎn):較小的模型表現(xiàn)優(yōu)于較大的模型。
2024年至2025年間AI蛋白質(zhì)研究增長(zhǎng)了約71%,其中蛋白質(zhì)語(yǔ)言模型(PLMs)被著重強(qiáng)調(diào),該領(lǐng)域正在從規(guī)模競(jìng)爭(zhēng)轉(zhuǎn)向模型效率和專業(yè)化的比拼。
![]()
報(bào)告還特別提到兩個(gè)例子,分別是僅有1.11億參數(shù)的蛋白質(zhì)語(yǔ)言模型MSAPairformer在權(quán)威榜單ProteinGym上優(yōu)于多個(gè)億級(jí)參數(shù)的巨無(wú)霸;
以及擁有2億參數(shù)的基因組模型GPN-Star,表現(xiàn)優(yōu)于擁有400億參數(shù)的模型。
![]()
虛擬細(xì)胞一夜崛起
虛擬細(xì)胞模型是2025年最熱門的全新領(lǐng)域,僅PubMed出版物數(shù)量就增長(zhǎng)了50%,其中Arc研究所的Evo 2、STATE以及DeepMind的AlphaGenome是最受關(guān)注的產(chǎn)品。
![]()
這些模型旨在預(yù)測(cè)細(xì)胞對(duì)藥物和基因變異的反應(yīng),而無(wú)需進(jìn)行濕實(shí)驗(yàn)室實(shí)驗(yàn),在藥物開發(fā)的臨床階段具有極大應(yīng)用潛力。
不過目前的該領(lǐng)域系統(tǒng)仍需通過實(shí)驗(yàn)進(jìn)行驗(yàn)證,且訓(xùn)練方法和數(shù)據(jù)管理仍然是性能的重要決定因素。
![]()
AI為醫(yī)生節(jié)省了83%時(shí)間
臨床人工智能已經(jīng)從試點(diǎn)階段發(fā)展到企業(yè)級(jí)部署,其中能夠從患者就診記錄中自動(dòng)生成臨床記錄的AI筆記工具是最典型的應(yīng)用。
在多個(gè)醫(yī)院系統(tǒng)中,醫(yī)生們?cè)跁鴮懖v上的時(shí)間減少了多達(dá)83%,其中Northwestern Medicine更實(shí)現(xiàn)了高達(dá) 112% 的投資回報(bào)率。
![]()
258款A(yù)I器械獲批 中國(guó)企業(yè)殺入前三
截至2025年9月,F(xiàn)DA批準(zhǔn)了258 款人工智能醫(yī)療設(shè)備,超過了此前所有全年總數(shù)。具體到廠商上,GE Healthcare以93個(gè)設(shè)備領(lǐng)先,其次是西門子(82個(gè))以及來自中國(guó)的聯(lián)影醫(yī)療(38個(gè))。
![]()
但絕大多數(shù)獲批產(chǎn)品是依賴現(xiàn)有安全性和功效證據(jù)(而非新的隨機(jī)試驗(yàn))的設(shè)備改造途徑進(jìn)入市場(chǎng)的,僅有2.4%的設(shè)備擁有由隨機(jī)試驗(yàn)數(shù)據(jù)支持的臨床研究支持。
![]()
AI Agent戰(zhàn)勝人類醫(yī)生
自主和半自主的Agent已成為AI醫(yī)療領(lǐng)域的一項(xiàng)重大成果。
該領(lǐng)域最大的成果來自于微軟AI醫(yī)療診斷工具MAI-DxO,在304個(gè)《新英格蘭醫(yī)學(xué)雜志》刊登的復(fù)雜病例中以85.5%的驚人準(zhǔn)確率,擊敗了未借助任何輔助工具的人類醫(yī)生(成績(jī)僅為 20%)。
![]()
在微軟的AI診斷編排器(MAI-DxO)配合OpenAI的o3聯(lián)合使用的情況下,多代理框架能提升7%-60%的診斷準(zhǔn)確性,優(yōu)于單代理基線。
![]()
84%健康搜索已被AI統(tǒng)治
人工智能生成的摘要如今出現(xiàn)在84%-92%的與健康相關(guān)的谷歌搜索結(jié)果頂部。
![]()
其中92%癥狀與常見的健康問題會(huì)觸發(fā)AI概覽功能,其次是關(guān)于治療方案與病情狀況的查詢。這些概述如今已成為健康信息搜索中的常規(guī)功能,影響著用戶對(duì)自身問題的初始解讀。
![]()
數(shù)字孿生值得關(guān)注
學(xué)術(shù)界對(duì)醫(yī)療數(shù)字孿生的研究興趣正在迅速增長(zhǎng),出版數(shù)量從2015年的接近0增加到2025年的372篇,而且在已進(jìn)行試驗(yàn)中,早期成果均顯示出良好前景。
在一項(xiàng)針對(duì)150名糖尿病患者的隨機(jī)試驗(yàn)中,71% 的受試者在一年時(shí)間內(nèi)成功實(shí)現(xiàn)了血糖水平的健康穩(wěn)定,同時(shí)還能安全地減少用藥量。
![]()
數(shù)據(jù)仍是AI天花板
與其他領(lǐng)域一樣,AI生命科學(xué)模型的開發(fā)也正日益受到數(shù)據(jù)而非架構(gòu)方面的瓶頸制約。
隨著共折疊模型如今涵蓋了蛋白質(zhì)數(shù)據(jù)庫(kù)中所有結(jié)構(gòu)類型,2025年該領(lǐng)域開始轉(zhuǎn)向基于人工智能預(yù)測(cè)結(jié)構(gòu)的精煉數(shù)據(jù)集,并借助綜合實(shí)驗(yàn)數(shù)據(jù)源進(jìn)行訓(xùn)練,從而將訓(xùn)練數(shù)據(jù)集的規(guī)模從數(shù)十萬(wàn)條目擴(kuò)展至數(shù)千萬(wàn)。
說到最后:
此外報(bào)告還涉及了醫(yī)療倫理領(lǐng)域。2025年醫(yī)學(xué)人工智能出版物中關(guān)于倫理問題的討論內(nèi)容已增加了一倍多,但相關(guān)討論范圍較為狹窄。
治理問題在討論中占據(jù)主導(dǎo)地位,而算法問責(zé)制、生物安全及全球衛(wèi)生公平性等問題則仍未得到充分探討。
報(bào)告原文:https://hai.stanford.edu/ai-index/2026-ai-index-report/medicine
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.