无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI看病成為醫(yī)患新包袱?補(bǔ)上「多輪追問」,通用AI才邁得過醫(yī)療關(guān)

0
分享至

衡宇 Jay 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

應(yīng)該不只是我家里的長(zhǎng)輩天天抱著AI“看病”吧?

這年頭,大家是越來越習(xí)慣把癥狀、化驗(yàn)單、病歷丟給AI了。

正所謂春江水暖鴨先知,身處一線的醫(yī)生們就對(duì)這個(gè)事情深有體會(huì)。越來越多患者帶著AI生成的“自我判斷結(jié)果”去醫(yī)院?jiǎn)栐\,有些醫(yī)生甚至反饋,門診里不少人帶著同一套AI結(jié)論來求證。

患者過度依賴大模型診斷,導(dǎo)致醫(yī)患溝通成本增加。界面新聞采訪的三甲醫(yī)院醫(yī)生就非常無奈:

“上午看了30個(gè)號(hào),25個(gè)病人是帶著AI結(jié)論來的?!?/strong>



雖然許多官媒時(shí)不時(shí)也提醒公眾,通用AI用于醫(yī)療場(chǎng)景存在明顯的不可靠性,但隨著AI技術(shù)精進(jìn)、使用人群越來越廣泛,AI確實(shí)正在進(jìn)入醫(yī)療決策的前置環(huán)節(jié)。

于是一個(gè)分化開始變得明顯起來。

一邊是通用大模型正在成為健康信息的第一入口,另一邊是醫(yī)療行業(yè)不斷強(qiáng)調(diào),通用模型不適合直接承擔(dān)醫(yī)療判斷。

所以我們討論的話題應(yīng)該再進(jìn)一步,聚焦在“哪一種AI有資格靠近醫(yī)療”?“我們到底需要什么樣的醫(yī)療AI”?

走向“能被病人托付”的醫(yī)療增強(qiáng)大模型M4

落地醫(yī)療場(chǎng)景的AI,必須要基于通用大模型做結(jié)構(gòu)性重構(gòu)與醫(yī)療專項(xiàng)增強(qiáng),方可真正服務(wù)醫(yī)療。

而百川智能推出的Baichuan-M4,正是在這個(gè)方向上的一次回答。

一直以來,百川在這方面的路徑清晰,從M1到M4,它始終在推動(dòng)通用大模型在醫(yī)療場(chǎng)景的能力邊界。

到了M3階段,這條路線開始真正收斂成體系,形成了一條清晰的能力基線,從而構(gòu)筑起由評(píng)測(cè)領(lǐng)先、范式原創(chuàng)、貼近臨床與外部驗(yàn)證四大要素共同支撐的信任體系。

M4在這條基線上的進(jìn)一步推進(jìn)。

我們可從最新發(fā)布的技術(shù)報(bào)告中一探究竟。

在最新評(píng)測(cè)體系中,M4繼續(xù)保持全球領(lǐng)先。

HealthBench綜合得分提升至68.6,Hard任務(wù)提升至49.7,幻覺率進(jìn)一步下降至3.3%。

在更貼近真實(shí)臨床環(huán)境的HealthBench Professional評(píng)測(cè)中,M4在基礎(chǔ)推理(不接外部工具)得分55.1,顯著高于GPT-5.5的51.8分。



但如果只看分?jǐn)?shù),這仍然只是連續(xù)優(yōu)化的結(jié)果。

M4真正的變化發(fā)生在能力結(jié)構(gòu)上,它開始從“單點(diǎn)問答優(yōu)化”走向“醫(yī)療過程能力重構(gòu)”。

這一變化,可以拆成四層升級(jí)。

會(huì)提問,從單輪問診走向深度診療

真實(shí)問診是個(gè)持續(xù)追問與信息補(bǔ)全的過程。

基于SCAN-bench 2.0體系,M4將訓(xùn)練場(chǎng)景從單次標(biāo)準(zhǔn)化問診擴(kuò)展到多輪訪視與復(fù)雜患者畫像,使模型能夠在信息不完整的情況下持續(xù)推進(jìn)診療路徑。

在動(dòng)態(tài)問診評(píng)測(cè)SCAN-bench中,M4初診得分79.0、復(fù)診74.7,均明顯領(lǐng)先其他頂尖模型;長(zhǎng)上下文臨床記憶得分86.9,較上一代M3提升 21.1 分,為同類最高。

搭載了M4的百川C端產(chǎn)品百小醫(yī)上,能非常直觀地體現(xiàn)這項(xiàng)技能點(diǎn)的重要性。



張先生半夜突然急性腳痛,打開APP后,百小醫(yī)連續(xù)追問了10輪,逐步鎖定了痛風(fēng)風(fēng)險(xiǎn)。

敲黑板,“連續(xù)追問10輪”。

不是閑聊,它在通過連續(xù)追問補(bǔ)齊病史信息,逐漸縮小風(fēng)險(xiǎn)范圍。



模型在多輪對(duì)話中會(huì)持續(xù)追問TA的飲食結(jié)構(gòu)、發(fā)作頻率、用藥歷史以及近期指標(biāo)變化,系統(tǒng)逐步收斂風(fēng)險(xiǎn)判斷路徑,更接近真實(shí)門診的復(fù)診過程。

會(huì)循證,從內(nèi)容生成走向證據(jù)驅(qū)動(dòng)

“有沒有依據(jù)”是醫(yī)療判斷的關(guān)鍵。

在循證這一層,M4構(gòu)建了原子化臨床路徑體系,將復(fù)雜醫(yī)學(xué)指南拆解為1000余個(gè)可復(fù)用臨床決策單元,覆蓋200余種常見疾病的完整診療流程。

在此基礎(chǔ)上,研究團(tuán)隊(duì)還引入了更嚴(yán)格的證據(jù)錨定機(jī)制,使模型輸出穩(wěn)定對(duì)齊醫(yī)學(xué)證據(jù)

很多通用模型也會(huì)在結(jié)論后甩一串文獻(xiàn),但點(diǎn)進(jìn)去常常對(duì)不上——要么引用編號(hào)在、內(nèi)容卻是兩回事,要么文獻(xiàn)本身沒錯(cuò)、被引的那段跟結(jié)論不沾邊。



證據(jù)錨定要做的,是讓每一句結(jié)論都能精確落到原文的具體段落,順著就能查到出處。

在Baichuan-EBM評(píng)測(cè)中,循證引用精度達(dá)到90.0,顯著高于GPT-5.5的54.7。

擁有Harness調(diào)度能力,持續(xù)提供健康管理服務(wù)

如果說問診解決的是單次決策問題,循證解決的是正確性問題,那么調(diào)度與記憶解決的是時(shí)間問題。

M4引入了Harness架構(gòu)。有了這個(gè)神經(jīng)中樞,何時(shí)追問、何時(shí)檢索證據(jù)、何時(shí)調(diào)出既往病史,均由模型自主決定,無需人工逐步指令

面對(duì)文獻(xiàn)檢索、長(zhǎng)病史梳理這類繁重任務(wù),它會(huì)拆分成子任務(wù)并行處理,讓模型專注于整體診療路徑的判斷;而每一步動(dòng)作,都在實(shí)時(shí)的安全約束下完成。

它會(huì)當(dāng)場(chǎng)攔下違規(guī)的工具調(diào)用、越權(quán)的數(shù)據(jù)訪問、不合臨床規(guī)范的操作等不安全的行為。

更重要的是,這套系統(tǒng)不是一次成型,而是在真實(shí)診療中持續(xù)迭代:線上的疑難案例、用戶的追問、醫(yī)生的糾偏,經(jīng)脫敏與歸因后回流,成為模型繼續(xù)改進(jìn)的依據(jù)。

問診、記憶、循證由此被編排成一個(gè)完整的整體,M4也從一個(gè)最強(qiáng)的醫(yī)療大腦,成為能獨(dú)立完成連續(xù)診療的醫(yī)療智能體。

全病程記憶,掌握患者上下文

真實(shí)的診療,很少在一次問診里就結(jié)束。

一次化驗(yàn)結(jié)果、一次用藥后的反應(yīng)、一個(gè)新冒出來的癥狀,都會(huì)隨病情推進(jìn)不斷改寫醫(yī)生的判斷——這意味著,能記住一個(gè)人完整的病史,才能給到患者更為準(zhǔn)確的建議。

針對(duì)這一點(diǎn),M4推出了“全病程記憶”,打通歷史病歷、多輪問診、化驗(yàn)趨勢(shì)與用藥反饋,讓模型在多次對(duì)話中始終掌握患者是誰、既往有過哪些疾病、各項(xiàng)指標(biāo)如何變化,而不必每次從零開始。

在長(zhǎng)上下文臨床記憶評(píng)測(cè)中,M4取得86.9分,為同類最高,較上一代M3提升21.1分。

記住一個(gè)人完整的病程是精準(zhǔn)醫(yī)療的前提,好多關(guān)鍵價(jià)值都藏在不起眼的隨口閑聊里。



先舉個(gè)比較aha-moment的例子。

提前內(nèi)測(cè)的張強(qiáng)(化名),和父母分居兩地。某次家庭群聊天時(shí),老人隨口提了一句“最近走一圈就喘”。

基于M4模型的百小醫(yī)BOT隨后結(jié)合長(zhǎng)期健康記錄與既往病史,提醒可能存在早期心功能不全風(fēng)險(xiǎn)。

然后打了波王牌輔助,輕松幾段話,就勸服張強(qiáng)媽媽就醫(yī)了。



換作只記短時(shí)對(duì)話的通用大模型,根本抓不住這種細(xì)碎線索。

在此背景下,百小醫(yī)這類C端產(chǎn)品形態(tài)的價(jià)值,開始出現(xiàn)。

張強(qiáng)媽媽最近很容易喘,百小醫(yī)在參考?xì)v史上下文給出健康提醒后,幫助張強(qiáng)說服老人去了醫(yī)院。

后續(xù)的院內(nèi)檢查結(jié)果,進(jìn)一步印證了此次就醫(yī)決策的必要性。

百小醫(yī)拿到報(bào)告后,還在繼續(xù)幫助張強(qiáng)管理家人的身體健康。

它把醫(yī)生之外那95%的診室外時(shí)間無縫銜接了:提醒、記錄、追問、預(yù)警,并在需要時(shí)把人重新推回線下就醫(yī)。



“主動(dòng)關(guān)心”這項(xiàng)技能點(diǎn)對(duì)醫(yī)療而言非常重要。

在中國(guó)醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院的75個(gè)患者群測(cè)試中,多個(gè)群內(nèi)在27天里共產(chǎn)生6944條對(duì)話,百小醫(yī)安全性達(dá)到99.6%,深度互動(dòng)率達(dá)到60%-73%。

通過如此高頻的交互,百小醫(yī)能沉淀足夠多的健康上下文,讓M4在后續(xù)問診、提醒和風(fēng)險(xiǎn)識(shí)別中更有連續(xù)性。

某種程度上,這體現(xiàn)了百川想長(zhǎng)期做的事情:

用M4提供專業(yè)大腦,用百小醫(yī)在家庭場(chǎng)景建立長(zhǎng)期、連續(xù)的醫(yī)療關(guān)系。

最終的應(yīng)用形態(tài),便是和真人醫(yī)生形成“雙醫(yī)模式”:醫(yī)生負(fù)責(zé)診斷與治療決策,AI負(fù)責(zé)診室外的長(zhǎng)期陪伴、信息整理和風(fēng)險(xiǎn)提醒。

醫(yī)療推理能力,保證模型輸出穩(wěn)定性

當(dāng)然,模型能力才是支撐這一切的基石。

在復(fù)雜醫(yī)療問題上,M4進(jìn)一步強(qiáng)化多模態(tài)能力。

在多模態(tài)能力方面,復(fù)雜檢驗(yàn)報(bào)告和化驗(yàn)單的結(jié)構(gòu)化識(shí)別得分0.914,能夠較好支持醫(yī)學(xué)影像與結(jié)構(gòu)化報(bào)告理解,使模型在復(fù)雜信息輸入條件下仍保持穩(wěn)定判斷能力。

這一部分能力更多作為補(bǔ)強(qiáng),保證模型在復(fù)雜醫(yī)療場(chǎng)景中的穩(wěn)定性。

整體來看,M4在M3形成的醫(yī)療專用基線上,完成了一次系統(tǒng)性的能力重構(gòu)。

它讓醫(yī)療AI從“回答問題”走向“參與診療過程”,從“單次交互”走向“連續(xù)托付”。

作為一家通用大模型公司,百川將旗下最強(qiáng)的模型能力投向了醫(yī)療這樣高風(fēng)險(xiǎn)、高復(fù)雜度的場(chǎng)景。

醫(yī)療不是賽道,是一道考題

過去兩年,大模型行業(yè)其實(shí)一直有一個(gè)爭(zhēng)議:醫(yī)療,到底只是大模型的一個(gè)應(yīng)用方向,還是值得單獨(dú)重做一套模型體系?

如今看來,百川的標(biāo)簽,可能首先是“通用大模型”。

只不過他們選了最難的醫(yī)療場(chǎng)景,作為檢驗(yàn)這個(gè)“通用大模型”的考場(chǎng)。

百小醫(yī)——這個(gè)能和患者深度建聯(lián)的C端產(chǎn)品,正是這個(gè)判斷的最佳印證。

它有Chatbot有的一切,但又全棧圍繞醫(yī)療用途重構(gòu)。

因?yàn)樗某霈F(xiàn),一整套專業(yè)級(jí)醫(yī)療模型能力,第一次開始進(jìn)入普通家庭。



這是一件很有意義的事,多年以來,家庭一直是醫(yī)療語境下被忽略的場(chǎng)景,許多珍貴的上下文未能被記錄沉淀。

如今,百小醫(yī)正在填上這一缺口。



  • 中國(guó)醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院:腫瘤科;
  • 首都醫(yī)科大學(xué)附屬北京兒童醫(yī)院:兒科;
  • 上海交通大學(xué)瑞金醫(yī)院:呼吸與危重癥醫(yī)學(xué)科。

北兒、東腫、瑞金……百川的AI家庭醫(yī)生,已在最嚴(yán)苛的臨床場(chǎng)景跑通。

而這還只是開始。

再往外延伸,藥企、醫(yī)療器械廠商、體檢機(jī)構(gòu)……這些過去跟患者之間隔著好幾層信息壁壘的角色,未來都有可能通過AI家庭醫(yī)生這個(gè)入口,更精準(zhǔn)地觸達(dá)用戶需求,提供更有針對(duì)性的服務(wù)。

一個(gè)圍繞AI家庭醫(yī)生的醫(yī)療健康新生態(tài),正在長(zhǎng)出來。

醫(yī)療從來都不是一個(gè)只屬于醫(yī)院的事情。

它發(fā)生在凌晨三點(diǎn)的焦慮里,發(fā)生在家庭群里那句“醫(yī)生到底怎么說”里,也發(fā)生在很多人看不懂檢查單、卻只能默默回家的路上。

過去這些時(shí)刻,大多數(shù)人只能靠自己。

但如果它真的能讓更多人少一點(diǎn)慌張、少一點(diǎn)信息鴻溝、少走一點(diǎn)彎路,甚至只是讓異地生活的子女,對(duì)父母的身體狀況多一點(diǎn)安心……這件事本身,已經(jīng)很重要了。

M4是大腦,百小醫(yī)是身體。

前者證明通用大模型能在最難的醫(yī)療場(chǎng)景里完成專業(yè)推理、循證和長(zhǎng)期記憶。

后者,把這種能力送到家庭、微信群和每一次真實(shí)的健康決策里。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
4比0!3比0!U23國(guó)足兩連勝,安東尼奧循序漸進(jìn),一利好值得點(diǎn)贊

4比0!3比0!U23國(guó)足兩連勝,安東尼奧循序漸進(jìn),一利好值得點(diǎn)贊

王大發(fā)不懂球
2026-06-17 22:01:32
省長(zhǎng)低調(diào)去行政大廳辦事,被窗口人員呵斥:沒號(hào)就滾,誰都得排隊(duì)

省長(zhǎng)低調(diào)去行政大廳辦事,被窗口人員呵斥:沒號(hào)就滾,誰都得排隊(duì)

紅豆講堂
2026-02-26 13:20:04
100多位情婦,包養(yǎng)費(fèi)上億元,曾9女同床卻淪落凄涼下場(chǎng)、人財(cái)兩空

100多位情婦,包養(yǎng)費(fèi)上億元,曾9女同床卻淪落凄涼下場(chǎng)、人財(cái)兩空

傲傲講歷史
2026-06-11 16:24:18
A股走出2個(gè)7倍股,9個(gè)5倍股,牛股都是這5個(gè)題材

A股走出2個(gè)7倍股,9個(gè)5倍股,牛股都是這5個(gè)題材

鵬哥投研
2026-06-18 11:27:44
意難平!20 位一輩子沒踢過世界杯的足壇傳奇,第一無人不服!

意難平!20 位一輩子沒踢過世界杯的足壇傳奇,第一無人不服!

瀾歸序
2026-06-06 04:30:06
4套房全給兒子,拎包去女兒家住,女兒堵門塞回機(jī)票:我們下周走

4套房全給兒子,拎包去女兒家住,女兒堵門塞回機(jī)票:我們下周走

墨染塵香
2026-06-16 09:15:36
國(guó)家發(fā)改委:第三批625億元國(guó)補(bǔ)6月底前下達(dá)

國(guó)家發(fā)改委:第三批625億元國(guó)補(bǔ)6月底前下達(dá)

澎湃新聞
2026-06-18 11:15:09
破案!之前大放異彩的王奧芊為何只得2分?賽后原因曝光球迷心痛

破案!之前大放異彩的王奧芊為何只得2分?賽后原因曝光球迷心痛

南海浪花
2026-06-18 06:19:30
醒醒吧:吹捧君王制,是跪在奴隸社會(huì)的廢墟上舔骨頭

醒醒吧:吹捧君王制,是跪在奴隸社會(huì)的廢墟上舔骨頭

浪子說
2026-06-09 10:57:05
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
美國(guó)知名演員黛維·切斯去世 曾出演午夜兇鈴

美國(guó)知名演員黛維·切斯去世 曾出演午夜兇鈴

陳意小可愛
2026-06-18 14:04:35
王毅離開48小時(shí),蒙古國(guó)突然行動(dòng)!暗號(hào)直指東京,背后大有文章

王毅離開48小時(shí),蒙古國(guó)突然行動(dòng)!暗號(hào)直指東京,背后大有文章

清歡百味
2026-06-18 14:42:42
6月19日世界杯看點(diǎn):死亡B組大混戰(zhàn),韓國(guó)贏球?qū)⒊?8隊(duì)出線第1隊(duì)

6月19日世界杯看點(diǎn):死亡B組大混戰(zhàn),韓國(guó)贏球?qū)⒊?8隊(duì)出線第1隊(duì)

新殺豬的秀才
2026-06-18 16:40:11
凱爾特人渴望拿下字母哥!布朗交易立場(chǎng)曝光:根本不想去雄鹿打球

凱爾特人渴望拿下字母哥!布朗交易立場(chǎng)曝光:根本不想去雄鹿打球

羅說NBA
2026-06-18 05:48:17
明日端午是“惡日”,今年端午牢記3個(gè)忌諱:1不掛、2不躺、3不吃

明日端午是“惡日”,今年端午牢記3個(gè)忌諱:1不掛、2不躺、3不吃

阿天愛旅行
2026-06-18 20:17:56
快生了沒人管,鞋里都是老鼠!六胎寶媽引關(guān)注,經(jīng)歷曝光被罵活該

快生了沒人管,鞋里都是老鼠!六胎寶媽引關(guān)注,經(jīng)歷曝光被罵活該

林林先生
2026-06-18 11:05:03
向太承認(rèn)自己六親緣淺,但她對(duì)向佑越狠,才是對(duì)兒子更好的保護(hù)!

向太承認(rèn)自己六親緣淺,但她對(duì)向佑越狠,才是對(duì)兒子更好的保護(hù)!

五四觀娛
2026-06-18 13:30:22
CCTV5直播,中國(guó)男籃VS荷蘭男籃,5大核心主力缺陣,球迷炸鍋了!

CCTV5直播,中國(guó)男籃VS荷蘭男籃,5大核心主力缺陣,球迷炸鍋了!

體壇小快靈
2026-06-18 12:24:11
離婚8年,王小海做夢(mèng)也想不到,如今前妻王小瑋已經(jīng)混得風(fēng)生水起

離婚8年,王小海做夢(mèng)也想不到,如今前妻王小瑋已經(jīng)混得風(fēng)生水起

阿傖說事
2026-05-23 15:04:43
十幾年的無邪氣被查了!但人家純?yōu)閻郯l(fā)電,直接被不立案釋放

十幾年的無邪氣被查了!但人家純?yōu)閻郯l(fā)電,直接被不立案釋放

戒戒說游戲
2026-06-17 08:09:58
2026-06-18 21:31:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12816文章數(shù) 176499關(guān)注度
往期回顧 全部

科技要聞

庫克承認(rèn)扛不住了,蘋果漲價(jià)“不可避免”

頭條要聞

男子連續(xù)140天高強(qiáng)度工作后猝死 公司:周末不算工傷

頭條要聞

男子連續(xù)140天高強(qiáng)度工作后猝死 公司:周末不算工傷

體育要聞

英格蘭4比2克羅地亞:本屆迄今,最佳比賽

娛樂要聞

39歲梅西不愧是人生贏家!

財(cái)經(jīng)要聞

博??礗PO,賺錢業(yè)務(wù)與資本敘事是兩門生意

汽車要聞

驚出冷汗!重慶實(shí)測(cè)奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

家居
數(shù)碼
親子
公開課
軍事航空

家居要聞

綠意盎然 自然之境

數(shù)碼要聞

七彩虹確認(rèn)參展BW2026:主題區(qū)亮點(diǎn)曝光

親子要聞

廣東成功舉辦“南粵家政”嬰幼兒照護(hù)從業(yè)人員培訓(xùn)班

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗外交部:美伊已簽署諒解備忘錄

無障礙瀏覽 進(jìn)入關(guān)懷版