凌晨1點(diǎn),某三甲醫(yī)院急診科,一位62歲的男性被緊急送入,他正經(jīng)歷急性 STEMI 并發(fā)急性心衰。血壓飆至 185/105 mmHg,血氧僅 91%。護(hù)士已推來(lái)除顫儀,催促醫(yī)生「心電捕手」確認(rèn)替格瑞洛劑量。
患者腎功能受損,標(biāo)準(zhǔn)劑量極易引發(fā)致命腦出血,而減量又擔(dān)心支架再被血栓堵塞。在浩瀚的指南與文獻(xiàn)中尋找劑量調(diào)整條款,醫(yī)生只有短短3分鐘——對(duì)他而言,這三分鐘漫長(zhǎng)得仿佛一個(gè)世紀(jì)。
深夜,珠江醫(yī)院胸外科主任喬貴賓仍伏案辦公,為一位罕見(jiàn)肺病患者設(shè)計(jì)后續(xù)方案。對(duì)身兼胸外科主任、主任醫(yī)師和博導(dǎo)的他來(lái)說(shuō),每天平均工作超過(guò)10 小時(shí),加班處理疑難病例幾乎成為常態(tài)。
「沒(méi)有哪個(gè)國(guó)家的醫(yī)生承受這樣的超級(jí)壓力。」紀(jì)錄片《中國(guó)醫(yī)生》總導(dǎo)演在專(zhuān)訪中說(shuō)過(guò)的一句話,高度概括了醫(yī)生們的日常工作現(xiàn)實(shí)。
公開(kāi)數(shù)據(jù)顯示,2024年,全國(guó)醫(yī)療衛(wèi)生機(jī)構(gòu)總診療人次達(dá)到101.5 億,其中三級(jí)醫(yī)院診療量為 28.7 億,病床使用率接近九成。而全國(guó) 508.2 萬(wàn)執(zhí)業(yè)(助理)醫(yī)師,卻要支撐這百億級(jí)的診療需求。每一次開(kāi)處方、下醫(yī)囑、做檢查、規(guī)劃手術(shù)方案,幾乎都需醫(yī)生決策。
更復(fù)雜的是,醫(yī)學(xué)知識(shí)更新速度很快。以PubMed 為例,已收錄超過(guò) 4000 萬(wàn)條生物醫(yī)學(xué)文獻(xiàn),每年仍新增百萬(wàn)級(jí)條目。對(duì)醫(yī)生而言,壓力不僅來(lái)自患者與診療數(shù)量,更來(lái)自高負(fù)荷工作中不斷追趕最新證據(jù)與指南的挑戰(zhàn)。
在這種結(jié)構(gòu)性困境下,醫(yī)療的核心問(wèn)題并非「撮合就診」,而是醫(yī)生的決策供給——互聯(lián)網(wǎng)醫(yī)療可以提升就診效率,卻觸及不到這一結(jié)構(gòu)性痛點(diǎn)。
而這,正是醫(yī)學(xué)AI 能夠真正放大的空間。
DeepSeek們
為什么一進(jìn)醫(yī)療科研就翻車(chē)?
過(guò)去一年,大模型幾乎席卷了各行各業(yè),醫(yī)療領(lǐng)域也不例外。行業(yè)對(duì)醫(yī)學(xué)AI 的期待迅速升溫,中國(guó)醫(yī)生成為擁抱大模型最為積極的群體之一。
但與此同時(shí),一個(gè)越來(lái)越明顯的困境也擺在了大家面前:一旦通用大模型進(jìn)入嚴(yán)肅醫(yī)學(xué)場(chǎng)景,它的能力往往迅速塌陷。
最讓醫(yī)生頭疼的是「幻覺(jué)」問(wèn)題。比如,它會(huì)虛構(gòu)文獻(xiàn)。當(dāng)你想查看原文、復(fù)核數(shù)據(jù)時(shí),即使明確要求提供準(zhǔn)確的DOI 號(hào)(類(lèi)似文本的身份證號(hào)),也經(jīng)常發(fā)現(xiàn)鏈接是錯(cuò)的,點(diǎn)開(kāi)完全是另一篇文章。
![]()
通用大模型的高幻覺(jué)率,始終是個(gè)棘手的困擾。
喬貴賓和同事都在工作和私底下用過(guò)通用大模型,高幻覺(jué)率始終是個(gè)棘手的困擾。像胸外科這樣極度硬核的診室,一個(gè)杜撰的結(jié)論,危害不亞于誤診。
最近,一項(xiàng)發(fā)表在英國(guó)皇家外科醫(yī)學(xué)院官方期刊上的研究【1】,也進(jìn)一步印證了醫(yī)生們的擔(dān)憂:某些主流人工智能平臺(tái)生成的醫(yī)學(xué)參考文獻(xiàn)中,超過(guò)三分之一可能是偽造的。例如,Grok3的引用幻覺(jué)率高達(dá) 33.6%,DeepSeek DeepThink 為 25%。
這些「幻覺(jué)引用」看起來(lái)非常真實(shí),甚至帶有虛構(gòu)的Mayo Clinic (梅奧診所)鏈接或極具誤導(dǎo)性的學(xué)術(shù)標(biāo)題。
研究還發(fā)現(xiàn),近半數(shù)頂尖模型在回答醫(yī)學(xué)問(wèn)題時(shí),默認(rèn)并不會(huì)清晰披露信息來(lái)源。
而這些,恰恰與醫(yī)生日常工作的核心相悖:循證(基于證據(jù)做決策)——我如何知道我的推理和決策是有理可據(jù)的,是權(quán)威的,是準(zhǔn)確的?尤其是那些涉及到我知識(shí)盲區(qū)的證據(jù)。
這時(shí)候,能快速、準(zhǔn)確地找到權(quán)威依據(jù)來(lái)支撐判斷,最剛需、也最頭疼的事。而本質(zhì)上基于概率文本生成的通用大模型,并不天然具備這種場(chǎng)景下的「循證」能力。
從多個(gè)維度測(cè)試國(guó)內(nèi)某頭部通用大模型在回答醫(yī)學(xué)科研問(wèn)題時(shí)是否可靠,結(jié)果讓人擔(dān)憂。
為了解決這一難題,業(yè)界普遍將檢索增強(qiáng)生成(RAG)奉為圭臬,認(rèn)為它能通過(guò)檢索外部患者病歷來(lái)糾正大模型的信口雌黃。
最常采用的方案就是將病歷、指南、論文切片后灌進(jìn)向量數(shù)據(jù)庫(kù),再通過(guò)檢索增強(qiáng)生成,讓模型「帶著資料回答」。
至于效果?最新研究給出了一個(gè)相當(dāng)反直覺(jué)的結(jié)論。
這份發(fā)表于權(quán)威醫(yī)學(xué)預(yù)印本平臺(tái)medRxiv 的論文顯示,在醫(yī)學(xué)臨床文本生成中,加入 RAG 技術(shù)后,大模型的無(wú)依據(jù)聲明率(Unsupported claim rate,即幻覺(jué)率)從基線狀態(tài)下的 5.0% 劇烈飆升至 43.6%。
這意味著 RAG 讓醫(yī)學(xué) AI 犯下事實(shí)性錯(cuò)誤的概率增加了整整 8.7 倍。【2】
為什么會(huì)這樣?因?yàn)榕R床文本并不是普通知識(shí)庫(kù)。
它高度非結(jié)構(gòu)化,充滿上下文依賴(lài)、時(shí)間敏感信息和相互沖突的證據(jù)。不同患者、不同時(shí)間點(diǎn)的醫(yī)學(xué)術(shù)語(yǔ)重疊度極高。
RAG很容易檢索出「語(yǔ)義上高度相似,但實(shí)際上屬于其他患者,或?qū)?yīng)錯(cuò)誤時(shí)間點(diǎn)」的病歷片段。
也就是說(shuō),它找到了「看起來(lái)相關(guān)」的資料,卻未必找到了「真正適用」的證據(jù),而大模型會(huì)以此為據(jù)、憑空捏造當(dāng)前病人的虛假醫(yī)學(xué)敘事。
如何確保模型找到的是對(duì)的證據(jù)、用的是對(duì)的上下文、給出的是能被醫(yī)生復(fù)核的判斷?如何讓每一次回答都綁定在可信證據(jù)鏈上?
這正是深耕醫(yī)學(xué)健康十多年的阿里健康,想要破局的地方。
一切為了可靠
「氫離子」破局關(guān)鍵一環(huán)
5月 13 日,阿里健康把「氫離子」正式推到了臺(tái)前。這是一款面向臨床和科研醫(yī)生的醫(yī)學(xué)AI 產(chǎn)品。
發(fā)布會(huì)上,阿里健康同時(shí)宣布,氫離子與國(guó)家級(jí)醫(yī)學(xué)頂刊達(dá)成獨(dú)家內(nèi)容合作。
![]()
產(chǎn)品設(shè)計(jì)上,AI被放在了最后,而定語(yǔ)首先是證據(jù)、循證。
![]()
氫離子與國(guó)家級(jí)醫(yī)學(xué)頂刊達(dá)成獨(dú)家內(nèi)容合作。
按照官方定位,「氫離子」想解決的是「中國(guó)500 萬(wàn)醫(yī)生的一切醫(yī)學(xué)問(wèn)題」。「低幻覺(jué)、高循證」是它最核心的能力標(biāo)簽:所有回答均提供權(quán)威出處,支持一鍵溯源、直達(dá)信源。
![]()
「在嚴(yán)重幻覺(jué)率上,我可以給大家一個(gè)定性的結(jié)論,我們比國(guó)內(nèi)的競(jìng)品領(lǐng)先2-3倍。」阿里健康CTO 祥志說(shuō)。
![]()
這很容易讓人聯(lián)想到醫(yī)學(xué)界的「神器」UpToDate,也就是UTD。很多醫(yī)生在查房、開(kāi)藥、處理疑難病例或準(zhǔn)備科研資料時(shí),都會(huì)依賴(lài) UTD 這類(lèi)循證醫(yī)學(xué)決策支持系統(tǒng),快速找到權(quán)威、可靠的決策依據(jù)。
但與傳統(tǒng)工具相比,「氫離子」使用門(mén)檻要低得多。醫(yī)生可以通過(guò)自然語(yǔ)言、多輪對(duì)話,甚至語(yǔ)音和圖片等多模態(tài)方式提問(wèn),就像和同事討論病例一樣,把問(wèn)題直接拋給AI,它會(huì)結(jié)合上下文持續(xù)理解和回應(yīng)。
在正式發(fā)布前,氫離子已完成內(nèi)測(cè)并開(kāi)放下載。醫(yī)生的反饋?zhàn)罴械年P(guān)鍵詞是「可信」和「可靠」,尤其是對(duì)「循證問(wèn)答」評(píng)價(jià)極高。一位三甲急診科主任醫(yī)師試用后,在88 天內(nèi)登錄已高達(dá) 193 次。
為了確認(rèn)替格瑞洛劑量,急診室醫(yī)生「心電捕手」打開(kāi)「氫離子」,飛快輸入「急性ST 段抬高型心梗合并急性心衰,PCI 術(shù)后替格瑞洛劑量調(diào)整(eGFR65)」。
![]()
「心電捕手」在某醫(yī)療社區(qū)的發(fā)言。
AI不僅明確推薦負(fù)荷劑量 180mg,維持劑量 90mg bid,還加粗標(biāo)注了依據(jù)來(lái)源——中華醫(yī)學(xué)會(huì) 2025 年最新治療指南。點(diǎn)擊后,可以直接查看電子化指南原文,不再需要翻找笨重的 PDF 文件。
更關(guān)鍵的是,「氫離子」不是簡(jiǎn)單高亮一整段文本,而是定位到真正決定結(jié)論的「關(guān)鍵三行」。醫(yī)生看到的不只是「這篇文章可能相關(guān)」,而是「依據(jù)具體在哪里」。
與此同時(shí),回答還引入了兩個(gè)更重要的維度:時(shí)效性(「2025年」)和權(quán)威性(「中華醫(yī)學(xué)會(huì)的指南」),強(qiáng)調(diào)對(duì)全球權(quán)威指南和文獻(xiàn)進(jìn)行日更級(jí)追蹤與篩選,并基于這些動(dòng)態(tài)證據(jù)生成回答。
這背后,考慮到是一個(gè)基本現(xiàn)實(shí):醫(yī)學(xué)證據(jù)每天都在變化。
新指南、新藥物、新療法、新臨床試驗(yàn)層出不窮,尤其是在腫瘤、感染、心血管等領(lǐng)域,頂刊上的一個(gè)新結(jié)果,可能直接改變第二天的治療策略。一旦證據(jù)沒(méi)跟上影響判斷,代價(jià)可能是患者動(dòng)了沒(méi)必要的刀子,或錯(cuò)過(guò)最佳手術(shù)時(shí)機(jī)。
為了杜絕低質(zhì)信源的「污染」,模型在生成答案時(shí)會(huì)優(yōu)先「定位」權(quán)威等級(jí)更高來(lái)源,自動(dòng)降權(quán)低質(zhì)量個(gè)案報(bào)道。
某種程度上,這些也構(gòu)成了「氫離子」與傳統(tǒng)醫(yī)學(xué)搜索工具、乃至其他「AI醫(yī)生」產(chǎn)品之間最大的區(qū)別——醫(yī)生看到的每一個(gè)觀點(diǎn),都經(jīng)得起三個(gè)問(wèn)題的追問(wèn):精準(zhǔn)嗎?權(quán)威嗎?夠新嗎?
但在臨床現(xiàn)場(chǎng),可信之外,醫(yī)生還需要它足夠快。
「心電捕手」提到,確認(rèn)替格瑞洛劑量時(shí),「沒(méi)想到3 秒就出了結(jié)果」。過(guò)去遇到類(lèi)似疑難問(wèn)題,往往需要在 PubMed、指南、藥品說(shuō)明書(shū)等多個(gè)平臺(tái)之間來(lái)回切換,整個(gè)過(guò)程可能耗費(fèi)十幾甚至二十分鐘。
很多醫(yī)生手機(jī)里常年裝著5~6 個(gè)醫(yī)學(xué) App,因?yàn)樗鼈兇蠖嘀皇菃吸c(diǎn)工具。
而「氫離子」試圖把這些「搬運(yùn)成本」壓縮成一次提問(wèn):快速給出有依據(jù)的用藥方案和劑量建議,同時(shí)聯(lián)動(dòng)藥品說(shuō)明書(shū),標(biāo)注禁忌癥與注意事項(xiàng)。
![]()
醫(yī)生「心電捕手」在醫(yī)療社區(qū)中指出,AI返回的結(jié)果還聯(lián)動(dòng)了相關(guān)藥品說(shuō)明書(shū),標(biāo)注了用藥禁忌和注意事項(xiàng),比急診室醫(yī)生之前同時(shí)翻指南和說(shuō)明書(shū)高效太多。
對(duì)醫(yī)生而言,這不只是「少打開(kāi)幾個(gè)頁(yè)面」,而是在爭(zhēng)分奪秒的臨床環(huán)境里,縮短關(guān)鍵決策時(shí)間。
把「醫(yī)學(xué)證據(jù)」寫(xiě)進(jìn)AI
四層循證架構(gòu)首次揭曉
在發(fā)布會(huì)上,團(tuán)隊(duì)首次披露了「低幻覺(jué)、高循證」背后的「四層循證架構(gòu)」——從醫(yī)學(xué)證據(jù)結(jié)構(gòu)化、循證檢索、模型對(duì)齊,到專(zhuān)家閉環(huán)反饋,試圖把「循證醫(yī)學(xué)」真正寫(xiě)進(jìn)AI 的底層邏輯。
![]()
第一層:充分理解醫(yī)學(xué)證據(jù)。
不是直接「讀文字」,而是把醫(yī)學(xué)文本轉(zhuǎn)化為可結(jié)構(gòu)化、可評(píng)估、可追溯的證據(jù)單元。
這里最核心的是PICO 與 GRADE 兩套經(jīng)典循證框架。
PICO本質(zhì)上是一套醫(yī)學(xué)問(wèn)題結(jié)構(gòu),它要求 AI 像臨床醫(yī)生一樣,拆解文本的核心要素:針對(duì)什么人群(P)?采用何種干預(yù)(I)?與什么方案對(duì)照(C)?最終結(jié)果如何(O)?
例如,針對(duì)一項(xiàng)減肥藥研究,自動(dòng)生成精確的證據(jù)鏈:
18~50歲、體重超過(guò) 200 斤、無(wú)嚴(yán)重心臟病的成年人; 每天服用一種新型減肥藥 A; 另一組服用外觀相同的安慰劑; 三個(gè)月后,A 組平均減重 10 斤,對(duì)照組僅減重 2 斤。
這樣的解讀不僅解決語(yǔ)義匹配問(wèn)題,更強(qiáng)調(diào)「證據(jù)適配」——只有PICO條件完全匹配,后續(xù)建議才有臨床價(jià)值。
GRADE則為這些證據(jù)貼上「可信度」的等級(jí)標(biāo)簽。
在循證醫(yī)學(xué)中,文獻(xiàn)的含金量千差萬(wàn)別。所謂值不值得信?不是「我覺(jué)得」,而是基于一套可量化的評(píng)價(jià)體系。GRADE 是全球循證醫(yī)學(xué)最核心的證據(jù)評(píng)級(jí)體系之一,目前已被 World Health Organization 等全球 100 多家權(quán)威醫(yī)學(xué)機(jī)構(gòu)廣泛采用。
根據(jù)這一標(biāo)準(zhǔn),大型隨機(jī)對(duì)照試驗(yàn)(RCT)通常屬于高等級(jí)證據(jù);Meta-analysis往往擁有更強(qiáng)的綜合可信度;個(gè)案觀察、經(jīng)驗(yàn)分享,則屬于較低等級(jí)證據(jù)。
![]()
針對(duì)「鉑耐藥復(fù)發(fā)卵巢癌」的最新文獻(xiàn)檢索結(jié)果。文獻(xiàn)按時(shí)效性(2025年)、權(quán)威性(高影響因子 TOP 期刊)及證據(jù)等級(jí)(RCT、臨床研究)呈現(xiàn), 甚至列出了JCR分區(qū)、中科院分區(qū)及IF分值,可以一眼看到文獻(xiàn)的質(zhì)量和參考價(jià)值。來(lái)源:王偉強(qiáng)博士公眾號(hào)文章。
第二層:將PICO 注入 RAG,從「關(guān)鍵詞檢索」走向「結(jié)構(gòu)化降維」。
基于PICO 框架,檢索邏輯從「搜詞」升級(jí)為「搜結(jié)構(gòu)」,徹底解決了傳統(tǒng) RAG 檢索容易失效的問(wèn)題。
例如,「布洛芬能不能比對(duì)乙酰氨基酚更快讓兒童退燒?」通過(guò)PICO 拆解后,系統(tǒng)不會(huì)簡(jiǎn)單搜「布洛芬 退燒 兒童」,而是自動(dòng)轉(zhuǎn)化為標(biāo)準(zhǔn)循證問(wèn)題——「在發(fā)熱兒童(P)中,布洛芬(I)相較于對(duì)乙酰氨基酚(C),在退熱速度和副作用(O)上有何臨床證據(jù)?」
這樣檢索出來(lái)的文獻(xiàn),更像是在回答一個(gè)臨床問(wèn)題,而不是湊關(guān)鍵詞。反過(guò)來(lái)說(shuō),RAG也只有在文檔結(jié)構(gòu)化程度高、檢索邏輯符合循證范式時(shí)才更可靠。
有了證據(jù)理解和精準(zhǔn)檢索,問(wèn)題來(lái)了:AI會(huì)正確使用證據(jù)嗎?
第三層:強(qiáng)化與對(duì)齊,規(guī)訓(xùn)模型「像醫(yī)生一樣使用證據(jù)」。
氫離子在后訓(xùn)練階段加入了Reward 模型與 Rubrics 評(píng)分體系。Reward 模型負(fù)責(zé)讓 AI 學(xué)會(huì)「什么是好答案」,而 Rubrics 則把循證醫(yī)學(xué)中的質(zhì)量要求,進(jìn)一步工程化成可訓(xùn)練、可評(píng)測(cè)的標(biāo)準(zhǔn)。
模型最終學(xué)習(xí)的,不再只是語(yǔ)言風(fēng)格,而是如何生成低幻覺(jué)、可追溯、符合循證規(guī)范的回答。
然而,在瞬息萬(wàn)變的醫(yī)學(xué)領(lǐng)域,單純依賴(lài)靜態(tài)的模型訓(xùn)練無(wú)法消除所有長(zhǎng)尾邊緣案例,也無(wú)法實(shí)時(shí)同步最新的指南、藥物與療法。因此,架構(gòu)的最后一環(huán)交給了Experts-in-the-Loop(專(zhuān)家閉環(huán)反饋)。
真正有價(jià)值的數(shù)據(jù),需要長(zhǎng)期專(zhuān)家標(biāo)注,需要持續(xù)更新,需要明確證據(jù)等級(jí),還需要知道不同研究之間的關(guān)系與沖突。
![]()
目前氫離子構(gòu)建了由超過(guò)300 位資深醫(yī)生組成的醫(yī)學(xué) AI 專(zhuān)家委員會(huì)。他們扮演著「主治醫(yī)生」與「首席出題官」的角色,持續(xù)對(duì) AI 的輸出進(jìn)行高強(qiáng)度的「找茬、打分與修正」。
專(zhuān)家的評(píng)測(cè)不是為了得出一個(gè)安全分?jǐn)?shù),而是為了反哺前三層。例如:發(fā)現(xiàn)某處回答不佳,立刻倒推是不是第一層的PICO 拆解粒度不夠細(xì)?或是第三層的 Rubrics 評(píng)分標(biāo)準(zhǔn)過(guò)于寬松?
最終,通過(guò)這四層由淺入深的循證架構(gòu),理解、檢索、訓(xùn)練與評(píng)測(cè)形成了一個(gè)完美的「可追溯、可驗(yàn)證、可信賴(lài)」的閉環(huán)。AI徹底擺脫了「靜態(tài)工具」的局限,演變?yōu)橐粋€(gè)能夠隨著醫(yī)學(xué)證據(jù)實(shí)時(shí)更新、基于臨床反饋不斷自我糾錯(cuò)的「進(jìn)化型系統(tǒng)」。
從一款高效的生產(chǎn)力產(chǎn)品,真正成長(zhǎng)為醫(yī)生在臨床與科研中不可或缺的可信賴(lài)伙伴。
本土權(quán)威+國(guó)際前沿:
數(shù)據(jù)壁壘,夯實(shí)循證底座
要把「高循證」做到極致,光靠算法和工程創(chuàng)新是不夠的,AI最硬的門(mén)檻,其實(shí)在于數(shù)據(jù)源。高質(zhì)量的醫(yī)學(xué)數(shù)據(jù)庫(kù),不只是功能底座,更是臨床安全的護(hù)欄。
![]()
中國(guó)醫(yī)生普遍存在世界頂級(jí)研究獲取困難的問(wèn)題。
此前,氫離子已經(jīng)與中華醫(yī)學(xué)會(huì)、人民衛(wèi)生出版社等國(guó)內(nèi)醫(yī)學(xué)出版巨頭深度合作,奠定了本土權(quán)威基礎(chǔ)。而這次官宣的國(guó)際頂刊合作,意味著76%的醫(yī)生不再受困于頂級(jí)前沿證據(jù)的難以觸達(dá)。
通過(guò)這種「強(qiáng)強(qiáng)聯(lián)合」,氫離子構(gòu)建起多層級(jí)的專(zhuān)業(yè)醫(yī)學(xué)知識(shí)譜系,進(jìn)一步夯實(shí)了在醫(yī)學(xué)AI 領(lǐng)域的底層數(shù)據(jù)壁壘。
目前,氫離子匯聚了來(lái)自PubMed、Google Scholar 等國(guó)際數(shù)據(jù)庫(kù)以及國(guó)內(nèi)核心期刊的千萬(wàn)級(jí)頂尖文獻(xiàn),為科研和疑難病例提供穩(wěn)固支撐。
![]()
同時(shí),系統(tǒng)整合了三萬(wàn)余部國(guó)內(nèi)外權(quán)威臨床指南與專(zhuān)家共識(shí),以中華醫(yī)學(xué)會(huì)等機(jī)構(gòu)發(fā)布內(nèi)容為主,使AI 在復(fù)雜臨床環(huán)境中能夠迅速鎖定標(biāo)準(zhǔn)方案,大幅提升診療效率與安全性。
藥品說(shuō)明書(shū)及活性成分信息超過(guò)六萬(wàn)份,從適應(yīng)癥、禁忌癥、用法用量,到不良反應(yīng)及特殊人群用藥,實(shí)現(xiàn)臨床開(kāi)方與用藥風(fēng)險(xiǎn)的全面掌控。
這些不僅保障了AI在臨床輔助中的極致安全,也讓「氫離子」在醫(yī)學(xué) AI 賽道上形成短期難以逾越的核心競(jìng)爭(zhēng)力。
![]()
過(guò)去兩年,行業(yè)習(xí)慣把醫(yī)學(xué)AI 理解成參數(shù)規(guī)模競(jìng)爭(zhēng)、問(wèn)答能力競(jìng)爭(zhēng)。但真正進(jìn)入臨床與科研場(chǎng)景后,發(fā)現(xiàn)準(zhǔn)確性、可追溯性、穩(wěn)定性與決策一致性,遠(yuǎn)比「會(huì)不會(huì)回答」更重要。
「氫離子」用實(shí)踐證明,嚴(yán)肅醫(yī)學(xué)AI 的真正護(hù)城河不是參數(shù)規(guī)模,而是「從高等級(jí)證據(jù)到臨床答案」的全鏈路工程能力。 缺少了頂級(jí)信源與循證架構(gòu)的嚴(yán)苛規(guī)訓(xùn),再龐大的參數(shù),最終也會(huì)碎成「通用模型+醫(yī)學(xué)語(yǔ)料」的平庸組合。
正如喬貴賓所言:「這才是醫(yī)學(xué)AI該有的樣子。它不替你做判斷,而是幫你更快找到做判斷的依據(jù),并且讓你看清它是從哪兒找來(lái)的。」醫(yī)生不需要一個(gè)擅長(zhǎng)模糊應(yīng)答的「聊天花瓶」,而需要一個(gè)能在臨床與科研中并肩作戰(zhàn)的「硬核戰(zhàn)友」。
當(dāng)繁重的循證檢索被AI 降維打擊,醫(yī)生們偶爾也會(huì)和學(xué)生們聊起,如果所有循證的工作都被 AI 代勞了,醫(yī)生還需要什么?
大家的答案很一致,向本源的回歸——練就臨床判斷力。因?yàn)榍枚ㄗ罱K方案,還要取決于醫(yī)生的綜合評(píng)估。
這也應(yīng)驗(yàn)了那句在圈子里廣為流傳的話:能夠給出治療方案的,叫「智能(Intelligence )」,真正理解眼前的患者,才是「智慧( Wisdom )」
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.