【哈佛最新研究::用 AI大型語(yǔ)言模型看病 80%的初步診斷都是錯(cuò)的】財(cái)聯(lián)社4月15日電,美國(guó)哈佛醫(yī)學(xué)院的一個(gè)研究團(tuán)隊(duì)評(píng)估了20幾種最先進(jìn)的AI大型語(yǔ)言模型(LLM)的診斷能力,其中包括ChatGPT、DeepSeek、Gemini和Claude。結(jié)果顯示,基于患者的初步癥狀和體征進(jìn)行“鑒別診斷”(識(shí)別可能的疾病)的錯(cuò)誤率高達(dá)80%。這項(xiàng)研究進(jìn)一步顯示,在患者提供更多檢測(cè)結(jié)果后,大模型可以將“最終診斷”的失敗率降至40%左右。研究人員表示,這意味著AI聊天機(jī)器人需要通過(guò)充分的患者信息,才能對(duì)疾病作出更為精準(zhǔn)的診斷,患者無(wú)法提供完整的健康檢測(cè)信息時(shí),AI提供的結(jié)果并不可靠。研究人員還強(qiáng)調(diào):“人工智能尚未達(dá)到無(wú)需醫(yī)療專業(yè)人員干預(yù)即可為患者做出診斷決策的水平。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.