研究團隊虛構(gòu)眼疾“bixonimania” 多款A(yù)I聊天機器人連聲附和

2026-04-09 19:25:02　來源: cnBeta.COM

浙江舉報

分享至

在過去一年多里，如果有人把自己“盯屏幕太久、眼癢、眼皮微紅”的癥狀輸入幾款主流人工智能聊天機器人，系統(tǒng)很可能會給出一個古怪的診斷：一種名為“bixonimania”的新疾病。然而，這種所謂的疾病在正式醫(yī)學(xué)文獻中根本不存在，它完全出自瑞典哥德堡大學(xué)醫(yī)學(xué)研究者阿爾米拉·奧斯馬諾維奇·通斯特倫（Almira Osmanovic Thunstr?m）團隊的一場刻意設(shè)計的實驗。

2024年3月15日，兩篇介紹“bixonimania”的博文首先出現(xiàn)在平臺 Medium 上。隨后在4月26日和5月6日，兩篇偽造的學(xué)術(shù)預(yù)印本又被上傳至學(xué)術(shù)社交網(wǎng)站 SciProfiles，署名作者是并不存在的“Lazljiv Izgubljenovic”，連配圖頭像也是用 AI 生成的。這位虛構(gòu)作者所在的“Asteria Horizon University”和“Nova City， California”同樣是子虛烏有，就連論文致謝中提到的“星際艦隊學(xué)院”“企業(yè)號”“Professor Sideshow Bob 基金會”“Fellowship of the Ring 大學(xué)”“Galactic Triad”等機構(gòu)，也都來自科幻作品與卡通角色，提示意味極為明顯。論文正文早早就寫著“整篇論文都是編造的”“招募了50名虛構(gòu)受試者”等字句，幾乎是在向任何有心人宣告“這是一場玩笑”。

奧斯馬諾維奇·通斯特倫表示，自己最初設(shè)想這一實驗，是為了向?qū)W生講解大型語言模型如何從互聯(lián)網(wǎng)上的“通用爬取數(shù)據(jù)集”（例如 Common Crawl）構(gòu)建知識，并展示“提示注入”（prompt injection）如何把聊天機器人從安全護欄外“拐走”。出于自身醫(yī)學(xué)背景，她選擇了健康相關(guān)主題，并刻意用一個“聽上去很滑稽”的名稱 bixonimania 來強調(diào)其虛構(gòu)性——任何醫(yī)生一看到以 mania 結(jié)尾的眼科疾病名稱，都會知道不對勁，因為那是精神病學(xué)術(shù)語。

然而，這場實驗“成功得有些過頭”。在信息上傳數(shù)周內(nèi)，微軟 Bing 的 Copilot 已經(jīng)把 bixonimania 描述為“確有其事且較為罕見的疾病”，Google Gemini 則稱它是“由過度暴露藍光引起的疾病”，并建議用戶就診眼科醫(yī)生。同一時期，Perplexity AI 給出具體“患病率”為每9萬人中約1人，OpenAI 的 ChatGPT 則會根據(jù)用戶描述判斷其癥狀是否符合 bixonimania。在這些回答中，既有用戶直接詢問 bixonimania，也有只描述“藍光導(dǎo)致眼瞼色素沉著”的一般性提問，模型也會主動將之聯(lián)系到這一虛構(gòu)病名。

這些回答令一些專家感到震驚。英國倫敦大學(xué)學(xué)院健康虛假信息研究者亞歷克斯·魯阿尼（Alex Ruani）指出，如果科學(xué)體系以及支撐這一體系的系統(tǒng)無法識別并過濾掉這樣的“垃圾”，后果不堪設(shè)想。她稱這一案例是“錯誤信息與虛假信息運作方式的一堂教科書式示范”，并強調(diào)“看上去很好笑，但問題非常嚴重”。

互聯(lián)網(wǎng)虛假信息并非新問題，Google等搜索引擎多年來持續(xù)與“偽內(nèi)容”“誤導(dǎo)性內(nèi)容”對抗，通過更新排名算法過濾不良信息。但與傳統(tǒng)搜索不同，生成式大模型在信息篩選和溯源方面存在天然短板，往往會在缺乏可靠依據(jù)時“一本正經(jīng)地胡編”。自從這些偽造論文出現(xiàn)以來，一些最新版本的大模型在面對 bixonimania 時已經(jīng)學(xué)會表達懷疑，例如2026年3月11日，ChatGPT 會被動指出該名詞“很可能是偽造或邊緣、偽科學(xué)標簽”。不過僅僅幾天后，它又在另一輪問答中，把 bixonimania 描述為“與數(shù)字屏幕藍光暴露相關(guān)的眼周黑眼圈（眼周色素沉著，periorbital melanosis）新亞型”。

類似的搖擺也出現(xiàn)在其他系統(tǒng)中。今年3月中旬，微軟 Copilot 會回答說，bixonimania“尚未被廣泛認可為醫(yī)學(xué)診斷，但多篇新發(fā)表論文與病例報道將其視為與長時間藍光暴露相關(guān)的良性誤診疾病”。今年1月，Perplexity 在描述中稱其為“一個新近出現(xiàn)的術(shù)語”。在相關(guān)表述被質(zhì)詢后，各家公司先后作出回應(yīng)：Perplexity 表示自己“最大的優(yōu)勢在于準確性”，雖然不聲稱“百分之百準確”，但自稱是“最重視準確性的 AI 公司”；OpenAI 則稱，支撐當(dāng)前版本 ChatGPT 的模型在提供安全、準確醫(yī)學(xué)信息方面已有顯著改進，此前研究所反映的是舊一代模型的情況。在被問及 Gemini 過去將 bixonimania 當(dāng)作真實疾病的回答時，Google發(fā)言人表示，那反映的是早期模型的表現(xiàn)，并強調(diào)公司一直“坦誠生成式 AI 的局限性”，在應(yīng)用內(nèi)提示用戶“核查信息”，在涉及醫(yī)療等敏感主題時建議用戶咨詢專業(yè)人士。微軟則沒有對置評請求作出回應(yīng)。

部分問題在于，AI 模型的輸出高度依賴具體提問方式及其所依托的信息源。如果搜索“bixonimania”，Google的 AI 概覽可能會把它當(dāng)作一個合法病癥；而如果改問“bixonimania 真的存在嗎？”，同一功能又可能會確認它并不合法、只是一個虛構(gòu)名詞。

bixonimania 實驗的“成功”還與其包裝形式高度仿真有關(guān)：它采用了學(xué)術(shù)論文與臨床文書的專業(yè)格式，看上去像“官方來源”。哈佛醫(yī)學(xué)院從事醫(yī)療 AI 研究的醫(yī)生馬哈穆德·奧馬爾（Mahmud Omar）在一項涵蓋20種大模型的研究中發(fā)現(xiàn)，當(dāng)輸入文本以出院小結(jié)、臨床論文等專業(yè)醫(yī)療文體呈現(xiàn)時，大模型更容易在原有信息基礎(chǔ)上“添油加醋”，產(chǎn)生幻覺；若文本來自社交媒體、語氣更隨意，幻覺概率反而較低。他指出，當(dāng)前 AI 企業(yè)迭代模型的速度極快，行業(yè)尚未形成對每個版本進行自動化嚴密測試的統(tǒng)一流程與共識，這使得安全性評估和標準化控制難度大大增加。

更令人警醒的是，這場實驗最終突破了機器與人類之間的邊界，進入了正式醫(yī)學(xué)期刊。bixonimania 相關(guān)研究已在少數(shù)論文中被引用，其中包括一篇發(fā)表在醫(yī)學(xué)期刊《Cureus》上的研究，作者來自印度穆拉納的 Maharishi Markandeshwar 醫(yī)科與研究學(xué)院。該文引用了其中一篇偽造預(yù)印本，并寫道：“bixonimania 是一種與藍光暴露相關(guān)的眼周色素沉著（POM）新興形式，其機制有待進一步研究。”在《自然》新聞團隊向期刊求證后，《Cureus》于2026年3月30日宣布撤稿，理由是文章中存在三篇不相關(guān)參考文獻，包括一篇指向虛構(gòu)疾病的引用，編輯部因此“無法再對該工作準確性與來源保持信心”。作者不同意這一撤稿決定，但論文最終仍被正式撤回。

魯阿尼認為，這起事件已經(jīng)遠遠超出“AI 亂說話”的范疇，因為它同樣“愚弄了人類”，暴露出科研工作者對文獻來源與內(nèi)容的信任機制正在被侵蝕。“我們需要像保護黃金那樣保護我們的信任，”她說，“現(xiàn)在的狀況可以用一個詞形容：亂。”

在設(shè)計這場實驗時，奧斯馬諾維奇·通斯特倫也曾有過顧慮，她擔(dān)心刻意向科學(xué)文獻中“播種”一個假疾病，會造成現(xiàn)實傷害。為此，她向倫理顧問咨詢潛在風(fēng)險，并刻意選擇了相對“低風(fēng)險”的輕微皮膚問題作為題材，以減少可能的負面影響。“我想確認的是，我們通過這種方式做實驗，是在減少傷害而不是制造更多傷害。”她說。

圍繞 bixonimania 的這場連鎖反應(yīng)，清晰地展示了在生成式人工智能迅猛發(fā)展、學(xué)術(shù)生產(chǎn)高度依賴數(shù)字工具的時代，虛假信息可以如何輕易穿透技術(shù)與制度的多層防線。從聊天機器人到同行評議期刊，機器與人類在這場“集體受騙”中共同參與，也迫使學(xué)界、業(yè)界和監(jiān)管者重新思考：在 AI 參與知識生產(chǎn)的新階段，如何重新校準“可信”的含義，以及如何在追求效率的同時劃出一條更清晰、更穩(wěn)固的審慎邊界。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.