在過去一年多里,如果有人把自己“盯屏幕太久、眼癢、眼皮微紅”的癥狀輸入幾款主流人工智能聊天機器人,系統(tǒng)很可能會給出一個古怪的診斷:一種名為“bixonimania”的新疾病。然而,這種所謂的疾病在正式醫(yī)學(xué)文獻中根本不存在,它完全出自瑞典哥德堡大學(xué)醫(yī)學(xué)研究者阿爾米拉·奧斯馬諾維奇·通斯特倫(Almira Osmanovic Thunstr?m)團隊的一場刻意設(shè)計的實驗。
![]()
2024年3月15日,兩篇介紹“bixonimania”的博文首先出現(xiàn)在平臺 Medium 上。隨后在4月26日和5月6日,兩篇偽造的學(xué)術(shù)預(yù)印本又被上傳至學(xué)術(shù)社交網(wǎng)站 SciProfiles,署名作者是并不存在的“Lazljiv Izgubljenovic”,連配圖頭像也是用 AI 生成的。這位虛構(gòu)作者所在的“Asteria Horizon University”和“Nova City, California”同樣是子虛烏有,就連論文致謝中提到的“星際艦隊學(xué)院”“企業(yè)號”“Professor Sideshow Bob 基金會”“Fellowship of the Ring 大學(xué)”“Galactic Triad”等機構(gòu),也都來自科幻作品與卡通角色,提示意味極為明顯。論文正文早早就寫著“整篇論文都是編造的”“招募了50名虛構(gòu)受試者”等字句,幾乎是在向任何有心人宣告“這是一場玩笑”。
奧斯馬諾維奇·通斯特倫表示,自己最初設(shè)想這一實驗,是為了向?qū)W生講解大型語言模型如何從互聯(lián)網(wǎng)上的“通用爬取數(shù)據(jù)集”(例如 Common Crawl)構(gòu)建知識,并展示“提示注入”(prompt injection)如何把聊天機器人從安全護欄外“拐走”。出于自身醫(yī)學(xué)背景,她選擇了健康相關(guān)主題,并刻意用一個“聽上去很滑稽”的名稱 bixonimania 來強調(diào)其虛構(gòu)性——任何醫(yī)生一看到以 mania 結(jié)尾的眼科疾病名稱,都會知道不對勁,因為那是精神病學(xué)術(shù)語。
然而,這場實驗“成功得有些過頭”。在信息上傳數(shù)周內(nèi),微軟 Bing 的 Copilot 已經(jīng)把 bixonimania 描述為“確有其事且較為罕見的疾病”,Google Gemini 則稱它是“由過度暴露藍光引起的疾病”,并建議用戶就診眼科醫(yī)生。同一時期,Perplexity AI 給出具體“患病率”為每9萬人中約1人,OpenAI 的 ChatGPT 則會根據(jù)用戶描述判斷其癥狀是否符合 bixonimania。在這些回答中,既有用戶直接詢問 bixonimania,也有只描述“藍光導(dǎo)致眼瞼色素沉著”的一般性提問,模型也會主動將之聯(lián)系到這一虛構(gòu)病名。
這些回答令一些專家感到震驚。英國倫敦大學(xué)學(xué)院健康虛假信息研究者亞歷克斯·魯阿尼(Alex Ruani)指出,如果科學(xué)體系以及支撐這一體系的系統(tǒng)無法識別并過濾掉這樣的“垃圾”,后果不堪設(shè)想。她稱這一案例是“錯誤信息與虛假信息運作方式的一堂教科書式示范”,并強調(diào)“看上去很好笑,但問題非常嚴重”。
互聯(lián)網(wǎng)虛假信息并非新問題,Google等搜索引擎多年來持續(xù)與“偽內(nèi)容”“誤導(dǎo)性內(nèi)容”對抗,通過更新排名算法過濾不良信息。但與傳統(tǒng)搜索不同,生成式大模型在信息篩選和溯源方面存在天然短板,往往會在缺乏可靠依據(jù)時“一本正經(jīng)地胡編”。自從這些偽造論文出現(xiàn)以來,一些最新版本的大模型在面對 bixonimania 時已經(jīng)學(xué)會表達懷疑,例如2026年3月11日,ChatGPT 會被動指出該名詞“很可能是偽造或邊緣、偽科學(xué)標簽”。不過僅僅幾天后,它又在另一輪問答中,把 bixonimania 描述為“與數(shù)字屏幕藍光暴露相關(guān)的眼周黑眼圈(眼周色素沉著,periorbital melanosis)新亞型”。
類似的搖擺也出現(xiàn)在其他系統(tǒng)中。今年3月中旬,微軟 Copilot 會回答說,bixonimania“尚未被廣泛認可為醫(yī)學(xué)診斷,但多篇新發(fā)表論文與病例報道將其視為與長時間藍光暴露相關(guān)的良性誤診疾病”。今年1月,Perplexity 在描述中稱其為“一個新近出現(xiàn)的術(shù)語”。在相關(guān)表述被質(zhì)詢后,各家公司先后作出回應(yīng):Perplexity 表示自己“最大的優(yōu)勢在于準確性”,雖然不聲稱“百分之百準確”,但自稱是“最重視準確性的 AI 公司”;OpenAI 則稱,支撐當(dāng)前版本 ChatGPT 的模型在提供安全、準確醫(yī)學(xué)信息方面已有顯著改進,此前研究所反映的是舊一代模型的情況。在被問及 Gemini 過去將 bixonimania 當(dāng)作真實疾病的回答時,Google發(fā)言人表示,那反映的是早期模型的表現(xiàn),并強調(diào)公司一直“坦誠生成式 AI 的局限性”,在應(yīng)用內(nèi)提示用戶“核查信息”,在涉及醫(yī)療等敏感主題時建議用戶咨詢專業(yè)人士。微軟則沒有對置評請求作出回應(yīng)。
部分問題在于,AI 模型的輸出高度依賴具體提問方式及其所依托的信息源。如果搜索“bixonimania”,Google的 AI 概覽可能會把它當(dāng)作一個合法病癥;而如果改問“bixonimania 真的存在嗎?”,同一功能又可能會確認它并不合法、只是一個虛構(gòu)名詞。
bixonimania 實驗的“成功”還與其包裝形式高度仿真有關(guān):它采用了學(xué)術(shù)論文與臨床文書的專業(yè)格式,看上去像“官方來源”。哈佛醫(yī)學(xué)院從事醫(yī)療 AI 研究的醫(yī)生馬哈穆德·奧馬爾(Mahmud Omar)在一項涵蓋20種大模型的研究中發(fā)現(xiàn),當(dāng)輸入文本以出院小結(jié)、臨床論文等專業(yè)醫(yī)療文體呈現(xiàn)時,大模型更容易在原有信息基礎(chǔ)上“添油加醋”,產(chǎn)生幻覺;若文本來自社交媒體、語氣更隨意,幻覺概率反而較低。他指出,當(dāng)前 AI 企業(yè)迭代模型的速度極快,行業(yè)尚未形成對每個版本進行自動化嚴密測試的統(tǒng)一流程與共識,這使得安全性評估和標準化控制難度大大增加。
更令人警醒的是,這場實驗最終突破了機器與人類之間的邊界,進入了正式醫(yī)學(xué)期刊。bixonimania 相關(guān)研究已在少數(shù)論文中被引用,其中包括一篇發(fā)表在醫(yī)學(xué)期刊《Cureus》上的研究,作者來自印度穆拉納的 Maharishi Markandeshwar 醫(yī)科與研究學(xué)院。該文引用了其中一篇偽造預(yù)印本,并寫道:“bixonimania 是一種與藍光暴露相關(guān)的眼周色素沉著(POM)新興形式,其機制有待進一步研究。”在《自然》新聞團隊向期刊求證后,《Cureus》于2026年3月30日宣布撤稿,理由是文章中存在三篇不相關(guān)參考文獻,包括一篇指向虛構(gòu)疾病的引用,編輯部因此“無法再對該工作準確性與來源保持信心”。作者不同意這一撤稿決定,但論文最終仍被正式撤回。
魯阿尼認為,這起事件已經(jīng)遠遠超出“AI 亂說話”的范疇,因為它同樣“愚弄了人類”,暴露出科研工作者對文獻來源與內(nèi)容的信任機制正在被侵蝕。“我們需要像保護黃金那樣保護我們的信任,”她說,“現(xiàn)在的狀況可以用一個詞形容:亂。”
在設(shè)計這場實驗時,奧斯馬諾維奇·通斯特倫也曾有過顧慮,她擔(dān)心刻意向科學(xué)文獻中“播種”一個假疾病,會造成現(xiàn)實傷害。為此,她向倫理顧問咨詢潛在風(fēng)險,并刻意選擇了相對“低風(fēng)險”的輕微皮膚問題作為題材,以減少可能的負面影響。“我想確認的是,我們通過這種方式做實驗,是在減少傷害而不是制造更多傷害。”她說。
圍繞 bixonimania 的這場連鎖反應(yīng),清晰地展示了在生成式人工智能迅猛發(fā)展、學(xué)術(shù)生產(chǎn)高度依賴數(shù)字工具的時代,虛假信息可以如何輕易穿透技術(shù)與制度的多層防線。從聊天機器人到同行評議期刊,機器與人類在這場“集體受騙”中共同參與,也迫使學(xué)界、業(yè)界和監(jiān)管者重新思考:在 AI 參與知識生產(chǎn)的新階段,如何重新校準“可信”的含義,以及如何在追求效率的同時劃出一條更清晰、更穩(wěn)固的審慎邊界。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.