用戶搜黎元洪,豆包給出了用范偉PS的照片。
![]()
(豆包搜索黎元洪出來范偉的PS照)
這是AI的常見錯(cuò)誤,讓人意外的是:這事兒竟然也上了熱搜。
這不是AI第一次干這種「蠢事」,也不會(huì)是最后一次。之前,有小朋友拿著一個(gè)老鼠夾問AI是什么東西,AI說是「廢棄卡丁車小玩具」,說得有鼻子有眼:「方方的底盤、金屬的結(jié)構(gòu)」,結(jié)果孩子手指被夾了;有用戶丟給AI毒蘑菇,AI判定為可食用杏鮑菇,結(jié)果……遇到這樣的情況,AI都會(huì)誠懇道歉。
![]()
(網(wǎng)友總結(jié)“豆包型人格”)
是豆包越來越傻了嗎?不是。當(dāng)豆包月活漲到3.45億時(shí),哪怕錯(cuò)誤率是恒定的,分母膨脹了,分子自然會(huì)變大,翻車案例就會(huì)增多,并且每一次都會(huì)引發(fā)豆包用戶們的“共鳴”,吵上熱搜。所以說,AI翻車段子的數(shù)量,其實(shí)是AI滲透率的反向指標(biāo)。
前幾年,總有人說百度地圖傻,但也有人說高德地圖笨,其實(shí)沒有誰比誰更聰明:看你用哪個(gè)App多,用得多了,總會(huì)遇到導(dǎo)航出錯(cuò)的情況。
AI搜索騙你,是因?yàn)榛ヂ?lián)網(wǎng)騙了AI
這次豆包錯(cuò)將范偉當(dāng)黎元洪,官方回應(yīng)說是跟一部電影選角有關(guān):范偉和黎元洪確實(shí)長得像,前者的PS圖當(dāng)年被媒體大量報(bào)道、全網(wǎng)瘋傳,部分圖庫和百科頁面也曾誤收錄,所以AI檢索時(shí)優(yōu)先命中了這些高頻傳播的錯(cuò)誤圖片。
所以AI經(jīng)常犯錯(cuò)的根本原因是:互聯(lián)網(wǎng)的湯底里本來就沉著一堆錯(cuò)料,AI拿勺子舀的時(shí)候,剛好把最大塊的那坨舀上來了。
這不是什么“豆包的問題”,這是“所有AI的問題”,并且AI生成的內(nèi)容被網(wǎng)友海量發(fā)布到網(wǎng)上,交叉污染。NewsGuard在2025年8月發(fā)布的數(shù)據(jù)顯示,10款主流AI工具在新聞話題上重復(fù)虛假信息的比例是35%,而一年前只有18%。GPT-4.5的生成答案中,缺乏依據(jù)的主張比例達(dá)到了47%,Perplexity深度研究工具甚至出現(xiàn)了97.5%的驚人數(shù)字。
換言之,你看到的每一個(gè)AI搜索答案,從統(tǒng)計(jì)學(xué)原理上就已經(jīng)包含了不可消除的噪聲。
有個(gè)朋友前幾天和我說,現(xiàn)在AI搜索99%是對(duì)的,1%的結(jié)果犯傻,我們只要識(shí)別出這1%就可以放心使用AI搜索。查了一組數(shù)據(jù),發(fā)現(xiàn)AI搜索準(zhǔn)確率比我們預(yù)期的還要低。根據(jù)Google內(nèi)部測試數(shù)據(jù),在4326條樣本中,Gemini AI概覽準(zhǔn)確率已達(dá)91%,雖然非常高,但依然有每10條就錯(cuò)1條的可能。中國AI搜索面臨的實(shí)際情況更復(fù)雜,「自媒體平臺(tái)」做號(hào)黨的內(nèi)容創(chuàng)作制度讓中文互聯(lián)網(wǎng)的文本污染尤其嚴(yán)重,很多新媒體平臺(tái)今天的內(nèi)容已是滿目瘡痍,大量的AIGC內(nèi)容以及AI洗稿偽原創(chuàng)內(nèi)容充斥其間,堪稱屎山一座。
從技術(shù)上,考慮到數(shù)據(jù)質(zhì)量和大模型技術(shù)原理,99%的準(zhǔn)確率對(duì)AI搜索是一個(gè)遙不可及的目標(biāo),100%的準(zhǔn)確率如同「絕對(duì)零度」:可不斷接近,但永遠(yuǎn)無法達(dá)到。
更何況,世界的某些問題本就沒有唯一正確答案。AI的知識(shí)來自互聯(lián)網(wǎng),互聯(lián)網(wǎng)的信息來自人類,人類的知識(shí)不是全都已經(jīng)明確的。斯坦福大學(xué)2025年發(fā)表在《自然·機(jī)器智能》上的論文說得很直白:最新的大語言模型在驗(yàn)證事實(shí)性數(shù)據(jù)時(shí)的平均準(zhǔn)確率最高只到91.5%,而面對(duì)用戶的錯(cuò)誤信念時(shí),AI幾乎無法可靠區(qū)分“他堅(jiān)信的”和“事實(shí)”。這并不讓人意外——如果人類自己都沒搞明白有些情況是“我以為的事實(shí)”還是“事實(shí)”,我們又如何要求AI全都搞明白呢?
AI搜索好傻,為何人類卻越來越上癮?
真正有意思的問題不是“AI為什么犯錯(cuò)”,而是“這么容易犯錯(cuò),為什么人們還在用”。
人類不是沒有選擇。拒絕AI搜索,起碼能用百度、Google等未摻和任何AI結(jié)果的傳統(tǒng)搜索。然而,每天被罵犯傻翻車的豆包月活3.45億,千問、文心、元寶、deepseek的用戶規(guī)模也在高速增長,AI搜索吞噬傳統(tǒng)搜索的進(jìn)程肉眼可見。
傳統(tǒng)搜索引擎只負(fù)責(zé)提供一長串網(wǎng)頁鏈接,完成相關(guān)性排序,決定誰靠前。至于結(jié)果哪個(gè)是對(duì)的,由用戶自己打開網(wǎng)頁一個(gè)個(gè)分辨,效率低下。AI搜索將用戶獲取信息的效率提高了幾個(gè)數(shù)量級(jí),因?yàn)樗惶峁肝ㄒ弧勾鸢福碚撋蟻碚f這個(gè)結(jié)果必須是100%準(zhǔn)確。
但「唯一答案」本就是一種低容錯(cuò)設(shè)計(jì)。如果用戶將決策100%建立在可能錯(cuò)誤的答案之上,一旦出問題就會(huì)很嚴(yán)重,輕則上熱搜鬧笑話,重則食用毒蘑菇去醫(yī)院。
這就像你問路:百度遞給你一張地圖讓你自己找,走錯(cuò)了你認(rèn)了還對(duì)百度心懷感恩;豆包告訴你往東走第三個(gè)路口左轉(zhuǎn),你走到發(fā)現(xiàn)方向反了,哪怕豆包是無心之失也會(huì)被你回去痛罵一頓。
傳統(tǒng)搜索追求的是「召回率」高,搜出來的東西跟搜索詞能不能沾上邊;AI搜索追求的是「高效率」和「準(zhǔn)確率」。既然AI搜索當(dāng)前準(zhǔn)確率才90%左右(以谷歌gemini為基準(zhǔn)),為什么人們還是越來越愛用,而不是在“給你一堆結(jié)果你自己判斷”的傳統(tǒng)搜索逗留呢?
我在這里拋出一個(gè)暴論:人類對(duì)信息精確度的需求,實(shí)際上是被高估的。
在日常生活中,99%的搜索場景并不是用來做生死攸關(guān)的判斷。查天氣、做旅游攻略、研究護(hù)膚方法、整理想法、看八卦……信息稍微有些偏差并不會(huì)造成嚴(yán)重后果。就拿黎元洪這事來說,對(duì)99%的使用場景而言,這就是個(gè)茶余飯后的笑談,用戶不會(huì)因?yàn)檫@個(gè)搜索結(jié)果重新看待整個(gè)晚清史。
但是,如果一個(gè)人做學(xué)術(shù)研究、投資決策、醫(yī)療方案用AI搜索,那就不能怪AI犯傻。因?yàn)檫@些場景下,用戶得到的信息必須100%準(zhǔn)確,AI搜索「答案僅供參考」。
對(duì)于大多數(shù)搜索場景來說,91%的準(zhǔn)確率足夠用了。而且退一步說,在沒有AI搜索的年代,你在小紅書上看減肥筆記、在搜索引擎搜「皮膚科好的醫(yī)院」,看到的信息就是真的嗎?說不定是廣告。還有,手機(jī)能不能放枕頭下、大姨媽來了能不能喝冷水,這些問題本就沒有標(biāo)準(zhǔn)答案,AI不過是反映了人類的知識(shí)混亂。
正是這種普遍存在的“91%準(zhǔn)確率夠用”的低風(fēng)險(xiǎn)需求,讓AI搜索日益普及:它的錯(cuò)誤率雖然高,但只要錯(cuò)誤不是徹底致命的,人們總是更在意「效率」而不是「精確」。
當(dāng)你用AI搜索更復(fù)雜、更嚴(yán)肅、更「物理」的決策問題時(shí),這個(gè)邏輯才徹底失效。比如你要確認(rèn)某種蘑菇能否食用時(shí)……問題切入到生命、健康、財(cái)產(chǎn)、風(fēng)險(xiǎn)和決策地帶時(shí),91%的準(zhǔn)確率可能會(huì)讓你付出沉重的代價(jià)。
所以現(xiàn)在醫(yī)療、法律、金融這種「高后果」場景領(lǐng)域,出現(xiàn)了「專用AI」而非「通用AI」,比如面向醫(yī)療健康場景的螞蟻阿福,但即便是它們也無法保證100%不出錯(cuò)。
責(zé)任在你:所有系統(tǒng)都有bug,AI也不例外
兩千年前,孟子說「盡信書不如無書」,既然書籍上的知識(shí)都不一定是對(duì)的,我們又如何敢100%絕對(duì)信任AI?「盡信AI不如無AI」。
有人開著一輛帶輔助駕駛功能的電車,在高速上雙手離開方向盤刷朋友圈,出事后甩鍋給車企,但廠商把“駕駛員是操作車輛的第一責(zé)任人”寫進(jìn)了用戶協(xié)議,“小字沒看到”也無法轉(zhuǎn)移自己的責(zé)任。
在AI搜索獲取信息這個(gè)維度上,情形是完全一樣的。當(dāng)人類越來越依賴AI時(shí),我們不僅要期待廠商訓(xùn)練AI更準(zhǔn)確,更要努力訓(xùn)練自己的判斷能力。在智商、情商后,AI時(shí)代人類的“信商”將越來越重要:也就是真假信息甄別的能力素養(yǎng)。沒有任何公司能給你一個(gè)100%準(zhǔn)確的AI,你要做的就是把方向盤緊緊握在自己手里。
任何系統(tǒng)都有bug,任何AI吐出來的結(jié)果都可能是錯(cuò)的。記住這個(gè)常識(shí),是正確使用AI的第一步。
回到豆包身上。黎元洪變范偉其實(shí)并不影響“豆包該不該收費(fèi)”的辯論,關(guān)于「好的AI為什么一定要收費(fèi)」我已經(jīng)在另外一篇文章《付費(fèi)版68元/月!豆包也撐不住了?》中討論了。澎湃新聞?wù)f在AI大規(guī)模收費(fèi)之前,或許應(yīng)該“打掃干凈屋子再請(qǐng)客”。問題是,AI的屋子永遠(yuǎn)都掃不干凈,掃干凈了還有灰塵。ChatGPT收費(fèi)版也不能確保100%準(zhǔn)確,因?yàn)闆]有AI能做到100%絕對(duì)準(zhǔn)確。就算是用于創(chuàng)作等生產(chǎn)力場景,AI結(jié)果也不能、不應(yīng)拿來就用。
對(duì)結(jié)果的判斷、審核、識(shí)別也就是「正確使用」,是人在AI時(shí)代的核心價(jià)值。
所以:下次吃了毒蘑菇,千萬不要怪豆包。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.