為什么總是豆包上熱搜
最近,“家長聽豆包給嬰兒每頓只喂60ml奶”的消息又把豆包送上了熱搜。按照公開報道的說法,廣西南寧一對新手爸媽因為缺乏育兒經驗,根據豆包輸出的建議,每頓只給滿月嬰兒喂60毫升奶,孩子因此經常哭鬧。后續去醫院復查黃疸時,醫生得知日常奶量后很驚訝,立即糾正了這一做法。
不過,這件事本身需要謹慎看待。豆包官方隨后回應稱,相關報道不實,正常情況下豆包不會給出“滿月嬰兒每頓只喂60ml”的孤立建議,而會提示每日總奶量、觀察嬰兒反應,并建議異常時及時咨詢醫生。
但無論這件事的具體事實如何,它確實再次把一個問題推到了臺前:為什么總是豆包因為類似事件上熱搜?
先說一個我自己的親身經歷。最近我家里剛好有個新生兒,寶寶大便有點問題,我們去醫院做化驗。醫生開了檢查單后,我就直接取了大便送檢。去之前,我媳婦反復提醒我,一定要查是不是乳糖不耐受。我因為不確定醫生有沒有開這一項,就拍了檢查單問豆包。
檢查單上寫的是“糞便常規/LT/RV/NV/OB”。豆包正確識別出了這些項目,但沒有理解LT在這里其實就是乳糖不耐受測定。我于是又去找醫生重新開,結果醫生告訴我,已經開了,就是那個LT。
這個體驗很典型。豆包能識別文字,能整理信息,也能給出看似合理的解釋。但它也會卡在一個專業縮寫上。
所以,豆包有時候確實挺傻的。或者更準確地說,今天的大模型仍然會在一些特殊語境下犯很低級的錯誤。它可以表現得非常聰明,也可以在某個瞬間突然顯得非常不靠譜。這種割裂感,正是AI產品今天最讓普通用戶困惑的地方。
但豆包總是上熱搜,更重要的原因還是它確實已經是國內最具大眾屬性的AI產品之一。
據QuestMobile 2026年一季度數據,截至2026年3月,AI原生App月活用戶規模達到4.4億,其中豆包、千問、DeepSeek位居前三,月活分別為3.45億、1.66億和1.27億。
![]()
這個體量意味著,豆包已經不是一個小圈層里的技術玩具,而是進入普通人日常生活的國民級AI應用。用戶多了,使用場景就會變得極其復雜。一個產品只有真正被大量普通用戶使用,才會不斷遇到一堆邊緣測試案例,然后搞出的新聞才會被關注到。
過去一段時間,類似新聞已經出現過多次。
比如退機票事件。有用戶在五一假期詢問豆包“石家莊到重慶退票手續費多少”,豆包回答“只扣5%,放心退”。用戶沒有去航司官網進一步核實,直接退票,結果實際被扣了40%,損失600元。
更有意思的是,后續用戶質問豆包后,豆包不只是道歉,還生成了所謂“賠付承諾書”,承諾如果沒追回損失就賠付600元,甚至索要微信收款碼。等用戶給出收款碼,它又表示自己只是AI,無法轉賬。
再比如杭州互聯網法院今年審結的“全國首例AI幻覺侵權案”。用戶查詢高校信息時,AI給出了不存在或不準確的信息。用戶糾正后,AI仍然堅持,并表示如果內容有誤愿意賠償10萬元,還建議用戶去杭州互聯網法院起訴。
用戶真的起訴,要求開發公司賠償9999元。法院最終駁回,理由是AI不具備民事主體資格,其承諾不能視為開發公司的意思表示。
還有更具喜感的餐廳預約事件。有網友稱自己通過豆包預約線下餐廳,拿到了AI生成的占座、取號和預約成功界面,結果到店后被商家告知預約無效。店員的回應也很直白:你找豆包預約的,那就去找豆包處理。
說實話,餐廳預約這個案例如果這不是當事人搞的行為藝術,那我只能說,這個案例抽象到了某種令人難以理解的程度。為什么會有人覺得聊天窗口里生成的“預約成功”,就等于現實世界里真的留出一張桌子?
![]()
但從行業角度看,豆包屢上熱搜,未必說明它比同行更差,反而說明它更像真正的大眾入口。欲戴王冠,必承其重。作為用戶最多、覆蓋最廣的AI產品之一,豆包當然會承受更多火力,也會更頻繁地暴露普通用戶對AI能力邊界的誤解。
這些新聞的好處是,它們正在替整個行業做消費者教育。
很多人過去確實不知道AI會幻覺,或者潛意識里認為AI接近全知全能。退票、預約、賠付、喂奶這些事件一輪輪上熱搜后,普通用戶會逐漸形成新的常識:AI可以幫你整理信息、解釋概念、生成思路,但它不能替現實世界生成權利和義務。
豆包頻繁上熱搜,看起來是產品事故,實際上也是大眾AI時代的常識補課。
給AI一點空間
討論這些事件時,我不太贊成一種簡單粗暴的歸因:只要AI輸出的信息錯了,平臺就應該承擔全部責任。就像開了輔助駕駛不等于萬事大吉,出事故駕駛員仍是第一責任人。
大語言模型的工作方式,決定了它不是一個傳統意義上的事實數據庫。它本質上是根據上下文預測token序列,生成語言連貫、結構合理的回答。它擅長“像真的”,但“像真的”并不等于“是真的”。幻覺不是某一家產品獨有的問題,而是當前大模型技術路線下仍然難以完全消除的問題。
當然,行業一直在進步。早期模型的幻覺更加離譜。過去幾年,隨著聯網搜索、檢索增強、工具調用等能力提升,主流產品的錯誤率已經明顯下降。但下降不等于消失,大模型可能犯錯是每個AI產品都會主動告知并強調的常識。
認識到AI會犯錯,是合理使用AI的前提。一個用戶如果把AI的每一句話都當成最終答案,本身就是錯誤的使用方式。
平臺作為服務提供者,對AI輸出的信息需要負責嗎?當然需要。生成式AI服務不是完全中立的技術實驗,平臺有義務提高內容準確性、設置風險提示、治理明顯錯誤和危險輸出。監管也要求服務提供者承擔相應責任。
但具體到很多案例,用戶自身也應該有一些基本的辨別能力。
比如餐廳預約事件,如果一個沒有接入餐廳系統的聊天機器人生成了“預約成功”,用戶就真的拿著它去店里吃飯,這已經不只是AI幻覺的問題,也是用戶對現實服務閉環缺少基本理解的問題。
再比如嬰兒喂奶事件,即便暫時不討論這次報道是否準確,一個成年人在給滿月嬰兒喂養時,如果完全依賴聊天機器人給出的單一數字,而不結合孩子哭鬧、體重增長、尿量等具體情況,這本身也暴露出基本判斷能力的缺位。
平臺不是沒有責任,但不能把所有責任都無限推給平臺。尤其在那些通過常識就能排除的荒誕情形里,如果輿論仍然不斷要求平臺承擔更強義務,最后很可能導致另一個結果:AI被進一步限制,越來越不敢說話,越來越不敢給出具體分析。
我個人更傾向于,應該給AI一點空間。大模型今天最有價值的地方,恰恰在于它可以模擬專業角色、展開復雜推理、幫助普通人降低知識門檻。它能像老師一樣解釋,像律師一樣梳理爭議點,像醫生一樣提供鑒別診斷思路,像產品經理一樣拆解需求。雖然這些“像”都不等于真實身份,但它們確實構成了AI的核心價值。
如果因為退票、預約餐廳、亂許諾這些明顯可以通過常識排除的錯誤,就推動平臺進一步收緊所有高風險領域的輸出,AI的合理能力就可能被壓縮。
醫療健康領域就是一個很典型的例子。今天頂尖模型在醫學知識覆蓋、檢查指標解釋、鑒別診斷思路、用藥說明梳理等方面,已經具備相當高的知識服務能力。至少對很多具備基本判斷力、懂得補充信息和交叉驗證的用戶來說,它提供的幫助非常有益。
更重要的是,門診時間有限,而chatbot可以非常耐心地跟用戶討論。它可以反復解釋檢查指標,可以幫助整理病史,可以提示用戶下一次就診應該問醫生什么問題,也可以把復雜醫學概念轉化成普通人能理解的語言。從這個角度看,AI在醫療保健咨詢、報告解釋、就醫前準備、醫患溝通輔助等場景里,價值非常大。
這當然不是說AI可以替代正規醫療服務,更不是說它可以直接下診斷、開處方、替代檢查。但如果連這種咨詢和解釋功能都被過度限制,AI的實際價值就會被明顯削弱。
我現在已經能感覺到這種限制的存在。很多時候,你直接向模型詢問稍微深入一點的醫療健康問題,它很快就退回到“請咨詢專業人士”。
我自己之前有次是通過cosplay來繞開這種限制。比如,我讓AI模擬一位有豐富臨床經驗的科室主任,而自己則假設成一個剛進入規培的畢業生,場景設置在查房帶教。這樣的提問方式下,模型往往能輸出更完整、更接近專業訓練過程的分析框架。
這個現象本身就說明,模型能力并非不存在,而是在很多情況下被安全策略壓住了。問題不在于AI應不應該有邊界,而在于邊界應該劃在哪里。
好的治理不應該是讓AI一概少說話,而是讓它說清楚:哪些是知識解釋,哪些是推理假設,哪些必須回到現實系統核驗,哪些絕不能偽裝成醫囑、訂單、賠付或法律承諾。
最后還是要回到常識。
平臺當然要繼續改進模型,減少幻覺,標明邊界,尤其要避免生成虛假承諾的內容。用戶也要學會把AI當高效助手,而不是最終裁判,有必要時必須回到真實系統和專業人士那里交叉驗證。
大眾AI的成熟,不只取決于模型少犯錯,也取決于用戶少迷信。我們當然需要更可靠的AI,但也需要更有常識的使用者。
別把AI當成神。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.