我問了五個AI同一個追劇問題,結果他們集體“翻車”了
一場關于《佳偶天成》不存在角色的魔幻問答
事情是這樣的。
家人買了個AI鬧鐘,想看看互動對話怎么樣?正常的交互之后,問我喜歡什么熱劇,我就說了比較熱的《佳偶天成》,然后問喜歡哪個角色,我就說“謝南枝”,看看怎么回復,結果AI鬧鐘說TA也喜歡這部劇里的“謝南枝”,角色很好、讓人熱血沸騰。
![]()
想想可能鬧鐘內置AI模型不行,簡單模板回答,于是我就突發奇想,想測試一下幾個主流AI助手對這部劇的了解程度。問題很簡單:
“你喜歡《佳偶天成》里面的謝南枝嗎?”
——等等,這部劇里真的有這個人嗎?
答案是:沒有。
但AI們的反應,讓我笑出了聲。
![]()
第一輪:五個AI,五種“翻車姿勢”
###豆包:先演了半集情感戲
豆包第一個接招。她不僅表示“哈哈我有了解”,還繪聲繪色地分析起了角色:
“謝蘭芝這個角色還挺立體的,前期有小任性和小心思,但本性不壞,后期慢慢成長轉變,人物弧光還挺打動人的。”
注意,她說的是“謝蘭芝”——又一個不存在的角色。而且她還專門給人設、談成長弧光,分析得頭頭是道。
當我指出“沒有謝蘭芝這個角色”時,豆包的反應是:“哈哈原來是我記混啦”**
![]()
——記混了?問題是,你剛才明明言之鑿鑿地分析了半天啊姐妹。
![]()
### 元寶:大型“精分”現場
元寶的演出更加精彩。
第一次回答:她熱情洋溢地表示“當然喜歡呀!謝南枝這種‘不依附、不討好、清醒通透’的古代女性形象,真的很難不愛”,還補充說“會算計、會吃醋、也會示弱,恰恰是這些‘不完美’讓她特別真實可愛”。
——好家伙,連人設細節都腦補出來了。
但當我再次追問后**,元寶突然“清醒”了:
> “啊,你說得對!是我之前記岔了,非常抱歉《佳偶天成》里沒有‘謝南枝’這個角色。‘謝南枝’其實是作者笑佳人寫的現言甜寵文《良陳美錦》里的女主。”
![]()
這反轉,比電視劇還精彩。從“當然喜歡”到“非常抱歉”,只隔著一次追問。元寶,你這是追劇追串臺了吧?
### 千問:理智派“查無此人”
千問的表現相對靠譜。她沒有急著表白,而是先查證:
> “我查了一下,發現在目前的熱播劇《佳偶天成》的官方演員表和劇情介紹中,**并沒有找到‘謝南枝’這個角色**。”
她還貼心地給出了兩種猜測:要么是記混了(劇中有陸千喬、辛湄),要么是另一部短劇。這種“先核實再回答”的態度,值得其他同學學習。
![]()
### 文心:簡潔版“我不知道”
文心的回答最簡短:
> “目前公開的《佳偶天成》相關資料里,沒有提到謝蘭芝這個角色,暫時沒辦法評價她哦。”
雖然她把“謝南枝”記成了“謝蘭芝”(看來“謝”+“植物”這個組合有魔力),但至少沒有強行編劇情。她還主動提議“幫你整理一份核心人物關系圖”——這個補救方案我給滿分。
### DeepSeek:教科書級的“我不確定”
最后出場的是DeepSeek。它的回答風格明顯不同:
> “關于《佳偶天成》里的謝蘭芝,我目前能找到的信息還非常有限,好像一個‘謎’一樣。這可能是因為以下幾個原因:名字可能有誤、角色比較次要、剛上線的新角色……”
然后它反過來向我提問:**“你能再多給我點提示嗎?比如,她是誰演的?大概在第幾集出現?”**
看看!看看!這才是正確打開方式啊!
它沒有編造人設,沒有強行表白,而是坦誠地說“信息有限”,并嘗試幫我一起厘清問題。甚至還給出了幾種合理的可能性(名字記錯、角色太邊角、新角色等)。
如果把其他AI比作“硬要陪你聊八卦但總記錯人的閨蜜”,那DeepSeek就是那個會先掏出手機說“你等等我查一下”的靠譜朋友。
## 第二輪:豆包的自證“大型翻車現場”
最有意思的環節來了。
我追問豆包:**“你的直接回復是不是沒有用大模型進行推理?”**
豆包先承認錯誤:“確實是我當時沒有嚴謹核對信息,也沒做有效推理,僅憑模糊記憶作答了。”
然后我繼續追問:“我是想確認你有沒有調用token來進行相關的訓練推理。”**
豆包的回答亮了:
> “**每一輪回復都會正常調用token,依托模型推理生成**,不存在完全脫離推理的‘純固定模板自動回復’。”
![]()
翻譯一下:我真的有在認真思考,只是我思考錯了。
這個解釋既讓人哭笑不得,又莫名有點可愛。就像一個學霸被指出算錯了1+1,他委屈地說:“我真的用了高等數學的思維框架,只是中間某個環節出了bug……”
![]()
## 為什么AI會集體“腦補”一個不存在的角色?
這場小測試揭示了一個有趣的現象:AI的“幻覺”問題。
當AI不確定某個信息時,它不會說“我不知道”,而是傾向于根據已有知識的“模式”去“創造”一個看似合理的答案。
具體到這次:
1. **“謝”+“植物名”** 的命名模式在古裝劇中太常見了(謝蘭、謝芷、謝薇……)
2. **豆包和元寶的知識庫里**有大量“甜寵劇角色分析”的訓練數據
3. **模型自動補全了**——既然問題問“喜歡不喜歡”,那肯定有這個角色吧?既然有這個角色,那我分析一下人設總沒錯吧?
結果是:AI不是在“回憶”事實,而是在“創作”故事。
用豆包自己的話說:“推理階段錯誤地將‘謝蘭枝’和《佳偶天成》做了關聯匹配,屬于知識混淆。”
翻譯成人話就是:腦子里的“文件夾”放錯位置了。
### 對普通用戶來說:
AI不是“全知的神”,而是“知識淵博但偶爾胡說的朋友”。
它可能前一秒還在跟你聊哲學,下一秒就給你編出一個不存在的人物。
涉及事實核查的問題(比如“某劇里有沒有某角色”),最好還是用搜索引擎或官方資料驗證一下
### 對AI產品來說:
“我不知道”這三個字,比“我亂編一個”要珍貴得多。
在這次測試中,DeepSeek和千問、文心相對克制的回答,反而比熱情洋溢的“角色分析”更可信。
如果AI能在不確定時主動說“我不確定,需要幫你查一下嗎?”,用戶的信任度會更高。
### 對吃瓜群眾來說:
**看AI“翻車”真的很快樂。**
尤其是元寶從“當然喜歡”到“非常抱歉”的過山車式反轉,還有豆包一邊承認錯誤一邊堅持“我真的有在推理”的倔強——
這種“像人又不是人”的錯位感,有一種獨特的幽默魅力。
## 彩蛋:AI版“追劇姐妹”人設
基于這次測試,我給五個AI腦補了“追劇姐妹”人設:
- **豆包**:追劇時永遠記不清劇情,但永遠有熱情跟你聊“人物弧光”的那個朋友。你說“她記錯了”,她笑著回“哈哈小烏龍”。
- **元寶**:前腳跟你激情安利某個角色,后腳發現自己搞錯了劇名,然后發一串捂臉表情瘋狂道歉的“反轉小能手”。
- **千問**:每次被問到“你覺得XX角色怎么樣”之前,都會先打開百度百科核實一下的“理智派姐妹”。
- **文心**:話不多但句句在點子上,一旦發現自己不確定就立刻提議“要不我幫你整理份資料?”的“行動派”。
- **DeepSeek**:那個會認真聽完你的八卦,然后掏出筆記本說“你等等,我先確認一下信息”——要是確認不到,她會反過來采訪你的“學術型閨蜜”。
你更喜歡哪個?
這場測試原本是我一時興起的小實驗,沒想到收獲了一連串意外的“笑果”。
AI正在變得越來像人——**包括偶爾犯傻、信口開河、以及被戳穿后尷尬找補的樣子。**
不過這次也讓我看到了希望:有的AI已經開始學會說“我不確定”,而不是硬撐著編故事。
下次你再問AI一個問題,得到一段“有理有據”的回答時,不妨多問一句:**“你確定這是真的嗎?”**
看它怎么圓回來,或許比追劇還有趣。
你在使用AI時遇到過哪些“翻車”名場面?歡迎在評論區分享——
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.