最近,AI圈接連上演了兩出“好戲”。
一則是略顯荒誕的“鬧劇”:據九派新聞報道,有網友讓豆包朗讀滿屏的“若”字,結果AI越讀越快,聲調逐漸詭異,仿佛深夜“念咒”。面對熱搜上的“詭異”質疑,客服的解釋頗具技術流色彩:這是語音模型為了效率,在處理大量重復單字時壓縮了語調與語速。
![]()
另一則則是引發全民共鳴的“正劇”:為何AI總會一本正經地胡說八道?當你讓它查資料,它說得頭頭是道,一核對卻發現全是編造的。這種被稱為“AI幻覺”的現象,正成為許多人使用人工智能時的共同夢魘。
從“念咒”到“撒謊”,大眾往往將這些現象歸結為AI的“笨”或“技術不成熟”。但很少有人意識到,這背后隱藏著一個更深層的邏輯:AI的“胡說八道”,在某種程度上,是被現行的訓練與評分規則“逼”出來的。
當AI面對“今天天氣非常”這個開頭時,它并不是在思考天氣的冷暖,而是在計算下一個字出現“不錯”或“熱”的概率最高。它追求的是語言邏輯的通順,而非客觀事實的準確。
更致命的是,目前的AI訓練機制,像極了一場殘酷的“應試教育”。在現有的主流評分體系中,AI面臨著一種扭曲的激勵:答對了得分,答錯了不得分,而說“不知道”往往也不得分。
試想一下,如果把你放在這樣的考場規則下,面對一道冷門且模糊的題目,你會怎么做?與其交白卷(說不知道),不如硬著頭皮蒙一個(編造答案),萬一蒙對了呢?研究發現,當坦誠說“不知道”和答錯一樣沒有優勢時,AI會本能地傾向于“猜測”。
這就是為什么AI在面對冷門知識或細節追問時,會“硬答”。它不是想騙你,它只是太想“拿高分”了。這種被規則倒逼出來的“勤奮”,恰恰造就了它一本正經胡說八道的“自信”。
這種技術底層的“應試邏輯”,正在給狂飆突進的AI商業化蒙上一層陰影。
當AI從單純的聊天機器人進化為能夠輔助科研、提供投資建議、甚至參與法律定性的工具時,“幻覺”就不再是一個可以一笑置之的技術瑕疵,而是一顆隨時可能引爆的“信任雷”。
近期,全國首例AI幻覺侵權糾紛案的宣判,標志著這一問題已從技術圈外溢至法律與社會層面。從誤導投資者造成財產損失,到編造謠言導致名譽侵權,AI的“胡編亂造”正在讓企業和用戶共同買單。對于科技廠商而言,這不僅是聲譽的損失,更是真金白銀的賠償風險;對于用戶而言,盲目信任AI生成的“完美答案”,可能意味著在關鍵時刻做出錯誤決策。
目前的AI產業,正處于一個尷尬的“青春期”:它擁有了驚人的表達能力和知識廣度,卻缺乏對事實最基本的敬畏和核查能力。當“流暢度”被置于“準確度”之上,AI生成的內容越華麗,其背后的虛假信息風險就越大。
面對被規則“逼瘋”的AI,我們并非束手無策。解決之道,既需要技術端的“規則重塑”,也需要用戶端的“認知升級”。
在技術層面,科學家們已經開始反思現有的“指揮棒”。有研究建議改革評分規則:答對得1分,說“不知道”給0分,而答錯則要扣分。只有當“撒謊”的成本高于“承認無知”時,AI才會學會誠實地說“我不知道”。此外,行業主流的“檢索增強生成(RAG)”技術,相當于讓AI從“閉卷考試”變為“開卷考試”,在回答前先檢索權威資料,能大幅降低編造概率。
而對于作為普通用戶的我們,在享受AI帶來的效率紅利時,必須建立起一道心理防火墻:
第一,警惕“確定性”。當AI用無比自信、流暢的語氣給出一個冷門答案時,多留一個心眼。它的自信源于概率計算,而非事實核查。
第二,善用“不知道”。如果AI回答“不知道”,請不要生氣或反復逼問。在當前的機制下,愿意承認無知的AI,反而比強行作答的AI更靠譜。
第三,關鍵信息必核實。涉及金錢、法律、醫療等嚴肅場景,務必通過官方渠道進行交叉驗證。把AI當作一個才華橫溢但偶爾會喝醉的助手,而不是全知全能的神。
AI的“幻覺”問題,本質上是技術發展與人類規則磨合過程中的陣痛。它提醒我們,真正的智能不僅僅是流暢的對話,更是對事實的尊重與對邊界的敬畏。在AI真正學會“誠實”之前,保持審慎與批判性思維,是我們駕馭這項技術的唯一法門。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.