網易首頁 > 網易號 > 正文申請入駐

Google最新論文破局AI幻覺：讓大模型...

2026-06-12 19:42:17　來源: 新浪財經

北京舉報

分享至

來源：市場資訊

（來源：海致科技）

技術的演進，從來不是平滑的線性遞進。

它是反復發生的推翻、迭代與重構——舊框架被打破，新邏輯在廢墟上生長，每一次突破都帶著重塑行業的力量。這是我們身處 AI 浪潮中最真實的體感，也是「海致技術觀察」的起點。

我們只做一件事：每期聚焦一篇全球前沿論文，或一項值得關注的新銳 AI 技術。不講學術黑話，不作玄虛推導，只回到產業落地的真實場景里——拆解技術內核，看清創新邏輯，判斷它究竟能帶來什么改變。

不追每一個浪頭，只辨認真正的轉向。用一線從業者的眼睛，樸實而有溫度的文字，陪你在 AI 的快速迭代中，保持清晰與敏銳。

這里是海致技術團隊的觀察筆記，也是愿與你共享的技術地圖。

海致技術觀察

本期，我們將目光投向 Google Research 最新論文，探討“元認知”技術如何破解 AI 幻覺。作為本體（Ontology）技術的實踐者，這是我們在持續關注的前沿方向之一。

如果你經常使用大模型，大概率經歷過這種抓狂的瞬間：AI 給出的答案排版工整、邏輯流暢、語氣無比自信，看上去專業度拉滿。可當你去核驗事實、溯源數據時，卻發現內容全是它“腦補”的。

在技術領域，這被稱作“自信式錯誤”（Confident Errors）——也就是大家常說的“ AI 幻覺”。

它和普通 Bug 不一樣。因為純概率生成的大模型，本質上并不知道“自己不懂”。它是基于概率生成文字，只會追求把句子接得“通順合理”，卻不會判斷事實的“真假對錯”。

為了解決這個問題，行業過去最直接的做法是“收緊模型閾值"：沒有百分之百把握，就禁止模型回答。

但是，問題看似解決了，代價卻極其高昂。學界將其稱為“效用稅”（Utility Tax）。

簡單講：模型為了不犯錯，直接不敢說話，變成了啞巴。大量模糊場景、推理場景，它全部選擇沉默。

要么瞎編，要么啞巴，這就是過去大模型逃不開的死局。

針對這個兩難困境，近期 Google Research 發布的最新研究，給出了一條極具啟發性的新路徑，也是今年非常值得關注的大模型進化方向：喚醒 AI 的元認知，實現“忠實不確定性”。

這個概念聽起來有些學術，我們可以用最簡單的視角去理解。

我們為什么會信任專業醫生？不是因為醫生永遠不會錯，而是因為醫生有清晰的“認知邊界”：哪些結論是有據可依的確診，哪些只是信息不足時的疑似，醫生會坦誠相告，不會把猜測包裝成定論。

知其所知，也知其所不知，這就是元認知。

Google 的這篇論文，將這種能力拆解為兩個層面：內在不確定性（模型內心的真實把握度）與語言不確定性（嘴上說出來的自信程度）。所謂“忠實不確定性”，就是要求兩者精準對齊——內心搖擺時，措辭必須留有余地；內心篤定時，才用確定語氣。

純概率生成的技術路線的問題恰恰在于這兩者經常錯位：該謹慎時盲目自信，該確定時反而含糊其辭。

Google 這次的核心突破，就是設計了一套機制強制它們對齊——讓大模型真正擁有了“知之為知之，不知為不知”的能力。

具體來說，對于訓練充分、數據確鑿的問題，模型給出精準、確定的答案；對于信息不足、場景模糊、無法篤定的問題，模型不再強行編造，而是坦誠說明不確定性、輸出合理假設、并標注風險邊界。

海致解讀：元認知不僅僅是“自省”，更是智能體的調度中樞。如圖所示，它通過控制層協調檢索（Retrieval）來核實事實，通過驗證（Verification）來評估置信度。這正是大模型從“聊天機器人”進化為“靠譜智能體”的關鍵架構支撐。

這一改變，直接重構了大模型的輸出邏輯：從前有害的“幻覺”，變成了可控、有參考價值的技術假設。行業終于不用在“準確率”和“實用性”之間做痛苦的單選題，那筆高昂的“效用稅”終于不必再交了。

放在產業落地的視角來看，這一步進化至關重要。

當下，AI 正在快速從“對話工具”升級為 AI 智能體（Agent）。當具體落地時，對于政企、金融、能源等高價值場景，最危險的不是 AI “不知道”，而是“不知道卻假裝知道”。

未來高端 AI 智能體的核心競爭力，早已不是“能答一切問題”，而是可信、可控、有邊界、可解釋。懂得自我判斷置信度、敢于暴露認知盲區、區分定論與假設——這才是智能體真正的靈魂。

當然，元認知規模化落地依舊面臨諸多技術挑戰，其中最突出的便是自舉悖論——用靜態的監督微調數據訓練模型表達不確定性，但模型的知識邊界是動態擴張的。用固定的標注約束動態的認知，很容易造成人為的認知降級或新的系統性偏差。

從盲目生成，到懂得自省，這一步不容易。讓 AI 學會“自知”，才是其走向成熟的開始。

延伸思考：元認知讓 AI 學會“自知之明”，而我們實踐的“圖模融合”技術更進一步——用本體（Ontology）提供可驗證的“事實錨點”，讓 AI “只在該說話的范圍內說話”。元認知解決“不知道自己不知道”，本體解決“說出來的必須是可驗證的”。兩者的結合，或許是從“對話玩具”走向“產業工具”的關鍵一步。我們將持續關注這一方向。

參考資料：

Google Research: Hallucinations Undermine Trust;Metacognition is a Way Forward

*本文及視頻內容僅為行業技術觀察與觀點分享，不代表海致科技的產品路線規劃或具體功能承諾。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.