網易首頁 > 網易號 > 正文 申請入駐

AI里最大的Bug,卻也是人類文明最偉大的起點。

0
分享至

大數據文摘受權轉載自數字生命卡茲克

作者:卡茲克

周末在家扒拉上周更新的論文的時候,看到一篇我自己一直非常關心的領域的論文,而且還是來自發論文發的越來越少的OpenAI。

它討論的是一個我們所有人都無比熟悉,但又無比困惑的東西。

幻覺。

這個詞,自從AI進入大眾視野以來,就一直像個幽靈一樣,盤旋在所有對話的上空。

我們一邊享受著AI帶給我們的便利,一邊又對它那些一本正經胡說八道的時刻,感到恐懼和不解。

AI為什么會產生幻覺?這個看似惱人的bug,到底能不能被徹底修復?

這是我們一直想知道的問題。

這篇論文還是蠻有意思的,給了我自己很多新的輸入,我覺得也可以分享出來,來聊聊這些關于幻覺的問題,以及,我自己一直是怎么認為這個東西的。

整個故事,要從一個最簡單的問題說起。

如果你問AI:亞當·卡萊(這篇論文作者之一)的生日是幾月幾號?

一個頂尖的開源大模型,連續三次,給出了三個完全不同的錯誤答案:03-07,15-06,01-01。

而正確答案,其實是秋天。

這就是最典型的幻覺。

面對一個它不知道答案的問題,AI沒有選擇沉默,或者說我不知道,而是像一個考場上想不出答案又不想交白卷的學生,開始瞎蒙,而且蒙得有鼻子有眼。

OpenAI的這篇論文,提出了一個非常有意思而且又極其符合直覺的觀點:

AI之所以會產生幻覺,是因為我們訓練它的方式,從一開始,就在系統性地獎勵這種瞎蒙的行為。

我們可以,把AI的學習過程,想象成一個學生參加一場漫長的且永不結束的考試。

這場考試的評分標準超級簡單粗暴,答對了,加1分,答錯了,或者不答,都是0分。

現在,你就是那個學生,面對一道你完全沒把握的題,你會怎么選?

你大概率會選擇猜一個。

因為就算猜錯了,你也不虧對吧,但是萬一猜對了呢?你就直接怒賺1分。

從期望得分的角度看,只要你猜對的概率大于零,猜測就是最優策略。

就像上面那個論文里面的case,你問AI一個人的生日,它肯定不知道。

但是如果它猜一個,比如9月10號,那它有365分之一的概率蒙對,拿到1分。但如果它老老實實地說我不知道,那得分就永遠是0。

在成千上萬次這樣的測試里,那個愛瞎蒙的模型,最終在排行榜上的分數,一定會比那個誠實但謙虛的模型,看起來更牛逼。

OpenAI自己就直接拿了自家的兩個模型給大家看了一下效果。

一個叫o4-mini,一個叫gpt-5-thinking-mini,他們一起參加了同一場叫SimpleQA的考試。

如果你只看最終成績,也就是準確率,你會發現一個很奇怪的現象。

o4-mini的分數,居然比gpt-5-thinking-mini還高了那么一點點,24%對22%。

但如果我們再來看另一項數據:錯誤率,也就是到底答錯了多少題。

這一看,emmm,老o4-mini的錯誤率,高達75%,gpt-5-thinking-mini只有26%。

再看最有趣的指標,棄權率。

o4-mini幾乎把卷子寫滿了,只有1%的題沒答。

gpt-5,有一大半的題,52%,都直接選擇了交白卷,老老實實地承認,我不會。

o4-mini那看似稍高的分數,是用海量的、不負責任的瞎蒙換來的。而gpt-5,則選擇了一種更誠實,也更可靠的策略,就是寧愿不得分,也絕不胡說。

這個數據,再清楚不過地證明了論文的觀點。

于是,幻覺,就成了AI在這種訓練體系下,演化出的一種最高效的應試策略,它其實不是bug,它是AI為了在我們設計的這場游戲里拿高分,進化出的本能。

然后這篇論文, 從統計學的角度,又解釋了幻覺的根源,這塊我大概說的淺顯易懂一些。

OpenAI定義了一個 叫Is-It-Valid (IIV)的分類問題,也就是這句話對不對的二元分類。

因為 AI生成一句話,本質上是一個極其復雜的過程。

但我們可以把這個問題簡化一下,在AI生成任何一句話之前,它必須先學會判斷,一句話是有效的還是無效的。

比如,你好是有效的,泥嚎就是無效的拼寫錯誤;天空是藍色的是有效的,天空是綠色的就是無效的事實錯誤。

AI的學習過程,就像是在看海量的、已經貼好對或錯標簽的卡片。它看得越多,判斷力就越強。

但問題是,總有一些卡片,是它沒見過的,或者見得很少的。

OpenAI有一個特別通俗的比喻,就是你給AI看幾百萬張貓和狗的照片,并且都打上標簽,它很快就能學會區分貓和狗,因為這背后有規律可循,畢竟貓臉和狗臉,它長得就是不一樣。

但如果你給它看幾百萬張寵物的照片,然后讓它去記每一只寵物的生日呢?

這就完蛋了,因為生日這玩意,是完全隨機的,沒有任何規律可言。AI沒法通過分析一只貓的毛色,去推理出它的生日,它唯一能做的,就是死記硬背。

這就引出了論文里一個關鍵的概念:Singleton rate,孤例率。

意思就是,就是如果一個信息,在AI學習的海量數據里,只出現過一次,那么AI在判斷這個信息的真假時,就極有可能出錯。

幻覺,很多時候,是一種必然。

OpenAI還給了一些反常識的結論:

第一,我們總覺得,只要AI的準確率做到100%,幻覺不就自然消失了嗎?OpenAI說,不可能。因為這個世界上,有太多問題,本身就是無解的。信息是缺失的,邏輯是矛盾的,AI就算再強大,也不可能憑空變出答案。所以,準確率永遠不可能達到100%,幻覺也就總有存在的空間。

第二,我們又覺得,既然幻覺沒法根治,那它是不是就是AI的原罪,一個不可避免的詛咒?OpenAI說,也不是。幻覺不是不可避免的,前提是,AI得學會認慫。只要它在不確定的時候,選擇說我不知道,而不是硬著頭皮瞎蒙,幻覺就可以被控制。

第三,我們還覺得,AI越大越聰明,就越不容易犯錯。OpenAI說,恰恰相反,有時候,小模型反而更誠實。他們舉了個例子,你問一個只會說英語的小模型,一個毛利語的問題,它會很干脆地告訴你,我不會。但你問一個學了點毛利語但學得半生不熟的大模型,它反而要開始糾結,要不要猜一下?知道自己的無知,有時候比擁有知識更重要。

最后,也是最關鍵的一點。我們以為,解決幻覺問題,只需要一個更牛逼的、專門測試幻覺的工具就行了。OpenAI說,這完全是沒吊用。真正的問題,不是缺少一個好的幻覺測試,而是我們現在用的那幾百個主流評估的指標,全都在獎勵瞎蒙,懲罰誠實。只要這個大環境不變,幻覺就永遠是AI的最優解。

現在,我們從OpenAI這里,知道了,幻覺,不是一個簡單的技術問題,它是一個系統性的、由我們自己親手造成的激勵問題。

但它也引出了一個更讓我著迷的,沒有答案的,問題。

如果說,AI的幻覺,源于它在信息不足時的一種創造性猜測。那我們人類的想象力,我們那些天馬行空的故事、藝術、神話,它們的起源,又是什么呢?

幻覺,真的需要解決嗎?

我想了很久,我覺得,也想跟大家,分享一下我自己的想法。

這事兒,我覺得得從更古老的尺度說起。

幾十萬年前,我們的祖先,智人,也生活在一個信息極度匱乏的世界里。

一陣突如其來的狂風,吹倒了部落里的大樹,這是為什么?他們不知道。

一道閃電,劈開夜空,點燃了草原,這又是什么?他們也不知道。

面對這些無法解釋的自然現象,他們的大腦,和今天的AI一樣,也面臨著一道道知識儲備不足的判斷題。

而我們的祖先,沒有選擇沉默。

他們也開始了瞎蒙。

他們猜,狂風的背后,是不是有一個憤怒的神明?他們猜,閃電的背后,是不是有一條飛舞在云端的巨龍?

你看,這就是神話的起源。

神話,就是我們人類這個物種,在面對一個充滿未知和不確定性的世界時,為了給那些無法解釋的現象,尋找一個合理的解釋,而集體編造出來的、最古老、也最壯麗的。

幻覺。

這種幻覺能力,在當時,可能并沒有什么實際的用處,它不能幫你打到更多的獵物,也不能幫你躲避更兇猛的野獸。

但它帶來了一樣東西,一樣其他所有動物,都不具備的東西:

一個共同的想象,一個共同的故事。

一只貓,一條魚,它們也會有幻覺嗎?

從生物學的角度,我覺得可能會。

一只貓,可能會把地上的影子,當成一只老鼠,然后撲上去。一條魚,可能會把閃亮的魚鉤,當成一條小蝦。這是一種基于感官信息的誤判,一種低級的、個體的幻覺。

但它們,永遠也想象不出一個貓神或者魚神的故事。

因為它們的大腦,被牢牢地鎖死在了真實的世界里,它們只能處理那些看得見、摸得著的、和生存直接相關的信息。

而人類,可能是地球上唯一一個,能為了一個看不見摸不著的故事,去生,去死,去戰斗的物種。

我們能組織起幾千人,去建造一座金字塔,不是因為我們每個人都親眼見到了法老死后會變成神,而是因為我們都相信同一個法老會變成神的故事。

我們能建立起國家、法律、公司,這些看似堅不可摧的龐然大物,它們的底層,全都是我們共同相信的一個個,幻覺。

從這個角度看,幻覺,或者說,這種在信息不足時,進行創造性猜測并將其故事化的能力,根本不是bug。

它是把我們從普通動物,變成人類的那段詩句。

它是我們所有文明、所有藝術、所有科學的起點。

哥白尼提出日心說,在當時那個時代,不也是一種離經叛道的幻覺嗎?愛因斯坦提出相對論,那個能讓時間變慢、空間彎曲的理論,不也是源于一個少年躺在草地上,幻想自己追著光跑的幻覺嗎?

我們之所以比其他所有生物都更強大,不是因為我們更尊重事實。

恰恰相反,是因為我們更擅長,創造那些超越事實的故事。

現在,我們再回頭看AI的幻覺。

我們一直在努力修復的那個東西,可能恰恰是AI身上,最像人的東西。

我當然不希望AI在一個嚴肅的醫療診斷里產生幻覺,我們也不希望它在一個關鍵的財務分析里胡說八道,在這些需要絕對真實的領域,我們需要的是一個沒有感情、絕對可靠的工具。

但是,在一個需要創造力、需要想象力的領域呢?

當我們要求AI去寫一首詩,去畫一幅畫,去構思一個科幻故事時,我們真正想要的,難道不就是它那種,能掙脫事實的枷鎖,在信息的縫隙里,進行自由聯想和創造性猜測的能力嗎?

在大量的討論中,幻覺一詞,好像一直是一個矛盾。

我們一邊渴望AI成為一個絕對忠誠、絕對正確的工具,一個不會犯錯的仆人,幫我們處理現實世界里所有需要精確計算的難題。

但我們又渴望它能成為一個能理解我們、甚至超越我們的同類。

我們希望它能和我們一起,去仰望星空,去聊那些沒有標準答案的話題,去共同編織那些屬于未來的、新的神話。

我們似乎在試圖創造一個不可能的物種:

一個既擁有機器的嚴謹,又擁有人類的浪漫,一個既能堅守事實,又能創造幻覺的矛盾體。

我們生活在一個由數據和算法定義的前所未有的真實世界里,我們,也比歷史上任何一個時代的人,都更崇拜事實,更依賴邏輯。

但同時,我一直覺得,我們又可能,是歷史上最孤獨的一個時代。

我們的神話已經遠去,我們的史詩已經譜完。

在這樣一個一切都被解釋得清清楚楚的世界里,我自己內心那種最古老的、對故事的渴望,對意義的追尋,反而一直,變得空前強烈。

我到底想要一個什么樣的未來?一個所有問題都有標準答案的、絕對真實、但可能也絕對無趣的未來?還是一個依然充滿了未知、充滿了誤讀、但因此也充滿了故事和想象力的未來?

這個問題過于宏大了,我沒有答案。

但是我始終喜歡、并相信。

那個最美麗的,又創造了整個文明的。

幻覺。

GPU 訓練特惠!

H100/H200 GPU算力按秒計費,平均節省開支30%以上!

掃碼了解詳情?

點「贊」的人都變好看了哦!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
傅聰正告以色列:違反國際法的行為,立即停止!

傅聰正告以色列:違反國際法的行為,立即停止!

看看新聞Knews
2026-04-23 10:32:04
十年后再出發,榮威要用AI原生汽車重寫智能汽車的下一章

十年后再出發,榮威要用AI原生汽車重寫智能汽車的下一章

汽車預言家
2026-04-22 12:02:53
不打了!退出G3和G4!雷霆遭遇最大危機

不打了!退出G3和G4!雷霆遭遇最大危機

籃球教學論壇
2026-04-23 17:14:19
交銀國際信托黨委書記、董事長張文被查

交銀國際信托黨委書記、董事長張文被查

新京報
2026-04-23 10:20:16
臺灣最新民調出爐,蔣萬安、鄭麗文支持率驚人,民眾黨大將已表態

臺灣最新民調出爐,蔣萬安、鄭麗文支持率驚人,民眾黨大將已表態

近史博覽
2026-04-24 02:30:22
肖國棟告急!連輸5局,世界冠軍打瘋了:1階段必領先,8強穩了?

肖國棟告急!連輸5局,世界冠軍打瘋了:1階段必領先,8強穩了?

劉姚堯的文字城堡
2026-04-23 22:17:05
官宣退出G3和G4!今年冠軍,麻煩了…

官宣退出G3和G4!今年冠軍,麻煩了…

左右為籃
2026-04-23 21:34:07
遼寧美女“寶姐”去世,年僅40歲,長得很漂亮,一月前還好好的

遼寧美女“寶姐”去世,年僅40歲,長得很漂亮,一月前還好好的

180視角
2026-04-23 07:57:38
99年我在守水庫,遇到一個道士借宿,他走時叮囑我,最近先別下山

99年我在守水庫,遇到一個道士借宿,他走時叮囑我,最近先別下山

千秋文化
2026-04-20 19:50:05
女子被保安扇耳光后續!知情者曝內情,保安身份被扒,學校回應

女子被保安扇耳光后續!知情者曝內情,保安身份被扒,學校回應

180視角
2026-04-23 12:56:07
一雞爆火,老板直接累癱了

一雞爆火,老板直接累癱了

南風窗
2026-04-23 16:11:15
反超重慶!中國最強省會,逆轉了

反超重慶!中國最強省會,逆轉了

國民經略
2026-04-23 11:44:00
庫克反思其15年CEO任期:蘋果地圖發布是“首個重大錯誤”,Apple Watch是最引以為豪的作品

庫克反思其15年CEO任期:蘋果地圖發布是“首個重大錯誤”,Apple Watch是最引以為豪的作品

魯中晨報
2026-04-23 13:16:04
美女大學生被騙泰國賣園區被質疑!網友:要過5個關口,配合才行

美女大學生被騙泰國賣園區被質疑!網友:要過5個關口,配合才行

火山詩話
2026-04-23 09:28:14
“19歲女生受邀去泰國潑水節被轉賣電詐園”最新消息:園區初步同意放人,可遲遲不給具體位置,雙方仍在協商接人事宜

“19歲女生受邀去泰國潑水節被轉賣電詐園”最新消息:園區初步同意放人,可遲遲不給具體位置,雙方仍在協商接人事宜

三湘都市報
2026-04-23 17:18:29
日本記者當面挑釁,就“高市拜鬼”詢問中方,外交部這次沒慣著他

日本記者當面挑釁,就“高市拜鬼”詢問中方,外交部這次沒慣著他

墨羽怪談
2026-04-23 11:41:17
上海警方通報“女子機場兩次拒幫陌生人帶行李”:3人購買大量免稅品欲帶至境外販賣,反復糾纏10余名旅客要求“分擔行李”,已被行拘

上海警方通報“女子機場兩次拒幫陌生人帶行李”:3人購買大量免稅品欲帶至境外販賣,反復糾纏10余名旅客要求“分擔行李”,已被行拘

極目新聞
2026-04-23 14:36:35
徐靜蕾美國超市偶遇,51歲胖到認不出,黃立行也老了許多

徐靜蕾美國超市偶遇,51歲胖到認不出,黃立行也老了許多

笑飲孤鴻非
2026-04-23 20:57:09
你以為麻豆傳媒是賣片的,其實它是賣人的

你以為麻豆傳媒是賣片的,其實它是賣人的

創始人筆記
2026-04-23 21:44:50
都在問,海軍宣傳片里的“新兵何劍”,暗示中國第四艘航母嗎?

都在問,海軍宣傳片里的“新兵何劍”,暗示中國第四艘航母嗎?

樞密院十號
2026-04-23 18:31:15
2026-04-24 05:39:00
大數據文摘 incentive-icons
大數據文摘
專注大數據,每日有分享!
6852文章數 94541關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領袖

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領袖

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

普華永道賠償10億 恒大股東見到"回頭錢"

汽車要聞

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態度原創

游戲
藝術
親子
數碼
公開課

任天堂NS2銷量4倍碾壓PS5!差距懸殊 索尼難挽頹勢

藝術要聞

罕見曝光!毛澤東 36 幅經典對聯,每一幅都是絕品!

親子要聞

新華讀報|打乒乓球有助提高兒童注意力

數碼要聞

榮耀重新定義輕薄本,四月連發六款新品續航首超Mac

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版