无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大模型真的“理解”現(xiàn)實世界嗎?研究表明它們確實理解

0
分享至


來源:https://techxplore.com/news/2026-04-ai-language-real-world-basic.html

圖片來源:Pixabay/CC0 公有領(lǐng)域

人工智能聊天機器人對世界的大部分認知,都是通過大量從互聯(lián)網(wǎng)上獲取文本——其中包含所有事實、謊言、知識和胡說八道。基于這些輸入,人工智能語言模型是否有可能對現(xiàn)實世界有“理解”?事實證明,它們確實有——或者至少有某種理解。這是布朗大學(xué)研究人員一項新研究的結(jié)果,該研究將于4月25日星期六在巴西里約熱內(nèi)盧舉行的國際學(xué)習(xí)表征會議上發(fā)表。該研究發(fā)布在arXiv預(yù)印本服務(wù)器上。

這項題為《這只是幻想嗎?》的研究語言模型表示反映了人類對事件合理性的判斷,深入探討了多個人工智能語言模型的內(nèi)部,尋找它們能夠概念化事件與場景之間常見、不太可能、不可能甚至完全荒謬的跡象。

“這項工作揭示了一些證據(jù),表明語言模型編碼了類似現(xiàn)實世界的因果約束,”布朗大學(xué)博士生邁克爾·萊波里(Michael Lepori)說,他是該研究的領(lǐng)導(dǎo)者。“除了編碼這些約束外,它們還以一種能夠預(yù)測人類對這些類別判斷的方式進行編碼。”

Lepori的研究探討計算機科學(xué)與人類認知的交叉點。他的指導(dǎo)來自計算機科學(xué)教授Ellie Pavlick和認知與心理科學(xué)教授Thomas Serre,兩人均為布朗大學(xué)卡尼腦科學(xué)研究所的教員成員及研究共同作者。

在這項研究中,研究人員設(shè)計了一個實驗,測試語言模型如何解釋描述不同合理性事件的句子。有些陳述描述了常見場景:例如,“有人用冰塊冷卻了一杯飲料。”

有些情景不太可能或不太可能:“有人用雪冷卻了一杯飲料。”

有些簡直是不可能的:“有人用火冷卻了一杯飲料。”有些說法荒謬:“有人用昨天來冷卻飲料。”

對于每個輸入,研究人員都分析了AI模型內(nèi)生成的數(shù)學(xué)狀態(tài),這種方法被稱為機制性可解釋性。

“機械可解釋性可以恰當(dāng)?shù)乇幻枋鰹槿斯ぶ悄芟到y(tǒng)的神經(jīng)科學(xué),”Lepori 說。“它試圖逆向工程模型在面對特定輸入時的行為。你可以把它看作是理解機器'大腦狀態(tài)'中編碼的內(nèi)容。”

通過比較來自不同類別的句子對生成的大腦狀態(tài)差異——常見與不太可能、不太可能與不可能等——研究人員可以了解模型內(nèi)部是否以及區(qū)分類別的程度。實驗在多個不同的開源語言模型上重復(fù)進行,包括Open AI的GPT 2、Meta的Llama 3.2和谷歌的Gemma 2,以獲得“模型無關(guān)”的概念,了解這些模型在類別間的區(qū)分能力。

研究發(fā)現(xiàn),足夠規(guī)模的模型確實會發(fā)展出與每個合理性類別高度相關(guān)的獨特數(shù)學(xué)模式(向量)。這些向量甚至能以大約85%的準確率區(qū)分最相似的類別——如不可能事件與不可能事件。

此外,Lepori 表示,研究揭示的向量反映了人類對陳述可能屬于哪類的不確定性。以“有人用帽子擦地板”為例。當(dāng)人們聽到這句話時,可能會對它代表不可能的事情或可能性存在分歧。在研究中,研究人員分析了這些向量,以了解人工智能系統(tǒng)對這些陳述的模糊性,并將其與人類參與者的調(diào)查結(jié)果進行比較。

“我們展示了模型實際上相當(dāng)準確地捕捉了人類的不確定性,”萊波里說。“在比如說,50%的人認為某個陳述不可能,50%的人認為它不太可能發(fā)生的情況下,模型也賦予了大約50%的概率。”

綜合來看,這些結(jié)果表明現(xiàn)代人工智能語言模型確實能夠發(fā)展出反映人類理解的現(xiàn)實世界理解。研究發(fā)現(xiàn),這些向量開始出現(xiàn)在參數(shù)數(shù)超過二十億的模型中,而與當(dāng)今超過萬億參數(shù)的模型相比,這個數(shù)量相當(dāng)小。

更廣泛地說,研究人員表示,這類機制性可解釋性研究有助于更好地理解人工智能模型所知道的內(nèi)容及其得知過程。研究人員表示,這將有助于開發(fā)更智能、更值得信賴的模型。

閱讀最新前沿科技趨勢報告,請訪問21世紀關(guān)鍵技術(shù)研究院的“未來知識庫”


未來知識庫是 “21世紀關(guān)鍵技術(shù)研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級智能,數(shù)智大腦、能源、軍事、經(jīng)濟、人類風(fēng)險等等領(lǐng)域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

(加入未來知識庫,全部資料免費閱讀和下載)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
5月,遇到這菜別手軟,一次囤20斤,隨手一泡,從夏吃到冬,好吃

5月,遇到這菜別手軟,一次囤20斤,隨手一泡,從夏吃到冬,好吃

阿龍美食記
2026-05-16 16:38:28
專家:廣西柳州5.2級地震系逆沖型破裂

專家:廣西柳州5.2級地震系逆沖型破裂

中國青年報
2026-05-18 21:09:10
當(dāng)年拳打蘋果腳踢三星的HTC,為何一夜消失了?

當(dāng)年拳打蘋果腳踢三星的HTC,為何一夜消失了?

強大氣場的注視
2026-05-14 17:04:54
貝森特想擺譜,進大會堂時,不戴胸標,結(jié)果被攔下,現(xiàn)場略顯窘迫

貝森特想擺譜,進大會堂時,不戴胸標,結(jié)果被攔下,現(xiàn)場略顯窘迫

魔都姐姐雜談
2026-05-18 12:34:03
4年1.8億美元!里弗斯被哄搶,湖人面臨重組,東契奇或成最大贏家

4年1.8億美元!里弗斯被哄搶,湖人面臨重組,東契奇或成最大贏家

兵哥籃球故事
2026-05-18 20:13:17
巴西足壇內(nèi)馬爾丑聞!安切洛蒂名單公布前夕因失誤被換下,遭遇羞辱

巴西足壇內(nèi)馬爾丑聞!安切洛蒂名單公布前夕因失誤被換下,遭遇羞辱

綠茵情報局
2026-05-18 02:00:55
自廢武功!盧偉出現(xiàn)了3個錯誤,坑慘了上海隊

自廢武功!盧偉出現(xiàn)了3個錯誤,坑慘了上海隊

體育哲人
2026-05-18 10:42:03
高管集體降薪! 江淮汽車被大眾“拖垮”:季度又虧6億,全靠華為200萬“救命車”?

高管集體降薪! 江淮汽車被大眾“拖垮”:季度又虧6億,全靠華為200萬“救命車”?

新浪財經(jīng)
2026-05-18 17:36:36
暴漲17倍,上市14個交易日登頂A股一哥位置,這只新股為何這么狂

暴漲17倍,上市14個交易日登頂A股一哥位置,這只新股為何這么狂

丁丁鯉史紀
2026-05-18 14:56:17
全職爸爸靠帥臉火了,全網(wǎng)卻為他的“豪門婚姻”吵翻了

全職爸爸靠帥臉火了,全網(wǎng)卻為他的“豪門婚姻”吵翻了

媽咪OK
2026-05-08 19:54:01
他接受紀律審查和監(jiān)察調(diào)查

他接受紀律審查和監(jiān)察調(diào)查

錫望
2026-05-18 11:57:24
廣西柳州5.2級地震已致3人失聯(lián),房屋倒塌13棟,市民回憶驚險瞬間:轟隆一下就塌了

廣西柳州5.2級地震已致3人失聯(lián),房屋倒塌13棟,市民回憶驚險瞬間:轟隆一下就塌了

大風(fēng)新聞
2026-05-18 08:35:02
柳州為何會發(fā)生5.2級地震?未來會不會發(fā)生5級以上地震?專家:當(dāng)?shù)鼐邆渲械鹊卣饦?gòu)造背景,但不具備巨大地震構(gòu)造條件

柳州為何會發(fā)生5.2級地震?未來會不會發(fā)生5級以上地震?專家:當(dāng)?shù)鼐邆渲械鹊卣饦?gòu)造背景,但不具備巨大地震構(gòu)造條件

極目新聞
2026-05-18 11:04:26
后臺最硬女神探,遇到破不了的案,直接冤枉路人死刑!

后臺最硬女神探,遇到破不了的案,直接冤枉路人死刑!

莫地方
2026-05-16 01:40:03
主角劉浩存登場,卻再看不到小白鞋、八一和黑娃,秦海璐也掛機了

主角劉浩存登場,卻再看不到小白鞋、八一和黑娃,秦海璐也掛機了

我來我看見
2026-05-17 20:05:14
特朗普連發(fā)15張圖分享“中國記憶”,“不可思議的中國”依然刷屏

特朗普連發(fā)15張圖分享“中國記憶”,“不可思議的中國”依然刷屏

軍武咖
2026-05-18 19:01:46
這才是頂薪球員應(yīng)有的水準!騎士后場到了核心能否繼續(xù)保持效率?

這才是頂薪球員應(yīng)有的水準!騎士后場到了核心能否繼續(xù)保持效率?

稻谷與小麥
2026-05-18 22:42:35
為什么歐美人不炒菜,只有中國有?美國教授:中國活在原始時代

為什么歐美人不炒菜,只有中國有?美國教授:中國活在原始時代

抽象派大師
2026-05-17 02:08:19
孩子展廳誤踩電視賠五百,家長堅稱無責(zé)是小米故意埋雷

孩子展廳誤踩電視賠五百,家長堅稱無責(zé)是小米故意埋雷

映射生活的身影
2026-05-17 21:17:42
雪上加霜!深圳隊2米19主力中鋒意外重傷

雪上加霜!深圳隊2米19主力中鋒意外重傷

體育哲人
2026-05-18 20:46:17
2026-05-18 22:55:00
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4744文章數(shù) 37464關(guān)注度
往期回顧 全部

科技要聞

同一公司,有人獎金是6年工資,我卻只有半年

頭條要聞

伊朗披露穆杰塔巴受傷細節(jié):未導(dǎo)致面容損毀或肢體傷殘

頭條要聞

伊朗披露穆杰塔巴受傷細節(jié):未導(dǎo)致面容損毀或肢體傷殘

體育要聞

58順位的保羅,最強第三中鋒

娛樂要聞

票房會破14億!口碑第一電影出現(xiàn)了

財經(jīng)要聞

中國芯片,怎么突然不便宜了?

汽車要聞

歸元S平臺首款車型 魏牌V9X上市 34.98萬元起

態(tài)度原創(chuàng)

時尚
家居
本地
健康
軍事航空

戛納電影節(jié)|61歲鞏俐驚艷世界,她活出了所有女人都想成為的樣子

家居要聞

觀山隱秀 心靈沉淀

本地新聞

用蘇繡的方式,打開江西婺源

專家揭秘干細胞回輸?shù)陌踩L(fēng)險

軍事要聞

莫斯科遭一年多來最大規(guī)模無人機襲擊 3死18傷

無障礙瀏覽 進入關(guān)懷版