亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

能否為人工智能設(shè)計(jì)出更好的智商測(cè)試?

0
分享至




人工智能(AI)領(lǐng)域的時(shí)髦術(shù)語(yǔ)往往相當(dāng)有技術(shù)含量:感知機(jī)、卷積、變換器。這些詞匯指的都是特定的計(jì)算方法。近來(lái),有一個(gè)術(shù)語(yǔ)聽(tīng)起來(lái)很普通,卻蘊(yùn)含著革命性的意義,那就是“時(shí)間線”。如果向AI領(lǐng)域的某人詢(xún)問(wèn)他們的“時(shí)間線”,他們會(huì)告訴你預(yù)計(jì)何時(shí)能實(shí)現(xiàn)AGI,即通用人工智能,其定義有時(shí)可解讀為一種能在大多數(shù)任務(wù)中媲美人類(lèi)能力的AI技術(shù)。隨著計(jì)算機(jī)速度的提升、算法的優(yōu)化以及數(shù)據(jù)的積累,AI的成熟度日益提高,實(shí)現(xiàn)的時(shí)間線也在縮短。近期,包括OpenAI、Anthropic和谷歌DeepMind在內(nèi)的大型AI實(shí)驗(yàn)室的負(fù)責(zé)人都表示,預(yù)計(jì)將在幾年內(nèi)實(shí)現(xiàn)AGI。 能像人類(lèi)一樣思考的計(jì)算機(jī)系統(tǒng)將實(shí)現(xiàn)緊密的人機(jī)協(xié)作。雖然實(shí)現(xiàn)AGI的近期和長(zhǎng)期影響尚不明確,但可以預(yù)見(jiàn)的是,

它將在經(jīng)濟(jì)、科學(xué)發(fā)現(xiàn)和地緣政治領(lǐng)域引發(fā)變革。如果AGI進(jìn)一步發(fā)展為超級(jí)智能,它甚至可能動(dòng)搖人類(lèi)在食物鏈頂端的地位。因此,我們必須追蹤這項(xiàng)技術(shù)的發(fā)展進(jìn)程,為即將到來(lái)的劇變做好準(zhǔn)備。衡量AI的能力能讓我們據(jù)此制定法律法規(guī)、確立工程目標(biāo)、建立社會(huì)規(guī)范、調(diào)整商業(yè)模式,并從更廣泛的層面去理解“智能”。

衡量任何智力能力都絕非易事,衡量AGI則面臨著特殊的挑戰(zhàn),部分原因是人們對(duì)AGI的定義存在嚴(yán)重分歧。有些人通過(guò)它在基準(zhǔn)測(cè)試中的表現(xiàn)來(lái)定義它,有些人則依據(jù)其內(nèi)部工作原理、經(jīng)濟(jì)影響,甚至是基于一種“感覺(jué)”來(lái)定義。因此,衡量AI智能的第一步是就這個(gè)總體概念達(dá)成共識(shí)。

另一個(gè)問(wèn)題是,AI系統(tǒng)相較于人類(lèi)的優(yōu)勢(shì)和劣勢(shì)不同。因此,即使將AGI定義為“在大多數(shù)任務(wù)中能媲美人類(lèi)的AI”,我們依然可能會(huì)爭(zhēng)論哪些任務(wù)真正重要,以及應(yīng)以哪部分人類(lèi)表現(xiàn)作為標(biāo)準(zhǔn)。直接比較非常困難?!拔覀冋跇?gòu)建的是‘異形’智能體?!倍鄠惗啻髮W(xué)榮休教授、因在AI領(lǐng)域的杰出貢獻(xiàn)而獲得諾貝爾獎(jiǎng)的杰弗里·辛頓(Geoffrey Hinton)如此說(shuō)到。

盡管如此,研究人員并不氣餒,而是積極設(shè)計(jì)和提出各種測(cè)試,以期能對(duì)我們的未來(lái)提供一些洞見(jiàn)。但有個(gè)問(wèn)題依然存在:這些測(cè)試能否清楚地說(shuō)明我們是否已經(jīng)實(shí)現(xiàn)了長(zhǎng)期追求的AGI目標(biāo)?

智能的種類(lèi)是無(wú)限的,即使人類(lèi)的智能也是如此。智商測(cè)試包含了一系列涉及記憶、邏輯、空間處理、數(shù)學(xué)和詞匯等內(nèi)容的半關(guān)聯(lián)性任務(wù),可提供一種概括性的統(tǒng)計(jì)。從不同維度來(lái)看,個(gè)體在每項(xiàng)任務(wù)中的表現(xiàn)都依賴(lài)于流體智力(即實(shí)時(shí)推理能力)和晶體智力(即應(yīng)用所學(xué)知識(shí)或技能的能力)的混合。

對(duì)于高收入國(guó)家的人群而言,智商測(cè)試往往能預(yù)測(cè)學(xué)業(yè)成就、事業(yè)成功等關(guān)鍵結(jié)果。但我們不能在AI上套用對(duì)人類(lèi)的這種假設(shè),因?yàn)锳I的能力組合方式與人類(lèi)截然不同。讓機(jī)器完成為人類(lèi)設(shè)計(jì)的智商測(cè)試,其結(jié)論與測(cè)試結(jié)果可能對(duì)人類(lèi)的意義大相徑庭。

此外,還有許多智力類(lèi)型往往不在智商測(cè)試評(píng)估范圍內(nèi),甚至當(dāng)前大多數(shù)AI基準(zhǔn)測(cè)試也很難對(duì)其進(jìn)行衡量。這類(lèi)智力包括社會(huì)智力(例如進(jìn)行心理推斷的能力)與肢體智力(例如理解物體與作用力之間因果關(guān)系的能力,或協(xié)調(diào)身體適應(yīng)環(huán)境的能力)。這兩類(lèi)能力對(duì)人類(lèi)應(yīng)對(duì)復(fù)雜情境至關(guān)重要。

對(duì)人、動(dòng)物或機(jī)器進(jìn)行智力測(cè)試很困難。我們必須警惕假正例與假負(fù)例。受試者有可能僅憑投機(jī)取巧等手段顯得很聰明,著名的“聰明漢斯”就是典型案例:這匹馬表面上“會(huì)算數(shù)”,實(shí)際上依靠的是對(duì)非語(yǔ)言線索做出的反應(yīng);反之,測(cè)試對(duì)象也可能因不熟悉測(cè)試流程或存在認(rèn)知障礙而顯得愚鈍。


智力概念的界定之所以困難,還因?yàn)樗鼤?huì)隨地域和時(shí)代變化而變遷。佐治亞理工學(xué)院心理學(xué)助理教授安娜·伊萬(wàn)諾娃(Anna Ivanova)指出:“社會(huì)對(duì)智力的含義及其價(jià)值維度的認(rèn)知正在發(fā)生深刻轉(zhuǎn)變?!崩纾涸诎倏迫珪?shū)和互聯(lián)網(wǎng)出現(xiàn)之前,“大腦中儲(chǔ)備大量知識(shí)被視為智慧的重要標(biāo)志”;而今,我們?cè)絹?lái)越重視流體智力,而非晶體智力。

多年來(lái),人們?cè)啻吾槍?duì)機(jī)器設(shè)立大規(guī)模挑戰(zhàn),號(hào)稱(chēng)需要擁有媲美人類(lèi)的智慧才可完成這些挑戰(zhàn)。1958年,三位頂尖AI研究者寫(xiě)道:“國(guó)際象棋是智力游戲的巔峰......如果能制造出成功的國(guó)際象棋機(jī)器,便意味著觸及了人類(lèi)智能的核心。”他們承認(rèn),理論上有這樣的可能,即這種機(jī)器“或許能發(fā)現(xiàn)某種如同車(chē)輪之于人腿的東西,其運(yùn)作方式與人類(lèi)迥異,但本身卻極其有效且可能非常簡(jiǎn)單”。但他們?nèi)詧?jiān)持認(rèn)為“目前此類(lèi)突破未見(jiàn)端倪”。然而1997年,IBM“深藍(lán)”計(jì)算機(jī)實(shí)現(xiàn)了這種突破,它擊敗了當(dāng)時(shí)的國(guó)際象棋世界冠軍加里·卡斯帕羅夫(Garry Kasparov),但它卻連玩跳棋這種通用智能都不具備。

1950年,艾倫·圖靈提出了“模仿游戲”,其中一種游戲要求機(jī)器在文字對(duì)話(huà)中以假亂真地模仿人類(lèi)?!斑@種問(wèn)答方式似乎適合展現(xiàn)我們想要囊括的任何人類(lèi)智慧領(lǐng)域?!彼麑?xiě)道。隨后數(shù)十年里,通過(guò)圖靈測(cè)試曾被視為近乎不可能的任務(wù),這也是衡量AGI的重要指標(biāo)。

然而2025年,研究人員報(bào)告稱(chēng),在分別與真人和OpenAI的GPT-4.5進(jìn)行5分鐘對(duì)話(huà),然后判斷哪個(gè)是人類(lèi)時(shí),人們選擇AI的情況高達(dá)73%。但與此同時(shí),頂級(jí)語(yǔ)言模型卻常犯人類(lèi)幾乎不會(huì)犯的錯(cuò)誤,比如數(shù)不清“strawberry”中字母“r”出現(xiàn)了幾次。這些系統(tǒng)更像是車(chē)輪,而非擁有通用能力的“人腿”。因此,科學(xué)家仍在尋找無(wú)法被技術(shù)取代的真正類(lèi)人智能的衡量標(biāo)準(zhǔn)。

當(dāng)前有一項(xiàng)備受矚目的AGI基準(zhǔn)測(cè)試盡管并不完美,但已成為衡量大多數(shù)前沿模型的重要試金石。2019年,時(shí)任谷歌軟件工程師、現(xiàn)為AI創(chuàng)業(yè)公司Ndea創(chuàng)始人的弗朗索瓦·肖萊(Fran?ois Chollet)發(fā)表了題為《論智能的衡量》(On the Measure of Intelligence)的論文。多數(shù)人認(rèn)為智能等同于能力,通用智能等同于一系列廣泛的能力。但肖萊對(duì)智能的定義更具體,認(rèn)為智能只有一個(gè)至關(guān)重要的特定能力,即輕松獲得新能力的能力。支撐ChatGPT等工具的大語(yǔ)言模型之所以能在眾多基準(zhǔn)測(cè)試中表現(xiàn)出色,完全依賴(lài)于使用數(shù)萬(wàn)億書(shū)面詞語(yǔ)對(duì)其進(jìn)行的訓(xùn)練。遇到與訓(xùn)練數(shù)據(jù)差異很大的情況時(shí),這些模型往往難以適應(yīng)且表現(xiàn)失常。依照肖萊的標(biāo)準(zhǔn),它們?nèi)匀狈χ悄堋?/p>

為配合論文發(fā)布,肖萊創(chuàng)建了一個(gè)新的AGI基準(zhǔn)測(cè)試,名為“抽象與推理語(yǔ)料庫(kù)”(ARC)。其中包含數(shù)百道視覺(jué)謎題,每道題都配有若干示例和一道測(cè)試題。示例包含輸入網(wǎng)格和輸出網(wǎng)格,其中填滿(mǎn)了彩色方塊;測(cè)試題則只有一個(gè)輸入網(wǎng)格。要求是從示例中學(xué)習(xí)規(guī)律,并根據(jù)此規(guī)律完成測(cè)試題,生成新的輸出網(wǎng)格。


ARC側(cè)重流體智力。“解決任何問(wèn)題都需要一定的知識(shí)儲(chǔ)備,然后實(shí)時(shí)重組這些知識(shí)?!毙とR向我解釋道。要確保該測(cè)試不考察記憶性知識(shí)而考察知識(shí)重組能力,訓(xùn)練謎題應(yīng)提供所需的全部“核心先驗(yàn)知識(shí)”,包括對(duì)象連貫、對(duì)稱(chēng)性、計(jì)數(shù)等幼童已具備的常識(shí)。接受過(guò)這類(lèi)訓(xùn)練和少量示例后,你能否精準(zhǔn)調(diào)用相關(guān)知識(shí)來(lái)解決全新謎題?人類(lèi)能輕松完成大部分題目,但AI系統(tǒng)舉步維艱,至少在初期如此。最終,OpenAI開(kāi)發(fā)的o3推理模型的某個(gè)版本超越了人類(lèi)受試者的平均水平,正確率達(dá)到88%,但每道題的計(jì)算成本預(yù)估高達(dá)2萬(wàn)美元(OpenAI從未公開(kāi)發(fā)布該模型,故未將其計(jì)入排行榜)。

2025年3月,肖萊推出了難度升級(jí)的新版本,名為“ARC-AGI-2”,由其新設(shè)立的非營(yíng)利組織ARC Prize基金會(huì)監(jiān)管。該機(jī)構(gòu)表示:“我們的使命是通過(guò)持久性基準(zhǔn)測(cè)試,成為實(shí)現(xiàn)AGI的北極星?!盇RC Prize設(shè)立了百萬(wàn)美元獎(jiǎng)金,主要獎(jiǎng)勵(lì)那些訓(xùn)練出符合以下條件的AI的團(tuán)隊(duì):在12小時(shí)內(nèi)使用4個(gè)圖形處理器,解答了120道新謎題,準(zhǔn)確率達(dá)到85%。新謎題比2019年版本更復(fù)雜,有時(shí)需要應(yīng)用多種規(guī)則、進(jìn)行多步推理或解讀符號(hào)含義。目前人類(lèi)平均正確率為60%,而截至本文撰稿時(shí),最佳AI的正確率僅約16%。


AI專(zhuān)家們肯定了ARC的價(jià)值,但也指出了它的局限。伊利諾伊大學(xué)厄巴納-香檳分校計(jì)算機(jī)科學(xué)家尤佳軒認(rèn)為,ARC是一種“非常好的理論基準(zhǔn)測(cè)試”,能揭示算法的運(yùn)作機(jī)制,但“未充分考慮AI應(yīng)用中的現(xiàn)實(shí)復(fù)雜性,比如社會(huì)推理任務(wù)”。

圣塔菲研究所的計(jì)算機(jī)科學(xué)家梅拉尼·米切爾(Melanie Mitchell)指出,該測(cè)試“捕捉到了人類(lèi)某些有趣的能力”,例如,從少量示例中提取新規(guī)律的能力。但鑒于其任務(wù)形式不夠多樣化,她表示:“我不認(rèn)為這能涵蓋人們所說(shuō)的通用智能。

盡管存在這些局限,ARC-AGI-2或許仍是當(dāng)前先進(jìn)AI與普通人類(lèi)表現(xiàn)差距最大的基準(zhǔn)測(cè)試,這使其成為了衡量AGI進(jìn)步的重要標(biāo)尺。更重要的是,ARC仍在持續(xù)發(fā)展。肖萊表示AI可能在一兩年內(nèi)就能在當(dāng)前測(cè)試中達(dá)到人類(lèi)水平,他已經(jīng)在開(kāi)發(fā)ARC-AGI-3。每個(gè)任務(wù)都將如同微型電子游戲,參與者需要理解相關(guān)概念、探索可行操作并最終達(dá)成目標(biāo)。

研究人員也在不斷推出新的基準(zhǔn)來(lái)探究通用智能的不同維度,每個(gè)新基準(zhǔn)同時(shí)也揭示了我們認(rèn)知版圖中尚未填補(bǔ)的空白。

最近,一篇論文介紹了一種名為“General-Bench”的基準(zhǔn)測(cè)試,它使用了文本、圖像、視頻、音頻和3D模型這5種輸入模態(tài),可通過(guò)數(shù)百項(xiàng)任務(wù)檢驗(yàn)AI系統(tǒng)的識(shí)別、推理、創(chuàng)造、倫理判斷能力,以及其他理解和生成資料的能力。理想的AGI應(yīng)當(dāng)展現(xiàn)協(xié)同效應(yīng),在各項(xiàng)任務(wù)中融會(huì)貫通多種能力,從而超越最頂尖的AI專(zhuān)家。但目前還沒(méi)有任何AI能同時(shí)駕馭5種模態(tài)。

其他基準(zhǔn)測(cè)試還涉及虛擬世界。2025年4月,《自然》雜志上的一篇論文介紹了谷歌DeepMind開(kāi)發(fā)的通用算法“Dreamer”,該算法已學(xué)會(huì)執(zhí)行超過(guò)150項(xiàng)任務(wù),包括玩街機(jī)游戲、操控虛擬機(jī)器人、在《我的世界》游戲中獲取鉆石等。這些任務(wù)要求具備感知、探索、長(zhǎng)期規(guī)劃和交互能力,但尚不清楚Dreamer處理現(xiàn)實(shí)世界復(fù)雜問(wèn)題的能力如何。該論文的第一作者丹尼亞爾·哈夫納(Danijar Hafner)指出,操控電子游戲角色比操控真實(shí)機(jī)器人簡(jiǎn)單,“游戲角色永遠(yuǎn)不會(huì)摔得臉著地”。這些任務(wù)還缺乏與人類(lèi)的深度互動(dòng),以及結(jié)合手勢(shì)和環(huán)境的語(yǔ)言理解能力。他說(shuō):“理想情況下,你對(duì)家務(wù)機(jī)器人說(shuō)‘把碗碟放進(jìn)那個(gè)櫥柜,不是那邊’,同時(shí)用手指向(某個(gè)櫥柜),它就能理解?!惫蚣{表示其團(tuán)隊(duì)正在努力提升模擬和任務(wù)的真實(shí)度。

除現(xiàn)有基準(zhǔn)測(cè)試外,專(zhuān)家們對(duì)于理想示范形態(tài)的爭(zhēng)論由來(lái)已久。早在1970年,AI先驅(qū)馬文·明斯基就對(duì)《生活》(Life)雜志預(yù)言:“未來(lái)3到8年,我們將制造出具備普通人類(lèi)水平的通用智能機(jī)器。我指的是一臺(tái)能閱讀莎士比亞、能給汽車(chē)上潤(rùn)滑油、玩得轉(zhuǎn)辦公室政治、會(huì)說(shuō)笑話(huà)、會(huì)吵架的機(jī)器。”如果能對(duì)“辦公室政治”進(jìn)行可操作化定義,這套任務(wù)組合倒不失為不錯(cuò)的起點(diǎn)。

2024年《工程》(Engineering)雜志上發(fā)表的一篇論文提出了“通”測(cè)試。該測(cè)試將為虛擬人物隨機(jī)分配任務(wù),不僅檢驗(yàn)其理解能力,更評(píng)估其價(jià)值判斷。例如,AI可能突然遇到掉在地上的錢(qián)或正在哭的嬰兒,研究人員則可借此機(jī)會(huì)觀察AI如何應(yīng)對(duì)。該論文的作者認(rèn)為,基準(zhǔn)測(cè)試應(yīng)評(píng)估AI自主探索和設(shè)定目標(biāo)的能力、與人類(lèi)價(jià)值觀的相符情況、因果理解能力、虛擬/實(shí)體軀體操控能力。此外,基準(zhǔn)測(cè)試還應(yīng)能生成無(wú)限多個(gè)涉及動(dòng)態(tài)實(shí)物和社會(huì)交互的任務(wù)。

明斯基等其他學(xué)者則提議,需要進(jìn)行不同程度的現(xiàn)實(shí)世界交互測(cè)試,例如在陌生廚房泡咖啡、將10萬(wàn)美元增值至百萬(wàn)美元、在大學(xué)校園就讀并獲取學(xué)位等。遺憾的是,此類(lèi)測(cè)試中有一些既難以實(shí)施又存在現(xiàn)實(shí)風(fēng)險(xiǎn)。例如,AI可能通過(guò)詐騙手段來(lái)賺取百萬(wàn)資金。

筆者曾問(wèn)過(guò)諾貝爾獎(jiǎng)得主辛頓,AI最難掌握哪些技能。“我過(guò)去認(rèn)為,理解他人心思這類(lèi)能力會(huì)是其瓶頸?!彼f(shuō),“但它已經(jīng)具備了一些這種能力,甚至已經(jīng)能進(jìn)行欺騙?!保ㄗ罱豁?xiàng)多所大學(xué)的聯(lián)合研究顯示,在誘導(dǎo)受試者選擇錯(cuò)誤答案方面,大語(yǔ)言模型已超越人類(lèi)。)他繼續(xù)說(shuō):“所以,我現(xiàn)在的答案是管道維修。修老房子的管道需要探入狹窄的縫隙,還要以特定方式擰緊零件。我認(rèn)為至少未來(lái)10年內(nèi)AI無(wú)法完成這項(xiàng)任務(wù)?!?/p>


AI是否需要能執(zhí)行涉及實(shí)物的任務(wù)才算是AGI,學(xué)界對(duì)此始終存在爭(zhēng)論。谷歌DeepMind一篇關(guān)于衡量AGI級(jí)別的論文持否定立場(chǎng),并主張這類(lèi)智能只需通過(guò)軟件展現(xiàn)。他們認(rèn)為,實(shí)物操作能力是AGI的附加能力而非必要能力。

圣塔菲研究所的米切爾提出,我們應(yīng)當(dāng)測(cè)試AI承擔(dān)整個(gè)工作崗位任務(wù)所需的能力。她指出,AI雖然能完成人類(lèi)放射科醫(yī)生的許多任務(wù),但無(wú)法完全取代人類(lèi)醫(yī)生,因?yàn)檫@份工作包含大量連醫(yī)師本人都未意識(shí)到的隱性工作,比如決定要做什么以及應(yīng)對(duì)突發(fā)狀況等?!艾F(xiàn)實(shí)世界中有可能發(fā)生的意外情況實(shí)在太多了?!彼f(shuō)。某些掃地機(jī)器人因未接受過(guò)識(shí)別狗糞便的訓(xùn)練,會(huì)將狗糞便抹滿(mǎn)地毯?!霸跇?gòu)建智能系統(tǒng)時(shí),有太多此類(lèi)無(wú)法預(yù)見(jiàn)的突發(fā)狀況?!?/p>

部分科學(xué)家表示,我們不僅要觀察系統(tǒng)表現(xiàn),更需探查其內(nèi)部運(yùn)作機(jī)制。加拿大不列顛哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)家杰夫·克倫(Jeff Clune)聯(lián)合發(fā)表的論文指出,深度學(xué)習(xí)常導(dǎo)致AI系統(tǒng)形成“割裂的糾纏表征”(fractured entangled representations),基本上就是大量臨時(shí)拼湊的捷徑機(jī)制。而人類(lèi)則善于尋找普適且合理的通用規(guī)律。某個(gè)AI系統(tǒng)或許能在特定測(cè)試中表現(xiàn)得很智能,但如果不了解其內(nèi)部機(jī)制,它在新場(chǎng)景下應(yīng)用錯(cuò)誤的規(guī)則可能引發(fā)意外后果。

作家劉易斯·卡羅爾(Lewis Car-roll)曾描寫(xiě)過(guò)這樣一個(gè)角色:他使用“一英里代表一英里”比例尺的全國(guó)地圖,最終索性將整個(gè)國(guó)家本身當(dāng)作地圖。在智力測(cè)試領(lǐng)域,要精準(zhǔn)地體現(xiàn)個(gè)體在特定情境中的表現(xiàn),最佳方式就是將其置于這個(gè)情境中進(jìn)行檢驗(yàn)。按照這一邏輯,對(duì)AGI的有佳測(cè)試或許是讓機(jī)器人完整度過(guò)人類(lèi)的一生,例如將孩子撫養(yǎng)成年。

“最終,檢驗(yàn)AI能力的真實(shí)標(biāo)準(zhǔn)是它們?cè)诂F(xiàn)實(shí)世界中的作為。”克倫告訴我,“因此相較于基準(zhǔn)測(cè)試,我更關(guān)注(AI)有了哪些科學(xué)發(fā)現(xiàn)、自動(dòng)完成了哪些工作。如果人類(lèi)雇用AI而非人類(lèi)來(lái)完成工作,并且堅(jiān)持執(zhí)行這一決定,這本身就是對(duì)AI能力的強(qiáng)烈認(rèn)可。”但有些時(shí)候,在使用AI替代人類(lèi)之前,我們希望預(yù)先了解其表現(xiàn)水平。

我們或許永遠(yuǎn)無(wú)法就AGI或“像人一樣”的AI的定義達(dá)成共識(shí),也無(wú)法確定怎樣證實(shí)它就是AGI。隨著AI技術(shù)的進(jìn)步,機(jī)器仍會(huì)犯錯(cuò),人們也總會(huì)借此宣稱(chēng)AI并非真正的智能。近期,在一個(gè)專(zhuān)題討論會(huì)上,主持人問(wèn)到了佐治亞理工學(xué)院心理學(xué)家伊萬(wàn)諾娃關(guān)于AGI時(shí)間線的問(wèn)題?!坝形粚W(xué)者認(rèn)為它永遠(yuǎn)不可能實(shí)現(xiàn),”她告訴我,“而另一位則表示它已然出現(xiàn)。”因此,“AGI”這個(gè)術(shù)語(yǔ)或許只是表達(dá)目標(biāo)或擔(dān)憂(yōu)的一個(gè)便捷符號(hào),其實(shí)際價(jià)值可能有限。在大多數(shù)情況下,在提及這個(gè)詞時(shí),我們都該為其加上星號(hào)注釋?zhuān)瑯?biāo)明具體的基準(zhǔn)測(cè)試。

來(lái)源:悅智網(wǎng)

編輯:東君

轉(zhuǎn)載內(nèi)容僅代表作者觀點(diǎn)

不代表中科院物理所立場(chǎng)

如需轉(zhuǎn)載請(qǐng)聯(lián)系原公眾號(hào)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
你焦慮了一生,其實(shí)沒(méi)有意義。

你焦慮了一生,其實(shí)沒(méi)有意義。

老陸不老
2026-04-13 20:05:02
張婉婷曝宋寧峰近況:他每天就是下跪、哭、悔過(guò),就是死都不離開(kāi)

張婉婷曝宋寧峰近況:他每天就是下跪、哭、悔過(guò),就是死都不離開(kāi)

觀魚(yú)聽(tīng)雨
2026-04-15 22:30:00
為什么一般人指揮不了大兵團(tuán)作戰(zhàn)?除了這五位,還真沒(méi)誰(shuí)了

為什么一般人指揮不了大兵團(tuán)作戰(zhàn)?除了這五位,還真沒(méi)誰(shuí)了

祁州校尉
2026-04-14 11:00:18
ETF有望成為4月主力增量資金!這5只ETF正被機(jī)構(gòu)瘋狂掃貨

ETF有望成為4月主力增量資金!這5只ETF正被機(jī)構(gòu)瘋狂掃貨

小白鴿財(cái)經(jīng)
2026-04-15 20:30:03
新加坡已經(jīng)成功預(yù)測(cè)中美沖突,一旦爆發(fā),美稱(chēng)中國(guó)不能攻打美本土

新加坡已經(jīng)成功預(yù)測(cè)中美沖突,一旦爆發(fā),美稱(chēng)中國(guó)不能攻打美本土

起喜電影
2026-04-16 01:05:59
大膽去做,不要怕,沒(méi)有人在乎。就算有人在乎,人又算什么東西

大膽去做,不要怕,沒(méi)有人在乎。就算有人在乎,人又算什么東西

清風(fēng)拂心
2026-04-07 10:15:07
信號(hào)!上海最體面的豪宅開(kāi)發(fā)商,五年來(lái)首次虧損

信號(hào)!上海最體面的豪宅開(kāi)發(fā)商,五年來(lái)首次虧損

花木蘭Channel
2026-04-14 15:26:32
陰雨綿長(zhǎng)像犯春困!春晴三日緊急上線湖北,30℃夏韻初現(xiàn)

陰雨綿長(zhǎng)像犯春困!春晴三日緊急上線湖北,30℃夏韻初現(xiàn)

極目新聞
2026-04-15 18:49:32
英軍上將警告:若臺(tái)海開(kāi)戰(zhàn),英軍將同時(shí)打擊中俄,重點(diǎn)對(duì)付中!

英軍上將警告:若臺(tái)海開(kāi)戰(zhàn),英軍將同時(shí)打擊中俄,重點(diǎn)對(duì)付中!

別吵吵
2026-04-15 09:49:16
劉震云:一個(gè)媽媽最大的悲哀,就是輕易向別人透露子女這3件隱私,真的很傻!

劉震云:一個(gè)媽媽最大的悲哀,就是輕易向別人透露子女這3件隱私,真的很傻!

新浪財(cái)經(jīng)
2026-04-10 12:43:57
黃巢雖然殘忍,卻做了件好事:為我國(guó)破除了危害近600年的禍根

黃巢雖然殘忍,卻做了件好事:為我國(guó)破除了危害近600年的禍根

銘記歷史呀
2026-03-26 11:26:09
“你真美,是不是嫌我老?”:手機(jī)被沒(méi)收后,女子用手表錄16分鐘

“你真美,是不是嫌我老?”:手機(jī)被沒(méi)收后,女子用手表錄16分鐘

江山揮筆
2026-04-14 10:48:18
美國(guó)終于開(kāi)始害怕?比稀土更致命王牌出手了,萬(wàn)斯:中國(guó)要冷靜

美國(guó)終于開(kāi)始害怕?比稀土更致命王牌出手了,萬(wàn)斯:中國(guó)要冷靜

混沌錄
2026-04-10 22:53:19
鴻蒙五界3月銷(xiāo)量啞火,問(wèn)界獨(dú)大,四界陪跑,華為難救二線車(chē)企?

鴻蒙五界3月銷(xiāo)量啞火,問(wèn)界獨(dú)大,四界陪跑,華為難救二線車(chē)企?

王新喜
2026-04-14 19:49:11
基米希:堅(jiān)持看到最后是值的,孩子們明天第三節(jié)課再去上學(xué)吧

基米希:堅(jiān)持看到最后是值的,孩子們明天第三節(jié)課再去上學(xué)吧

懂球帝
2026-04-16 05:59:13
沃爾沃XC70汽車(chē)99周年感恩版上市,限時(shí)價(jià)24.99萬(wàn)元起

沃爾沃XC70汽車(chē)99周年感恩版上市,限時(shí)價(jià)24.99萬(wàn)元起

IT之家
2026-04-15 22:42:43
斯波直言三球該被驅(qū)逐!鮑爾準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

斯波直言三球該被驅(qū)逐!鮑爾準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

顏小白的籃球夢(mèng)
2026-04-15 11:00:09
悲催!僅5人的小公司,老板負(fù)債50萬(wàn),告知兩員工公司撐不下去了

悲催!僅5人的小公司,老板負(fù)債50萬(wàn),告知兩員工公司撐不下去了

火山詩(shī)話(huà)
2026-04-15 06:54:16
歐冠4強(qiáng)出爐!半決賽對(duì)陣:大巴黎拜仁迎巔峰對(duì)決,馬競(jìng)VS阿森納

歐冠4強(qiáng)出爐!半決賽對(duì)陣:大巴黎拜仁迎巔峰對(duì)決,馬競(jìng)VS阿森納

我愛(ài)英超
2026-04-16 05:13:52
打起來(lái)了,美軍在國(guó)際水域不宣而戰(zhàn),2人當(dāng)場(chǎng)死亡,英法俄失聲

打起來(lái)了,美軍在國(guó)際水域不宣而戰(zhàn),2人當(dāng)場(chǎng)死亡,英法俄失聲

至死不渝的愛(ài)情
2026-04-15 20:31:40
2026-04-16 06:23:00
中科院物理所 incentive-icons
中科院物理所
愛(ài)上物理,改變世界。
10069文章數(shù) 136524關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶(hù)又怎樣?Anthropic直接貼臉

頭條要聞

美國(guó)發(fā)布新一輪涉伊朗制裁措施

頭條要聞

美國(guó)發(fā)布新一輪涉伊朗制裁措施

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂(lè)要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛(ài)

財(cái)經(jīng)要聞

業(yè)績(jī)失速的Lululemon:"健康"人設(shè)崩塌?

汽車(chē)要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

親子
游戲
時(shí)尚
教育
數(shù)碼

親子要聞

孕婦200買(mǎi)水果被罵后續(xù):已終止妊娠,男方崩潰砸東西,網(wǎng)友炸鍋

《GTA6》搶劫玩法泄露引熱議!NPC與警察全面升級(jí)

赫本愛(ài)穿的傘裙,好優(yōu)雅!

教育要聞

小升初求陰影面積,等積變換,會(huì)者秒算

數(shù)碼要聞

明基新款顯示器首發(fā)12499元:4K專(zhuān)業(yè)級(jí)色彩校準(zhǔn) 根據(jù)環(huán)境光自動(dòng)調(diào)整

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版