亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

斯坦福2026AI指數(shù)報告發(fā)布:5張圖看懂AI正在發(fā)生什么

0
分享至


(來源:麻省理工科技評論)

如果你在關(guān)注 AI 新聞,你大概率已經(jīng)看得眼花繚亂了——AI 堪比淘金熱;AI 只是經(jīng)濟泡沫;AI 在搶走你的工作;AI 連個鐘表都看不懂……

近期,在這些聲音中,斯坦福大學以人為本人工智能研究所(HAI)撰寫的“AI 年度成績單” 新鮮出爐,以幫我們在噪音之中撥云見霧。

盡管有預測說 AI 發(fā)展已經(jīng)觸及到了天花板,這份報告顯示頂尖模型仍在持續(xù)變強。人們擁抱 AI 的速度,比當年接受個人電腦和互聯(lián)網(wǎng)時都要快。AI 公司創(chuàng)造收入的速度超過了以往任何一輪技術(shù)浪潮中的公司,與此同時它們也在數(shù)據(jù)中心和芯片上砸下數(shù)千億美元。而用來衡量 AI 的基準測試、用來約束 AI 的政策,以及整個就業(yè)市場,都在艱難地追趕 AI 的步伐。AI 在狂奔,而剩下的人還在找鞋穿。

這種速度是有代價的。全球 AI 數(shù)據(jù)中心的耗電量如今可達 29.6 吉瓦,足以在用電高峰時支撐整個紐約州的運轉(zhuǎn)。僅 OpenAI 的 GPT-4o 每年的耗水量,就可能超過 1200 萬人的飲用水需求。這些數(shù)據(jù)揭示了一項演進速度超過我們管理能力的技術(shù)。下面我們來看看這份報告里幾個關(guān)鍵點。



中美水準并駕齊驅(qū)

Arena 是一個由用戶驅(qū)動的 AI 模型排行榜,它讓用戶把相同的提示詞同時丟給不同的大語言模型,再根據(jù)大量用戶的投票結(jié)果給模型排名。根據(jù) Arena 的最新數(shù)據(jù),美國和中國在 AI 模型性能上幾乎并駕齊驅(qū)。2023 年初,OpenAI 憑借 ChatGPT 遙遙領(lǐng)先,但隨著 Google 和 Anthropic 相繼推出自己的模型,這一差距在 2024 年逐漸縮小。2025 年 2 月,中國的 DeepSeek 推出的 R1 一度追平了當時美國最頂尖的模型 ChatGPT。截至 2026 年 3 月,Anthropic 位居榜首,緊隨其后的是 xAI、Google 和 OpenAI。DeepSeek 和阿里巴巴等中國模型也不遑多讓。如今頂尖 AI 模型之間的差距已經(jīng)被壓縮到發(fā)絲之細,它們正在轉(zhuǎn)而比拼成本、可靠性和實際可用性。


(來源:麻省理工科技評論)

報告指出,美國和中國的 AI 優(yōu)勢各有不同。美國擁有更強的 AI 模型、更多的資本,以及估計約 5427 個數(shù)據(jù)中心,是任何其他國家的 10 倍以上;中國則在 AI 研究論文、專利和機器人領(lǐng)域領(lǐng)先。

隨著競爭加劇,OpenAI、Anthropic 和 Google 等公司已經(jīng)不再公開模型的訓練代碼、參數(shù)數(shù)量和數(shù)據(jù)集規(guī)模?!瓣P(guān)于如何預測模型的行為,我們有很多東西還不清楚,”南加州大學計算機科學家、該報告的合著者約蘭達·吉爾(Yolanda Gil)說。她表示,這種不透明讓獨立研究人員很難研究如何讓 AI 模型變得更安全。



模型能力進步飛快

盡管有聲音預測發(fā)展會進入平臺期,AI 模型卻一直在變得越來越強。按某些衡量標準,它們在旨在測試博士級科學、數(shù)學和語言理解能力的考試上已經(jīng)達到或超過了人類專家的水平。針對 AI 模型的軟件工程基準測試 SWE-bench Verified,頂尖成績從 2024 年的約 60% 躍升到 2025 年的近 100%。2025 年,一個 AI 系統(tǒng)獨立完成了天氣預報。

“這項技術(shù)持續(xù)在進步,完全沒有進入平臺期,我被震驚到了?!奔獱栒f。


(來源:麻省理工科技評論)

不過 AI 在其他很多領(lǐng)域仍然吃癟。由于模型是通過處理海量文本和圖像來學習,而不是通過親歷物理世界,它們表現(xiàn)出一種“參差不齊的智能”:機器人仍處于起步階段,只能完成 12% 的家務(wù)任務(wù);自動駕駛汽車發(fā)展稍快,Waymo 已經(jīng)在美國五個城市運行,百度的 Apollo Go 也在中國各地接送乘客。AI 也在向法律、金融等專業(yè)領(lǐng)域擴展,但目前還沒有哪個模型能主導這些領(lǐng)域



基準測試已經(jīng)落后

這些進步數(shù)據(jù)需要保留余地。斯坦福報告指出,用來追蹤 AI 進展的基準測試正被模型飛速突破,已經(jīng)跟不上節(jié)奏。有的基準本身就做得不夠嚴謹——一個流行的數(shù)學能力基準測試的錯誤率高達 42%。有的則容易被“作弊”:比如當模型直接在基準測試的數(shù)據(jù)上接受了訓練,它可以學會拿高分而并沒有真的變聰明。

由于 AI 實際使用的方式與它被測試的方式很少一致,基準測試的好成績并不總能轉(zhuǎn)化為真實世界的表現(xiàn)。而對于 AI 智能體和機器人這類復雜的交互式技術(shù),相應的基準測試幾乎還不存在。

AI 公司也越來越少公開自己的模型是如何訓練的,獨立測試得出的結(jié)論有時與公司自己報告的不一致?!昂芏喙静还_自己的模型在某些基準上的表現(xiàn),尤其是那些涉及‘負責任 AI’的基準,”吉爾說,“你不公開某項基準的表現(xiàn),這件事本身可能就說明了一些問題?!?/strong>



AI 開始影響就業(yè)

進入主流視野不到三年,AI 的用戶已經(jīng)覆蓋了全球超過一半的人口,普及速度超過了個人電腦和互聯(lián)網(wǎng)。估計有 88% 的機構(gòu)組織在使用 AI,大學生里每五人有四人用過 AI。

部署還處于早期,AI 對就業(yè)的影響很難量化。不過一些研究顯示,AI 已經(jīng)開始影響特定行業(yè)的年輕從業(yè)者。斯坦福經(jīng)濟學家 2025 年的一項研究顯示,22 到 25 歲軟件開發(fā)者的就業(yè)人數(shù)自 2022 年以來下降了近 20%。這一下降未必能全部歸因于 AI,更廣泛的宏觀經(jīng)濟環(huán)境也可能是原因,但 AI 看起來確實在其中扮演了角色


(來源:麻省理工科技評論)

雇主們表示招聘可能會繼續(xù)收緊。麥肯錫 2025 年的一項調(diào)查顯示,三分之一的組織預計 AI 將在未來一年內(nèi)縮減他們的員工規(guī)模,尤其是服務(wù)與供應鏈運營和軟件工程領(lǐng)域。報告引用的研究數(shù)據(jù)顯示,AI 在客戶服務(wù)領(lǐng)域提升了 14% 的生產(chǎn)力,在軟件開發(fā)領(lǐng)域提升了 26%,但對那些更依賴判斷力的任務(wù),生產(chǎn)力收益并未顯現(xiàn)。整體上看,AI 對經(jīng)濟的更大影響還需要更多時間才能看清楚。



公眾專家判斷相左

全球范圍來看,人們對 AI 既樂觀又焦慮:報告引用的益普索(Ipsos)調(diào)查顯示,59% 的人認為 AI 帶來的好處會多于壞處,52% 的人則說 AI 讓他們緊張。

值得注意的是,專家和普通公眾對 AI 未來的判斷差異懸殊,最大的鴻溝出現(xiàn)在對就業(yè)的預期上:73% 的專家認為 AI 將對人們的工作方式產(chǎn)生正面影響,但美國公眾里持此觀點的只有 23%。在 AI 對教育和醫(yī)療的影響上,專家同樣比公眾更樂觀,但雙方都認同 AI 將損害選舉和人際關(guān)系。


(來源:麻省理工科技評論)

在受訪國家中,美國人對本國政府監(jiān)管 AI 的信心最低——這是益普索另一項調(diào)查的結(jié)論。擔心聯(lián)邦 AI 監(jiān)管力度不夠的美國人,多于擔心監(jiān)管過度的人。



各國政府艱難立法

各國政府都在掙扎著為 AI 立規(guī)矩,過去一年里確實有一些進展。歐盟《人工智能法案》的首批禁令已生效,禁止在預測性警務(wù)和情感識別中使用 AI。日本、韓國和意大利也通過了各自的國家級 AI 法律。美國聯(lián)邦政府則走向了去監(jiān)管化,特朗普總統(tǒng)簽署行政命令,試圖限制各州對 AI 的監(jiān)管權(quán)。

盡管聯(lián)邦層面是這樣的動作,美國各州立法機構(gòu)仍然通過了創(chuàng)紀錄的 150 項 AI 相關(guān)法案。加州通過了具有標志性意義的立法,包括 SB 53 法案,要求 AI 模型開發(fā)者履行安全披露義務(wù),并為舉報者提供保護。紐約通過了 RAISE 法案,要求 AI 公司公開安全規(guī)范并報告重大安全事件。


(來源:麻省理工科技評論)

但吉爾說,盡管立法活動頻繁,監(jiān)管仍然跑在技術(shù)后面,因為我們對 AI 本身的理解還不夠。“各國政府在監(jiān)管 AI 上很謹慎,因為……我們很多事情都沒搞清楚,”她說,“我們對這些系統(tǒng)還沒有很好的把握?!?/p>

https://www.technologyreview.com/2026/04/13/1135675/want-to-understand-the-current-state-of-ai-check-out-these-charts/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
蘇翊鳴出席活動,穿肥大丑鞋小腿粗壯,素顏撞臉杜德偉有明星像

蘇翊鳴出席活動,穿肥大丑鞋小腿粗壯,素顏撞臉杜德偉有明星像

談史論天地
2026-04-15 13:49:13
默默守護20年,52歲生一胎,57歲生二胎?為愛真是拼了

默默守護20年,52歲生一胎,57歲生二胎?為愛真是拼了

悅君兮君不知
2026-04-14 21:53:14
心酸!兩屆世錦賽亞軍坦言不可能奪冠:要贏趙心童這樣的球員 沒機會

心酸!兩屆世錦賽亞軍坦言不可能奪冠:要贏趙心童這樣的球員 沒機會

晚霧空青
2026-04-15 19:02:34
外國人扎堆來中國看?。鹤≡?天賬單4萬美元,被歐美醫(yī)療逼瘋了!

外國人扎堆來中國看?。鹤≡?天賬單4萬美元,被歐美醫(yī)療逼瘋了!

古事尋蹤記
2026-04-15 07:21:44
里夫斯極限回歸,參加內(nèi)訓,被看衰!湖人還指望41歲老詹

里夫斯極限回歸,參加內(nèi)訓,被看衰!湖人還指望41歲老詹

體育新角度
2026-04-15 22:56:03
石油博弈:西方操控能源霸權(quán)戲碼

石油博弈:西方操控能源霸權(quán)戲碼

烽火瞭望者
2026-04-15 06:17:24
“中年返貧三件套”,正在吞掉一代人的存款

“中年返貧三件套”,正在吞掉一代人的存款

閱讀第一
2026-04-15 08:34:45
潛伏在中國高層的大間諜,遍布軍界政界,簡直令人唏噓

潛伏在中國高層的大間諜,遍布軍界政界,簡直令人唏噓

咸説歷史
2026-04-14 14:21:44
北京挖出大太監(jiān)李蓮英之墓,開棺后,考古人員被嚇得渾身發(fā)抖

北京挖出大太監(jiān)李蓮英之墓,開棺后,考古人員被嚇得渾身發(fā)抖

風信子的花
2026-04-15 20:52:22
家長擔心女兒太美,發(fā)明“防早戀”發(fā)型,網(wǎng)友:顏值已經(jīng)很安全了

家長擔心女兒太美,發(fā)明“防早戀”發(fā)型,網(wǎng)友:顏值已經(jīng)很安全了

蝴蝶花雨話教育
2026-04-10 13:25:02
東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

番外行
2026-03-31 08:28:28
拜仁選帥復盤:為何押注一個降級教練

拜仁選帥復盤:為何押注一個降級教練

硅嶼手記
2026-04-15 10:29:07
1-0,世界第5擊敗世界第2,日本女足復仇美國,浜野舞香一劍封喉

1-0,世界第5擊敗世界第2,日本女足復仇美國,浜野舞香一劍封喉

凌空倒鉤
2026-04-15 12:01:01
歷史性突破!人民幣首次躍居全球原油貿(mào)易第二大結(jié)算貨幣

歷史性突破!人民幣首次躍居全球原油貿(mào)易第二大結(jié)算貨幣

允華說
2026-04-15 10:35:42
現(xiàn)在二手車為啥越來越難賣?不是沒人買車,是販子們還活在十年前

現(xiàn)在二手車為啥越來越難賣?不是沒人買車,是販子們還活在十年前

復轉(zhuǎn)這些年
2026-04-15 11:25:47
劉雨鑫吃了6000家餐廳、走遍幾十個國家,他的錢其實就3個來源

劉雨鑫吃了6000家餐廳、走遍幾十個國家,他的錢其實就3個來源

老吳教育課堂
2026-04-14 07:44:56
荷蘭砸200億挽留無效!光刻機巨頭ASML為何執(zhí)意要走?真相太扎心

荷蘭砸200億挽留無效!光刻機巨頭ASML為何執(zhí)意要走?真相太扎心

大衛(wèi)聊科技
2026-04-15 13:29:37
為什么一般人指揮不了大兵團作戰(zhàn)?除了這五位,還真沒誰了

為什么一般人指揮不了大兵團作戰(zhàn)?除了這五位,還真沒誰了

祁州校尉
2026-04-14 11:00:18
許家印當庭認罪,夏海鈞資產(chǎn)凍結(jié)600億,任澤平天價薪酬要吐回

許家印當庭認罪,夏海鈞資產(chǎn)凍結(jié)600億,任澤平天價薪酬要吐回

網(wǎng)絡(luò)易不易
2026-04-15 10:17:52
《復聯(lián)5》被評為“影史最佳”,觀眾口碑炸裂,票房劍指30億美元

《復聯(lián)5》被評為“影史最佳”,觀眾口碑炸裂,票房劍指30億美元

影視高原說
2026-04-15 17:28:30
2026-04-15 23:12:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16580文章數(shù) 514879關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

豫劇團下鄉(xiāng)演出臺下觀眾痛哭流涕:觀眾超千人一半落淚

頭條要聞

豫劇團下鄉(xiāng)演出臺下觀眾痛哭流涕:觀眾超千人一半落淚

體育要聞

三球準絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財經(jīng)要聞

業(yè)績失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評測

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
數(shù)碼
家居
公開課

藝術(shù)要聞

這山水,蕩滌胸中塵埃

房產(chǎn)要聞

重磅調(diào)規(guī)!341畝商改住+中小學用地!寶龍城這把穩(wěn)了?

數(shù)碼要聞

補足有線,羅技推出Alto Keys琥珀K98M / K98S Plus機械鍵盤

家居要聞

簡而不減 暖居之道

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版