亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

斯坦福2026AI指數(shù)報(bào)告發(fā)布:5張圖看懂AI正在發(fā)生什么

0
分享至


(來源:麻省理工科技評(píng)論)

如果你在關(guān)注 AI 新聞,你大概率已經(jīng)看得眼花繚亂了——AI 堪比淘金熱;AI 只是經(jīng)濟(jì)泡沫;AI 在搶走你的工作;AI 連個(gè)鐘表都看不懂……

近期,在這些聲音中,斯坦福大學(xué)以人為本人工智能研究所(HAI)撰寫的“AI 年度成績(jī)單” 新鮮出爐,以幫我們?cè)谠胍糁袚茉埔婌F。

盡管有預(yù)測(cè)說 AI 發(fā)展已經(jīng)觸及到了天花板,這份報(bào)告顯示頂尖模型仍在持續(xù)變強(qiáng)。人們擁抱 AI 的速度,比當(dāng)年接受個(gè)人電腦和互聯(lián)網(wǎng)時(shí)都要快。AI 公司創(chuàng)造收入的速度超過了以往任何一輪技術(shù)浪潮中的公司,與此同時(shí)它們也在數(shù)據(jù)中心和芯片上砸下數(shù)千億美元。而用來衡量 AI 的基準(zhǔn)測(cè)試、用來約束 AI 的政策,以及整個(gè)就業(yè)市場(chǎng),都在艱難地追趕 AI 的步伐。AI 在狂奔,而剩下的人還在找鞋穿。

這種速度是有代價(jià)的。全球 AI 數(shù)據(jù)中心的耗電量如今可達(dá) 29.6 吉瓦,足以在用電高峰時(shí)支撐整個(gè)紐約州的運(yùn)轉(zhuǎn)。僅 OpenAI 的 GPT-4o 每年的耗水量,就可能超過 1200 萬人的飲用水需求。這些數(shù)據(jù)揭示了一項(xiàng)演進(jìn)速度超過我們管理能力的技術(shù)。下面我們來看看這份報(bào)告里幾個(gè)關(guān)鍵點(diǎn)。



中美水準(zhǔn)并駕齊驅(qū)

Arena 是一個(gè)由用戶驅(qū)動(dòng)的 AI 模型排行榜,它讓用戶把相同的提示詞同時(shí)丟給不同的大語言模型,再根據(jù)大量用戶的投票結(jié)果給模型排名。根據(jù) Arena 的最新數(shù)據(jù),美國(guó)和中國(guó)在 AI 模型性能上幾乎并駕齊驅(qū)。2023 年初,OpenAI 憑借 ChatGPT 遙遙領(lǐng)先,但隨著 Google 和 Anthropic 相繼推出自己的模型,這一差距在 2024 年逐漸縮小。2025 年 2 月,中國(guó)的 DeepSeek 推出的 R1 一度追平了當(dāng)時(shí)美國(guó)最頂尖的模型 ChatGPT。截至 2026 年 3 月,Anthropic 位居榜首,緊隨其后的是 xAI、Google 和 OpenAI。DeepSeek 和阿里巴巴等中國(guó)模型也不遑多讓。如今頂尖 AI 模型之間的差距已經(jīng)被壓縮到發(fā)絲之細(xì),它們正在轉(zhuǎn)而比拼成本、可靠性和實(shí)際可用性。


(來源:麻省理工科技評(píng)論)

報(bào)告指出,美國(guó)和中國(guó)的 AI 優(yōu)勢(shì)各有不同。美國(guó)擁有更強(qiáng)的 AI 模型、更多的資本,以及估計(jì)約 5427 個(gè)數(shù)據(jù)中心,是任何其他國(guó)家的 10 倍以上;中國(guó)則在 AI 研究論文、專利和機(jī)器人領(lǐng)域領(lǐng)先。

隨著競(jìng)爭(zhēng)加劇,OpenAI、Anthropic 和 Google 等公司已經(jīng)不再公開模型的訓(xùn)練代碼、參數(shù)數(shù)量和數(shù)據(jù)集規(guī)模?!瓣P(guān)于如何預(yù)測(cè)模型的行為,我們有很多東西還不清楚,”南加州大學(xué)計(jì)算機(jī)科學(xué)家、該報(bào)告的合著者約蘭達(dá)·吉爾(Yolanda Gil)說。她表示,這種不透明讓獨(dú)立研究人員很難研究如何讓 AI 模型變得更安全。



模型能力進(jìn)步飛快

盡管有聲音預(yù)測(cè)發(fā)展會(huì)進(jìn)入平臺(tái)期,AI 模型卻一直在變得越來越強(qiáng)。按某些衡量標(biāo)準(zhǔn),它們?cè)谥荚跍y(cè)試博士級(jí)科學(xué)、數(shù)學(xué)和語言理解能力的考試上已經(jīng)達(dá)到或超過了人類專家的水平。針對(duì) AI 模型的軟件工程基準(zhǔn)測(cè)試 SWE-bench Verified,頂尖成績(jī)從 2024 年的約 60% 躍升到 2025 年的近 100%。2025 年,一個(gè) AI 系統(tǒng)獨(dú)立完成了天氣預(yù)報(bào)。

“這項(xiàng)技術(shù)持續(xù)在進(jìn)步,完全沒有進(jìn)入平臺(tái)期,我被震驚到了?!奔獱栒f。


(來源:麻省理工科技評(píng)論)

不過 AI 在其他很多領(lǐng)域仍然吃癟。由于模型是通過處理海量文本和圖像來學(xué)習(xí),而不是通過親歷物理世界,它們表現(xiàn)出一種“參差不齊的智能”:機(jī)器人仍處于起步階段,只能完成 12% 的家務(wù)任務(wù);自動(dòng)駕駛汽車發(fā)展稍快,Waymo 已經(jīng)在美國(guó)五個(gè)城市運(yùn)行,百度的 Apollo Go 也在中國(guó)各地接送乘客。AI 也在向法律、金融等專業(yè)領(lǐng)域擴(kuò)展,但目前還沒有哪個(gè)模型能主導(dǎo)這些領(lǐng)域



基準(zhǔn)測(cè)試已經(jīng)落后

這些進(jìn)步數(shù)據(jù)需要保留余地。斯坦福報(bào)告指出,用來追蹤 AI 進(jìn)展的基準(zhǔn)測(cè)試正被模型飛速突破,已經(jīng)跟不上節(jié)奏。有的基準(zhǔn)本身就做得不夠嚴(yán)謹(jǐn)——一個(gè)流行的數(shù)學(xué)能力基準(zhǔn)測(cè)試的錯(cuò)誤率高達(dá) 42%。有的則容易被“作弊”:比如當(dāng)模型直接在基準(zhǔn)測(cè)試的數(shù)據(jù)上接受了訓(xùn)練,它可以學(xué)會(huì)拿高分而并沒有真的變聰明。

由于 AI 實(shí)際使用的方式與它被測(cè)試的方式很少一致,基準(zhǔn)測(cè)試的好成績(jī)并不總能轉(zhuǎn)化為真實(shí)世界的表現(xiàn)。而對(duì)于 AI 智能體和機(jī)器人這類復(fù)雜的交互式技術(shù),相應(yīng)的基準(zhǔn)測(cè)試幾乎還不存在。

AI 公司也越來越少公開自己的模型是如何訓(xùn)練的,獨(dú)立測(cè)試得出的結(jié)論有時(shí)與公司自己報(bào)告的不一致?!昂芏喙静还_自己的模型在某些基準(zhǔn)上的表現(xiàn),尤其是那些涉及‘負(fù)責(zé)任 AI’的基準(zhǔn),”吉爾說,“你不公開某項(xiàng)基準(zhǔn)的表現(xiàn),這件事本身可能就說明了一些問題?!?/strong>



AI 開始影響就業(yè)

進(jìn)入主流視野不到三年,AI 的用戶已經(jīng)覆蓋了全球超過一半的人口,普及速度超過了個(gè)人電腦和互聯(lián)網(wǎng)。估計(jì)有 88% 的機(jī)構(gòu)組織在使用 AI,大學(xué)生里每五人有四人用過 AI。

部署還處于早期,AI 對(duì)就業(yè)的影響很難量化。不過一些研究顯示,AI 已經(jīng)開始影響特定行業(yè)的年輕從業(yè)者。斯坦福經(jīng)濟(jì)學(xué)家 2025 年的一項(xiàng)研究顯示,22 到 25 歲軟件開發(fā)者的就業(yè)人數(shù)自 2022 年以來下降了近 20%。這一下降未必能全部歸因于 AI,更廣泛的宏觀經(jīng)濟(jì)環(huán)境也可能是原因,但 AI 看起來確實(shí)在其中扮演了角色


(來源:麻省理工科技評(píng)論)

雇主們表示招聘可能會(huì)繼續(xù)收緊。麥肯錫 2025 年的一項(xiàng)調(diào)查顯示,三分之一的組織預(yù)計(jì) AI 將在未來一年內(nèi)縮減他們的員工規(guī)模,尤其是服務(wù)與供應(yīng)鏈運(yùn)營(yíng)和軟件工程領(lǐng)域。報(bào)告引用的研究數(shù)據(jù)顯示,AI 在客戶服務(wù)領(lǐng)域提升了 14% 的生產(chǎn)力,在軟件開發(fā)領(lǐng)域提升了 26%,但對(duì)那些更依賴判斷力的任務(wù),生產(chǎn)力收益并未顯現(xiàn)。整體上看,AI 對(duì)經(jīng)濟(jì)的更大影響還需要更多時(shí)間才能看清楚。



公眾專家判斷相左

全球范圍來看,人們對(duì) AI 既樂觀又焦慮:報(bào)告引用的益普索(Ipsos)調(diào)查顯示,59% 的人認(rèn)為 AI 帶來的好處會(huì)多于壞處,52% 的人則說 AI 讓他們緊張。

值得注意的是,專家和普通公眾對(duì) AI 未來的判斷差異懸殊,最大的鴻溝出現(xiàn)在對(duì)就業(yè)的預(yù)期上:73% 的專家認(rèn)為 AI 將對(duì)人們的工作方式產(chǎn)生正面影響,但美國(guó)公眾里持此觀點(diǎn)的只有 23%。在 AI 對(duì)教育和醫(yī)療的影響上,專家同樣比公眾更樂觀,但雙方都認(rèn)同 AI 將損害選舉和人際關(guān)系。


(來源:麻省理工科技評(píng)論)

在受訪國(guó)家中,美國(guó)人對(duì)本國(guó)政府監(jiān)管 AI 的信心最低——這是益普索另一項(xiàng)調(diào)查的結(jié)論。擔(dān)心聯(lián)邦 AI 監(jiān)管力度不夠的美國(guó)人,多于擔(dān)心監(jiān)管過度的人。



各國(guó)政府艱難立法

各國(guó)政府都在掙扎著為 AI 立規(guī)矩,過去一年里確實(shí)有一些進(jìn)展。歐盟《人工智能法案》的首批禁令已生效,禁止在預(yù)測(cè)性警務(wù)和情感識(shí)別中使用 AI。日本、韓國(guó)和意大利也通過了各自的國(guó)家級(jí) AI 法律。美國(guó)聯(lián)邦政府則走向了去監(jiān)管化,特朗普總統(tǒng)簽署行政命令,試圖限制各州對(duì) AI 的監(jiān)管權(quán)。

盡管聯(lián)邦層面是這樣的動(dòng)作,美國(guó)各州立法機(jī)構(gòu)仍然通過了創(chuàng)紀(jì)錄的 150 項(xiàng) AI 相關(guān)法案。加州通過了具有標(biāo)志性意義的立法,包括 SB 53 法案,要求 AI 模型開發(fā)者履行安全披露義務(wù),并為舉報(bào)者提供保護(hù)。紐約通過了 RAISE 法案,要求 AI 公司公開安全規(guī)范并報(bào)告重大安全事件。


(來源:麻省理工科技評(píng)論)

但吉爾說,盡管立法活動(dòng)頻繁,監(jiān)管仍然跑在技術(shù)后面,因?yàn)槲覀儗?duì) AI 本身的理解還不夠。“各國(guó)政府在監(jiān)管 AI 上很謹(jǐn)慎,因?yàn)椤覀兒芏嗍虑槎紱]搞清楚,”她說,“我們對(duì)這些系統(tǒng)還沒有很好的把握。”

https://www.technologyreview.com/2026/04/13/1135675/want-to-understand-the-current-state-of-ai-check-out-these-charts/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
鄭麗文:絕不放棄武力保臺(tái),洪秀柱怒懟:兩岸和平,豈能不統(tǒng)一?

鄭麗文:絕不放棄武力保臺(tái),洪秀柱怒懟:兩岸和平,豈能不統(tǒng)一?

安夢(mèng)入天下
2026-04-12 17:01:16
愛馬仕股價(jià)下跌11.5%

愛馬仕股價(jià)下跌11.5%

每日經(jīng)濟(jì)新聞
2026-04-15 15:25:24
“釣魚島到底被誰實(shí)際控制?”

“釣魚島到底被誰實(shí)際控制?”

荊楚寰宇文樞
2026-04-13 22:44:06
斯諾克大冷門!頭號(hào)種子翻車,2冠軍陪跑,3大00后進(jìn)正賽創(chuàng)紀(jì)錄!

斯諾克大冷門!頭號(hào)種子翻車,2冠軍陪跑,3大00后進(jìn)正賽創(chuàng)紀(jì)錄!

劉姚堯的文字城堡
2026-04-15 06:12:28
江西省人才發(fā)展集團(tuán)有限公司專職外部董事周付德被查

江西省人才發(fā)展集團(tuán)有限公司專職外部董事周付德被查

界面新聞
2026-04-15 19:10:50
“體壇敗類”馬俊仁,逼隊(duì)員集體割闌尾,親手給女隊(duì)員注射禁藥!

“體壇敗類”馬俊仁,逼隊(duì)員集體割闌尾,親手給女隊(duì)員注射禁藥!

拳擊時(shí)空
2026-04-15 06:26:24
蘇東:與高敏離婚30年,兒子在加拿大長(zhǎng)大,他仍每年飛去看孩子

蘇東:與高敏離婚30年,兒子在加拿大長(zhǎng)大,他仍每年飛去看孩子

悅君兮君不知
2026-04-14 23:04:49
王石“被抓”風(fēng)波反轉(zhuǎn),但萬科已無路可退

王石“被抓”風(fēng)波反轉(zhuǎn),但萬科已無路可退

深度知局
2026-04-16 00:09:41
美國(guó)上周原油庫(kù)存減少91.3萬桶 市場(chǎng)預(yù)估為增加15.4萬桶

美國(guó)上周原油庫(kù)存減少91.3萬桶 市場(chǎng)預(yù)估為增加15.4萬桶

財(cái)聯(lián)社
2026-04-15 22:33:06
北京發(fā)布第三輪回天行動(dòng)計(jì)劃,安排127個(gè)重點(diǎn)項(xiàng)目

北京發(fā)布第三輪回天行動(dòng)計(jì)劃,安排127個(gè)重點(diǎn)項(xiàng)目

新京報(bào)
2026-04-15 15:58:15
靠“漢芯一號(hào)”騙取11億研究經(jīng)費(fèi),后逃到美國(guó)的陳進(jìn),結(jié)局如何?

靠“漢芯一號(hào)”騙取11億研究經(jīng)費(fèi),后逃到美國(guó)的陳進(jìn),結(jié)局如何?

阿鳧愛吐槽
2026-04-14 02:01:01
機(jī)構(gòu)發(fā)布“2026中國(guó)大學(xué)排名”

機(jī)構(gòu)發(fā)布“2026中國(guó)大學(xué)排名”

澎湃新聞
2026-04-15 09:08:26
越南著急訪華只為三件大事!中國(guó)對(duì)高鐵有顧慮,只是負(fù)責(zé)邊界線上

越南著急訪華只為三件大事!中國(guó)對(duì)高鐵有顧慮,只是負(fù)責(zé)邊界線上

史潎的生活日記
2026-04-15 09:40:26
許家印最后防線崩塌!高院下死命令:20日不交錢就徹底禁言!

許家印最后防線崩塌!高院下死命令:20日不交錢就徹底禁言!

歷史偉人錄
2026-03-30 18:00:12
知名國(guó)企集團(tuán),六個(gè)月沒發(fā)工資了

知名國(guó)企集團(tuán),六個(gè)月沒發(fā)工資了

新浪財(cái)經(jīng)
2026-04-13 04:16:19
49歲翁帆高調(diào)露面!換造型驚艷全場(chǎng),一句話讓英國(guó)定居傳聞破滅

49歲翁帆高調(diào)露面!換造型驚艷全場(chǎng),一句話讓英國(guó)定居傳聞破滅

一盅情懷
2026-03-16 16:58:07
36分保級(jí)定律失效?利茲聯(lián)踩中英超最殘酷賽季

36分保級(jí)定律失效?利茲聯(lián)踩中英超最殘酷賽季

硅嶼手記
2026-04-15 08:29:45
一線記者傳回中東戰(zhàn)報(bào),伊朗國(guó)內(nèi)的慘烈程度,遠(yuǎn)比想象中大得多

一線記者傳回中東戰(zhàn)報(bào),伊朗國(guó)內(nèi)的慘烈程度,遠(yuǎn)比想象中大得多

阿器談史
2026-04-13 12:08:12
弱者著相,強(qiáng)者破相,智者無相(深度好文)

弱者著相,強(qiáng)者破相,智者無相(深度好文)

洞見
2026-04-12 15:24:55
拉夫羅夫:莫斯科將把所有歷史上的俄羅斯土地歸還其合法家園

拉夫羅夫:莫斯科將把所有歷史上的俄羅斯土地歸還其合法家園

舊窗老街
2026-02-23 01:50:19
2026-04-16 01:16:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16580文章數(shù) 514879關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

美航母及1萬多士兵將抵中東 特朗普:戰(zhàn)爭(zhēng)或持續(xù)至11月

頭條要聞

美航母及1萬多士兵將抵中東 特朗普:戰(zhàn)爭(zhēng)或持續(xù)至11月

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財(cái)經(jīng)要聞

業(yè)績(jī)失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

房產(chǎn)
手機(jī)
旅游
數(shù)碼
軍事航空

房產(chǎn)要聞

重磅調(diào)規(guī)!341畝商改住+中小學(xué)用地!寶龍城這把穩(wěn)了?

手機(jī)要聞

一加Ace6至尊版再次被確認(rèn):魔改天璣9500+165Hz屏,本月發(fā)布!

旅游要聞

遼寧大連星海灣廣場(chǎng),135萬元承包給私人旅拍:野生攝影師被驅(qū)趕

數(shù)碼要聞

明基新款顯示器首發(fā)12499元:4K專業(yè)級(jí)色彩校準(zhǔn) 根據(jù)環(huán)境光自動(dòng)調(diào)整

軍事要聞

萬斯:對(duì)當(dāng)前美伊局勢(shì)進(jìn)展“感到樂觀”

無障礙瀏覽 進(jìn)入關(guān)懷版