亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

斯坦福大學(xué)重磅發(fā)布2026年AI指數(shù)報(bào)告:AI仍在狂奔;中美差距消失;虛擬細(xì)胞成新前沿

0
分享至

撰文丨王聰

編輯丨王多魚

排版丨水成文

人工智能(AI)對(duì)人類社會(huì)的影響從未如此顯著。

日前,斯坦福大學(xué)以人為本人工智能研究院(HAI)發(fā)布了《2026 年人工智能指數(shù)報(bào)告》(The 2026 AI Index Report),這也是該機(jī)構(gòu)連續(xù)第九年發(fā)布年度人工智能指數(shù)報(bào)告,該系列報(bào)告提供了當(dāng)前所能獲得的關(guān)于人工智能發(fā)展軌跡最全面、獨(dú)立來源的圖景,該系列報(bào)告也被譽(yù)為 AI 領(lǐng)域的“年度體檢”,揭示了 AI 技術(shù)狂奔背后的真實(shí)圖景——AI 能力正在全面爆發(fā)——AI 相關(guān)的科學(xué)論文自 2010 年以來激增了近 30 倍,同時(shí),科學(xué)基礎(chǔ)模型開始大量出現(xiàn),許多研究人員開始依賴 AI 智能體來自主執(zhí)行科學(xué)研究工作。然而,該報(bào)告也指出,我們的社會(huì)、治理和倫理框架還遠(yuǎn)遠(yuǎn)跟不上 AI 技術(shù)發(fā)展的腳步。



這份報(bào)告長達(dá)423 頁,本文將總結(jié)概括其中的核心要點(diǎn)。

一、AI 能力加速:不再是“未來”,而是“現(xiàn)在”

報(bào)告顯示,AI 的發(fā)展沒有放緩,反而在加速普及。2025 年,超過 90% 的前沿 AI 模型來自企業(yè),而非學(xué)術(shù)界。這些模型在博士級(jí)科學(xué)問題、多模態(tài)推理和數(shù)學(xué)競賽中已達(dá)到或超越人類水平。在編程基準(zhǔn)測試 SWE-bench 上,AI 性能在一年內(nèi)從 60% 躍升至接近 100% 的人類基準(zhǔn)。

更驚人的是普及速度:生成式人工智能(generative AI)在三年內(nèi)達(dá)到 53% 的使用率,比個(gè)人電腦和互聯(lián)網(wǎng)的普及速度更快。全球 88% 的組織已采用 AI,五分之四的大學(xué)生使用生成式 AI 工具。


二、中美 AI 競賽:差距已基本消失

中國和美國在 AI 模型性能上的差距已基本消失。自 2025 年初以來,中美兩國的 AI 模型多次交替領(lǐng)先。截至 2026 年 3 月,美國頂級(jí) AI 模型僅領(lǐng)先 2.7%。不同之處在于,美國在頂級(jí) AI 模型的數(shù)量和高質(zhì)量專利上仍占優(yōu)勢,而中國在 AI 相關(guān)論文數(shù)量、引用量、專利總量和工業(yè)機(jī)器人安裝量上領(lǐng)先。


三、AI 的“鋸齒狀前沿”:能拿奧數(shù)金牌,卻看不懂鐘表

AI 能力存在明顯的“鋸齒狀前沿”——在某些復(fù)雜任務(wù)上表現(xiàn)出色,卻在簡單任務(wù)上失敗。例如,谷歌的 Gemini Deep Think 模型能在國際數(shù)學(xué)奧林匹克競賽中獲得金牌,但頂級(jí)模型讀取模擬時(shí)鐘的正確率僅為 50.1%。AI 智能體(AI Agent)在真實(shí)計(jì)算機(jī)任務(wù)上的成功率從 12% 躍升至 66%,但在結(jié)構(gòu)化基準(zhǔn)測試中仍有約三分之一會(huì)失敗。


四、機(jī)器人:實(shí)驗(yàn)室里的高手,家庭中的“菜鳥”

AI 機(jī)器人在受控實(shí)驗(yàn)室環(huán)境中表現(xiàn)出色,軟件模擬的機(jī)械操作成功率已達(dá)89.4%。但在真實(shí)家庭環(huán)境中,AI 機(jī)器人僅能完成12%的任務(wù),凸顯了 AI 在物理世界中的巨大挑戰(zhàn)。



五、負(fù)責(zé)任 AI 嚴(yán)重滯后:安全事故激增

隨著 AI 能力提升,安全問題日益突出。幾乎所有前沿 AI 開發(fā)商都會(huì)報(bào)告性能基準(zhǔn),但負(fù)責(zé)任 AI 的評(píng)估報(bào)告卻零零散散。AI 安全事故從 2024 年的 233 起激增至 2025 年的 362 起。更棘手的是,研究發(fā)現(xiàn),提升 AI 的安全性可能會(huì)降低其準(zhǔn)確性,形成“此消彼長”的困境。


六、經(jīng)濟(jì)影響:生產(chǎn)力提升與就業(yè)沖擊并存

AI 在客服和軟件開發(fā)等領(lǐng)域帶來了 14%-26% 的生產(chǎn)力提升,但在需要更多判斷力的任務(wù)中效果較弱甚至為負(fù)。與此同時(shí),AI 開始沖擊就業(yè)市場:在軟件開發(fā)領(lǐng)域,美國 22-25 歲年輕開發(fā)者的就業(yè)人數(shù)在 2024 年下降了近 20%,而年長開發(fā)者數(shù)量仍在增長。


七、環(huán)境代價(jià):不容忽視的碳足跡和水資源消耗

AI 的環(huán)境影響隨著能力提升而擴(kuò)大。Grok 4 模型的訓(xùn)練排放估計(jì)達(dá)到 72816 噸二氧化碳當(dāng)量。AI 數(shù)據(jù)中心的總功率容量已達(dá) 29.6 吉瓦,相當(dāng)于紐約州的峰值用電需求。僅 GPT-4o 推理的年耗水量就可能超過 1200 萬人的飲用水需求。

八、醫(yī)療與科學(xué):希望與局限并存

AI 相關(guān)的研究論文逐年遞增。2025 年,自然科學(xué)領(lǐng)域的 AI 相關(guān)論文多達(dá) 80150 篇,較 2024 年增長 26%。如今,AI 在科研成果中的占比因?qū)W科不同而有所差異,在 5.8% 至 8.8% 之間,而 2010 年這一比例還不到 1%。

前沿 AI 模型在平均表現(xiàn)上已超越人類化學(xué)家,但無法重現(xiàn)已發(fā)表的研究成果。在 ChemBench 上,表現(xiàn)最佳的 AI 模型在 2700 多個(gè)化學(xué)問題上的平均得分高于人類專家,但在基礎(chǔ)任務(wù)上卻表現(xiàn)不佳。在 ReplicationBench 上,前沿 AI 模型在天體物理學(xué)的論文級(jí)復(fù)制任務(wù)上的得分低于 20%。在 UnivEarth 上,AI 智能體回答地球觀測問題的準(zhǔn)確率為 33%,其代碼失敗率為 58%...2025 年,AI 系統(tǒng)首次實(shí)現(xiàn)了端到端的完整天氣預(yù)報(bào)流;首篇完全由 AI 生成的論文在機(jī)器學(xué)習(xí)頂級(jí)會(huì)議的研討會(huì)通過同行評(píng)審被接受,但經(jīng)實(shí)驗(yàn)驗(yàn)證的 AI 發(fā)現(xiàn)仍寥寥無幾。


2025 年,虛擬細(xì)胞模型成為了一個(gè)新的前沿領(lǐng)域,主要發(fā)布的模型包括來自 ARC 研究所的 Evo2、STATE 以及 DeepMind 的 AlphaGenome。這些模型旨在預(yù)測細(xì)胞對(duì)藥物和基因擾動(dòng)的反應(yīng),而無需進(jìn)行濕實(shí)驗(yàn)室實(shí)驗(yàn),不過目前的系統(tǒng)仍需要實(shí)驗(yàn)驗(yàn)證。


自動(dòng)生成病歷的 AI 工具在 2025 年得到廣泛應(yīng)用,這讓醫(yī)生報(bào)告書寫時(shí)間減少高達(dá) 83%,職業(yè)倦怠顯著降低。

2025 年,美國食品藥品監(jiān)督管理局(FDA)批準(zhǔn)了 258 種人工智能醫(yī)療設(shè)備,其中大多數(shù)是通過無需開展新臨床試驗(yàn)的途徑獲批的。絕大多數(shù)設(shè)備是通過設(shè)備改良途徑進(jìn)入市場的,這些途徑依賴于現(xiàn)有的安全性和有效性證據(jù),而非新的隨機(jī)試驗(yàn),僅有 2.4% 的設(shè)備的臨床研究得到了隨機(jī)試驗(yàn)數(shù)據(jù)的支持。

然而,嚴(yán)格的臨床證據(jù)仍然有限——超過 500 項(xiàng)臨床 AI 研究中,近一半依賴考試式問題而非真實(shí)患者數(shù)據(jù),僅 5% 使用了真實(shí)臨床數(shù)據(jù)。

九、教育滯后:學(xué)生在用,政策缺失

超過 80% 的美國高中生和大學(xué)生使用 AI 完成學(xué)業(yè),但只有一半的初高中制定了 AI 政策,僅 6% 的教師認(rèn)為這些政策清晰明確。學(xué)生們最常使用生成式 AI 進(jìn)行研究、論文編輯和頭腦風(fēng)暴。在課堂之外,阿聯(lián)酋、智利和南非的 AI 工程技能增長最快。


十、AI 主權(quán):各國爭奪技術(shù)主導(dǎo)權(quán)

AI 主權(quán)成為各國政策的核心主題,發(fā)展中國家首次大量出臺(tái)國家 AI 戰(zhàn)略。然而,模型生產(chǎn)仍集中在美國和中國。開源開發(fā)正在重新分配參與度,GitHub 上來自世界其他地區(qū)的貢獻(xiàn)已超過歐洲,接近美國,推動(dòng)了更多語言多樣化的模型和基準(zhǔn)測試。


十一、信任危機(jī):專家與公眾的巨大鴻溝

AI 專家與公眾對(duì)技術(shù)未來的看法存在巨大分歧:73% 的專家預(yù)計(jì) AI 對(duì)工作方式有積極影響,而公眾只有 23% 持相同看法。在經(jīng)濟(jì)和醫(yī)療影響上也存在類似差距。全球?qū)?AI 監(jiān)管機(jī)構(gòu)的信任度參差不齊:在接受調(diào)查的國家中,美國公眾對(duì)本國政府監(jiān)管 AI 的信任度最低,僅為 31%。全球范圍內(nèi),歐盟在有效監(jiān)管 AI 方面獲得的信任度高于美國或中國。


總結(jié):狂奔的 AI,跛腳的治理

這一報(bào)告描繪了一幅復(fù)雜圖景:AI 技術(shù)正以前所未有的速度發(fā)展和普及,但我們的評(píng)估體系、安全框架、教育政策和環(huán)境管理都嚴(yán)重滯后。這種“能力與治理”的差距是當(dāng)前 AI 時(shí)代最核心的挑戰(zhàn)。

技術(shù)不會(huì)停下腳步,但人類的選擇將決定 AI 最終走向何方——是讓技術(shù)失控狂奔,還是建立與之匹配的智慧框架?這份報(bào)告提醒我們:在追逐 AI 能力的同時(shí),必須同等重視其社會(huì)影響和倫理邊界。

https://hai.stanford.edu/ai-index/2026-ai-index-report


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
蔣介石敗光百萬大軍靠三人:“蠢才”劉峙“奴才”陳誠,庸才呢?

蔣介石敗光百萬大軍靠三人:“蠢才”劉峙“奴才”陳誠,庸才呢?

云霄紀(jì)史觀
2026-04-15 19:28:08
有船突破美軍封鎖過海峽?1.3萬巴軍部署沙特,我給特朗普支一招

有船突破美軍封鎖過海峽?1.3萬巴軍部署沙特,我給特朗普支一招

鷹眼Defence
2026-04-15 16:29:18
何超蕸私生活曝光!信德員工證實(shí):相伴多年伴侶,3位密友陪伴

何超蕸私生活曝光!信德員工證實(shí):相伴多年伴侶,3位密友陪伴

一盅情懷
2026-04-14 09:47:33
眼看老撾靠中國鐵路賺翻,若再爆產(chǎn)三千萬噸大米修通中老柬大動(dòng)脈,越南只能干瞪眼!

眼看老撾靠中國鐵路賺翻,若再爆產(chǎn)三千萬噸大米修通中老柬大動(dòng)脈,越南只能干瞪眼!

歷史回憶室
2026-04-14 20:59:11
警惕!6種“閑聊”其實(shí)是套話,老實(shí)人別再傻傻交底牌了!

警惕!6種“閑聊”其實(shí)是套話,老實(shí)人別再傻傻交底牌了!

遇見洞見
2026-03-20 20:30:07
4.16日開始能夠悶聲發(fā)大財(cái),說發(fā)達(dá)就發(fā)達(dá),千萬橫財(cái)擋不住的生肖

4.16日開始能夠悶聲發(fā)大財(cái),說發(fā)達(dá)就發(fā)達(dá),千萬橫財(cái)擋不住的生肖

小智223
2026-04-14 22:16:37
36分保級(jí)定律失效?利茲聯(lián)踩中英超最殘酷賽季

36分保級(jí)定律失效?利茲聯(lián)踩中英超最殘酷賽季

硅嶼手記
2026-04-15 08:29:45
同仁醫(yī)院最新研究:睡覺開小夜燈,孩子近視風(fēng)險(xiǎn)高2.4倍

同仁醫(yī)院最新研究:睡覺開小夜燈,孩子近視風(fēng)險(xiǎn)高2.4倍

人民日?qǐng)?bào)健康客戶端
2026-04-13 10:48:20
南寧變風(fēng)向了?五象還在卷房價(jià),東部已悄悄在“造富”,怎么看?

南寧變風(fēng)向了?五象還在卷房價(jià),東部已悄悄在“造富”,怎么看?

靚仔情感
2026-04-15 19:50:43
才半個(gè)月!全媽回應(yīng)全紅嬋退役糟心事發(fā)生,陳芋汐的話有人信了

才半個(gè)月!全媽回應(yīng)全紅嬋退役糟心事發(fā)生,陳芋汐的話有人信了

一盅情懷
2026-03-01 16:48:37
張雪峰對(duì)當(dāng)年把他踢出尖子班的教導(dǎo)主任,記了大半輩子,耿耿于懷

張雪峰對(duì)當(dāng)年把他踢出尖子班的教導(dǎo)主任,記了大半輩子,耿耿于懷

情感藝術(shù)家
2026-04-13 11:43:48
上海地鐵1、9、10號(hào)線突發(fā)狀況,多站點(diǎn)“付款碼獲取失敗”,乘客急瘋

上海地鐵1、9、10號(hào)線突發(fā)狀況,多站點(diǎn)“付款碼獲取失敗”,乘客急瘋

新民晚報(bào)
2026-04-15 11:23:47
連水都沒顧上喝,越南一把手剛落地就直奔雄安看個(gè)啥

連水都沒顧上喝,越南一把手剛落地就直奔雄安看個(gè)啥

生活魔術(shù)專家
2026-04-15 18:07:33
汪峰真是不懂珍惜,這么高級(jí)的美人不應(yīng)該拱手讓出去。

汪峰真是不懂珍惜,這么高級(jí)的美人不應(yīng)該拱手讓出去。

科學(xué)發(fā)掘
2026-04-15 13:28:04
外交部:如美方執(zhí)意以所謂“軍品出口”為借口對(duì)華加征關(guān)稅,中方必將堅(jiān)決反制

外交部:如美方執(zhí)意以所謂“軍品出口”為借口對(duì)華加征關(guān)稅,中方必將堅(jiān)決反制

全國黨媒信息公共平臺(tái)
2026-04-15 10:18:13
世錦賽戰(zhàn)報(bào):再爆大冷預(yù)警,2號(hào)種子0-5中國00后,正賽席位懸了

世錦賽戰(zhàn)報(bào):再爆大冷預(yù)警,2號(hào)種子0-5中國00后,正賽席位懸了

求球不落諦
2026-04-15 20:26:08
果然讓步了!伊朗突然做出了一個(gè),令人意外的表態(tài)!

果然讓步了!伊朗突然做出了一個(gè),令人意外的表態(tài)!

揚(yáng)子的故事屋
2026-04-15 10:24:21
四川通報(bào)“男子獻(xiàn)血10年近4萬毫升,持“博愛卡”要求免診查費(fèi)被拒”:醫(yī)院向其當(dāng)面致歉并取得諒解,分管領(lǐng)導(dǎo)、科室主任誡勉處理

四川通報(bào)“男子獻(xiàn)血10年近4萬毫升,持“博愛卡”要求免診查費(fèi)被拒”:醫(yī)院向其當(dāng)面致歉并取得諒解,分管領(lǐng)導(dǎo)、科室主任誡勉處理

大象新聞
2026-04-14 19:45:30
歐冠淘汰賽0球0助攻,留拉什福德需3000萬歐,巴薩想續(xù)租不想買斷

歐冠淘汰賽0球0助攻,留拉什福德需3000萬歐,巴薩想續(xù)租不想買斷

夏侯看英超
2026-04-15 22:52:42
左小青這狀態(tài),鯊瘋了!明媚動(dòng)人,若隱若現(xiàn)

左小青這狀態(tài),鯊瘋了!明媚動(dòng)人,若隱若現(xiàn)

只要高興就好
2025-12-10 19:09:26
2026-04-16 01:36:49
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科學(xué)研究
9212文章數(shù) 145049關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

法國全票通過 “將不義之財(cái)歸還中國”

頭條要聞

法國全票通過 “將不義之財(cái)歸還中國”

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財(cái)經(jīng)要聞

業(yè)績失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測

態(tài)度原創(chuàng)

手機(jī)
家居
親子
數(shù)碼
公開課

手機(jī)要聞

一加Ace6至尊版再次被確認(rèn):魔改天璣9500+165Hz屏,本月發(fā)布!

家居要聞

簡而不減 暖居之道

親子要聞

孕婦200買水果被罵后續(xù):已終止妊娠,男方崩潰砸東西,網(wǎng)友炸鍋

數(shù)碼要聞

明基新款顯示器首發(fā)12499元:4K專業(yè)級(jí)色彩校準(zhǔn) 根據(jù)環(huán)境光自動(dòng)調(diào)整

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版