亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

清華發(fā)布AutoSOTA:一周刷新105個頂會SOTA,推動AI科研回歸本質(zhì)

0
分享至



在人工智能研究中,許多研究者將大量時間投入到為那 1% 的性能提升反復調(diào)參與實驗迭代之中。

一個越來越值得重視的問題是:人類科學家最寶貴的直覺與創(chuàng)造力,是否正被困在無止境的「增量式優(yōu)化」中?

SOTA(State-of-the-Art,當前最佳水平的 AI 模型)長期被視為衡量研究價值的「金標準」。

當一篇學術(shù)論文刷新 SOTA 時,人們看到的,往往只是結(jié)果的躍升。但在結(jié)果背后,真正支撐起一次次「當前最佳」的,往往不是某一個瞬間的靈感,而是此后持續(xù)數(shù)月甚至數(shù)年的高強度實驗迭代、參數(shù)調(diào)整與工程優(yōu)化。

以 Transformer 架構(gòu)的發(fā)展為例。自 2017 年問世以來,全球科研人員圍繞這一架構(gòu)投入了大量人力與算力,不斷提出新變體、設(shè)計新模塊、優(yōu)化訓練策略,才最終將其在通用語言理解評測集 GLUE 上的性能從約 75% 提升到 90% 以上。



Transformer 架構(gòu)在 GLUE 評測集上的性能爬升

問題在于,這些優(yōu)化工作雖然重要,卻并不總是最值得由人類科學家重點投入的那一部分。

如果最優(yōu)秀的科研人才被長期綁定在重復性的性能優(yōu)化中,那么那些更具原創(chuàng)性、更需要長期思考的問題,誰來持續(xù)投入?

AutoSOTA 讓 AI 科研自動化走向端到端閉環(huán)

正是在這樣的背景下,在近期召開的中關(guān)村論壇上,清華大學與北京中關(guān)村學院聯(lián)合發(fā)布研究成果 ——AutoSOTA。

目前,AutoSOTA項目已發(fā)布預印本論文。



論文地址:https://arxiv.org/abs/2604.05550

AutoSOTA 面向端到端的 AI 科研自動化,致力于通過科研智能體加速高強度、重復性的實驗迭代與優(yōu)化過程,將研究者從持續(xù)的性能打磨中解放出來。



AutoSOTA 研究問題框架

不同于現(xiàn)有的代碼優(yōu)化框架,AutoSOTA 并不是對單一實驗環(huán)節(jié)的局部加速。它將 AI 智能體的賦能邊界進一步延伸到實驗準備、實驗執(zhí)行等底層繁瑣任務(wù),以及研究思路生成等頂層構(gòu)思環(huán)節(jié),旨在實現(xiàn)從已有 SOTA 到新 SOTA、從現(xiàn)有代碼倉庫到新代碼倉庫的端到端 AI 科研自動化。



AutoSOTA 端到端 AI 科研自動化系統(tǒng)

AutoSOTA 采用多智能體協(xié)作框架,借鑒人類算法研究中的分工流程與協(xié)作邏輯,使不同科研智能體能夠圍繞同一目標開展協(xié)同設(shè)計、實驗執(zhí)行、結(jié)果分析與方案迭代。

與此同時,AutoSOTA 配備了完善的工具庫(Toolkit)與技能集(Skill Set),不僅能夠處理實驗運行中的復雜狀況,還能夠完成文獻調(diào)研、思路生成、方案設(shè)計等高層次任務(wù),從而在頂層規(guī)劃與底層執(zhí)行之間形成閉環(huán)。

這意味著,AutoSOTA 所追求的并不只是「把實驗跑得更快」,而是真正推動 AI 科研自動化從單點輔助走向系統(tǒng)化、持續(xù)化、智能化的科研協(xié)作過程。

一周時間,發(fā)現(xiàn) 105 個性能顯著提升的 SOTA 模型

在為期一周的實驗中,AutoSOTA 以前一年 AI 頂會論文中的優(yōu)秀成果為基礎(chǔ),自動發(fā)現(xiàn)了 105 個性能顯著提升的模型方案。其中,超過 60% 的模型具有新穎的結(jié)構(gòu)設(shè)計,平均性能提升接近 10%。



基于AutoSOTA的大規(guī)模SOTA AI模型發(fā)現(xiàn)

項目地址:https://tsinghua-fib-lab.github.io/AutoSOTA/

這組結(jié)果的意義在于,AutoSOTA 并非只是沿著既有路徑進行簡單搜索,也不局限于參數(shù)組合層面的窮舉式優(yōu)化。它在優(yōu)化性能的同時,展現(xiàn)出一定程度的結(jié)構(gòu)創(chuàng)新能力,能夠在已有研究基礎(chǔ)上繼續(xù)挖掘新的設(shè)計空間,發(fā)現(xiàn)兼具性能提升與結(jié)構(gòu)新穎性的模型方案。

AutoSOTA 的意義,不止于「再提幾分」


AutoSOTA 的意義,不僅在于獲得了一批新的 SOTA 結(jié)果,更在于它啟發(fā)人類科學家重新審視科研創(chuàng)新的本質(zhì):SOTA 性能的刷新,是否等同于重要的科學突破?

AutoSOTA 啟示我們進一步思考:如何將人類科學家最寶貴的注意力,從重復性的實驗迭代中重新釋放出來,回歸到更具原創(chuàng)性、也更需要長期判斷與創(chuàng)造力的研究問題上?

一種可能的人智協(xié)作模式是:由科研智能體系統(tǒng)承擔大量重復性、密集型、長周期的優(yōu)化過程,由人類科學家聚焦于提出問題、定義方向、識別機會與構(gòu)想機制。在這一意義上,AutoSOTA 更像是一種面向科研流程的「創(chuàng)造力放大器」。

它并不是要替代科學家的原創(chuàng)性,而是要把原創(chuàng)性從低效、重復的實驗勞動中解放出來。



AutoSOTA啟發(fā)的人智協(xié)同科研范式

真正重要的,不是讓研究者永遠停留在「把已有模型再推高一點」的循環(huán)里,而是讓他們有更多機會去面對那些尚未被定義、尚未被解釋、也尚未被系統(tǒng)探索的問題。

AutoSOTA 正在朝這一方向邁出關(guān)鍵一步。它不僅展示了科研智能體在 AI 研究自動化中的巨大潛力,也讓我們看到,當「性能優(yōu)化」這項沉重工作逐步被智能體接管之后,科學研究有機會真正回到它最珍貴的起點 ——提出大膽的問題,探索未知的方向,追求不可替代的原創(chuàng)性突破。

項目網(wǎng)站:https://tsinghua-fib-lab.github.io/AutoSOTA/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
5月1日起,3萬元成“高壓線”!普通打工人、小老板、新規(guī)來了

5月1日起,3萬元成“高壓線”!普通打工人、小老板、新規(guī)來了

混沌錄
2026-04-14 20:16:08
一場87:70讓前8格局再次大亂!青島遭晴天霹靂,遼寧機會又來了

一場87:70讓前8格局再次大亂!青島遭晴天霹靂,遼寧機會又來了

后仰大風車
2026-04-15 07:35:05
孫楊官宣有娃僅1天,妻子私生活被扒底朝天,令人擔心的事出現(xiàn)了

孫楊官宣有娃僅1天,妻子私生活被扒底朝天,令人擔心的事出現(xiàn)了

圓夢的小老頭
2026-04-15 15:00:48
中央明確了!社保最低繳費年限要提高,70、80后得早做準備

中央明確了!社保最低繳費年限要提高,70、80后得早做準備

云鵬敘事
2026-04-12 16:36:39
大灣區(qū)攬勝來了!小鵬旗艦SUV GX預售:旗艦版39.98萬

大灣區(qū)攬勝來了!小鵬旗艦SUV GX預售:旗艦版39.98萬

快科技
2026-04-15 21:38:10
國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

比利
2026-01-23 12:41:53
70后存款大曝光!銀行人表示:能存到這個數(shù)的,已經(jīng)算“中上層”

70后存款大曝光!銀行人表示:能存到這個數(shù)的,已經(jīng)算“中上層”

億通電子游戲
2026-04-15 13:02:19
2.4萬億元,一個人怎么能闖出這么大的禍…

2.4萬億元,一個人怎么能闖出這么大的禍…

蔥哥說
2026-04-14 22:04:16
突發(fā)!香港資深制作人失聯(lián),牽扯金額恐達上億元

突發(fā)!香港資深制作人失聯(lián),牽扯金額恐達上億元

你約電影
2026-04-15 20:34:31
5月1日起,醫(yī)院要變天了?以后看病不再擠破頭!

5月1日起,醫(yī)院要變天了?以后看病不再擠破頭!

小談食刻美食
2026-04-15 08:30:07
南京征婚啟事走紅!男子“頂配條件”僅要求女方91年后出生、未婚

南京征婚啟事走紅!男子“頂配條件”僅要求女方91年后出生、未婚

火山詩話
2026-04-15 06:25:37
貴陽一高速發(fā)生多車連環(huán)事故,當?shù)鼗貞?yīng):涉及7輛車,尚未掌握人員傷亡信息,道路已恢復暢通

貴陽一高速發(fā)生多車連環(huán)事故,當?shù)鼗貞?yīng):涉及7輛車,尚未掌握人員傷亡信息,道路已恢復暢通

極目新聞
2026-04-15 16:51:24
開業(yè)僅2年,淮安這家綜合體卻有大批商鋪空了!

開業(yè)僅2年,淮安這家綜合體卻有大批商鋪空了!

微淮安
2026-04-15 20:04:07
最后5輪3個主場 沙爾克距離重返德甲只剩一步之遙

最后5輪3個主場 沙爾克距離重返德甲只剩一步之遙

體壇周報
2026-04-15 18:26:55
70架軍機抵以色列,伊朗中計,巴鐵出兵,戰(zhàn)爭一觸即發(fā)

70架軍機抵以色列,伊朗中計,巴鐵出兵,戰(zhàn)爭一觸即發(fā)

天天都是好日子
2026-04-14 16:52:58
“老師最煩這種現(xiàn)眼包家長”,寶媽穿緊身裙參加運動會,被嘲

“老師最煩這種現(xiàn)眼包家長”,寶媽穿緊身裙參加運動會,被嘲

蝴蝶花雨話教育
2026-04-02 10:30:13
張雪宣布:計劃于今年六七月份,在重慶挑戰(zhàn)騎摩托車飛躍長江;網(wǎng)友勸阻別拿命開玩笑,此前挑戰(zhàn)連續(xù)失敗4次

張雪宣布:計劃于今年六七月份,在重慶挑戰(zhàn)騎摩托車飛躍長江;網(wǎng)友勸阻別拿命開玩笑,此前挑戰(zhàn)連續(xù)失敗4次

魯中晨報
2026-04-15 15:00:10
豪斯+兩內(nèi)救了張慶鵬!北控戰(zhàn)績壓廣州1勝場,再贏2場鎖季后賽!

豪斯+兩內(nèi)救了張慶鵬!北控戰(zhàn)績壓廣州1勝場,再贏2場鎖季后賽!

籃球資訊達人
2026-04-15 22:35:17
凌晨1點告別德國!樊振東最后一場,數(shù)萬球迷會為他守夜嗎?

凌晨1點告別德國!樊振東最后一場,數(shù)萬球迷會為他守夜嗎?

曉隯就是我
2026-04-15 10:59:55
李想朋友圈發(fā)爽了,也讓東風日產(chǎn)NX8上桌了

李想朋友圈發(fā)爽了,也讓東風日產(chǎn)NX8上桌了

電動星球News
2026-04-13 20:08:50
2026-04-15 23:28:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12772文章數(shù) 142628關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

豫劇團下鄉(xiāng)演出臺下觀眾痛哭流涕:觀眾超千人一半落淚

頭條要聞

豫劇團下鄉(xiāng)演出臺下觀眾痛哭流涕:觀眾超千人一半落淚

體育要聞

三球準絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財經(jīng)要聞

業(yè)績失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評測

態(tài)度原創(chuàng)

房產(chǎn)
家居
親子
藝術(shù)
軍事航空

房產(chǎn)要聞

重磅調(diào)規(guī)!341畝商改住+中小學用地!寶龍城這把穩(wěn)了?

家居要聞

簡而不減 暖居之道

親子要聞

母嬰命懸一線,兇險性前置胎盤穿透膀胱,這家醫(yī)院如何力挽狂瀾

藝術(shù)要聞

這山水,蕩滌胸中塵埃

軍事要聞

萬斯:對當前美伊局勢進展“感到樂觀”

無障礙瀏覽 進入關(guān)懷版