網易首頁 > 網易號 > 正文 申請入駐

深度|阿里?ICLR 255?篇霸榜!基座是明牌,系統是暗牌,做實比做強更狠

0
分享至


Z Highlights

  • 從論文分布上看,基座大模型吃掉51.8%的份額,多模態感知再切走 20.8%。光是這兩個方向,就卷走了超過七成的火力。

  • 如果說基座大模型是明牌,那計算機系統就是阿里的暗牌。表面上看,系統方向只有 5 篇論文,數量少得可憐。但整個 ICLR 2026 在系統方向的占比僅 0.8%,阿里的偏好指數高達 2.44,重倉程度甚至超過基座大模型。

  • 誰能解決泛化問題,誰能壓縮系統成本,誰能打通模型落地的最后一公里,誰才是下一個時代的贏家。阿里系的研究重心,已經從做強轉向做實。

AI 頂會江湖,風向正在悄然生變。

當全球 5340 篇論文涌入 ICLR 2026,阿里系以 255 篇接收論文、10 篇 Oral 的硬核戰績,拿下 4.8%的全球份額。這不是簡單的數字堆砌,在這份成績單背后,藏著阿里 AI 戰略的深層邏輯:從單兵突進轉向生態作戰,從論文工廠轉向產業閉環。


關于 ICLR:國際表征學習大會(ICLR)是深度學習領域頂級會議,與 NeurIPS、ICML 并稱機器學習三大頂會,近期被 CCF 評為 A 類會議。2026 年 ICLR 覆蓋大語言模型、生成模型、多模態學習、AI 安全、機器學習系統等多個前沿方向。


255篇背后:一場產學研的鐵三角實驗

翻開阿里系的論文版圖,一個反常識的數據炸場:96.1% 的論文依賴外部合作,純阿里獨立完成的僅占 2.7%。但一個細節更值得玩味:這份龐大的合作名單里,海外高校幾乎缺席。

這不是能力短板,而是一場更為極致的本土化閉環實驗——阿里正在把自己變成一塊磁石,不玩閉門造車的原創神話,而是搭建產業平臺 + 國內高校網絡的新范式。純阿里獨立完成的論文,只有 7 篇,占比 2.7%。剩下的 97.3%呢?

  • 阿里-高校合作 168 篇(65.9%)

  • 阿里-高校-企業混合 77 篇(30.2%)

  • 純阿里-企業合作 3 篇(1.2%)


圖 7 阿里系論文合作版圖分布

本土 AI 全明星陣容包括:

  • 浙江大學 51 篇

  • 清華大學 43 篇

  • 香港科技大學 31 篇

  • 北京大學 29 篇

  • 中科院自動化所 20 篇

甚至連字節跳動(13 篇)、騰訊(9 篇)這些友商,都在阿里系的合作網絡里刷臉。在頂會賽場上,競合關系的邊界正在模糊——今天的對手,明天的合作者。

0% 的海外依賴,2.7% 的獨舞,96.1% 的群像,阿里在用數據證明:在這個時代,做平臺比做孤島更有殺傷力。這些頭部高校不僅是論文產出機器,更是阿里的人才蓄水池和技術風向標。

基座大模型吃掉半壁江山,多模態感知緊追不舍

如果說論文數量是面子,那研究方向就是里子。阿里系的火力高度集中在兩大高地:基座大模型(51.8%)和多模態感知(20.8%)。光是這兩個方向,就吞掉了超過七成的彈藥。

這與 ICLR 的整體趨勢同頻共振,但阿里的打法更重——當行業還在卷參數規模,他們已經開始死磕可用性重構。10 篇 Oral 論文透露了研究重心正從能力突破轉向場景閉環:泛化、推理、效率、落地這四個關鍵詞,構成了阿里 AI 的新坐標系。

過去兩年,大模型賽道充斥著大力出奇跡的狂熱。但阿里系在 ICLR 2026 的選題,明顯冷靜了下來。

他們不再只關心模型能做什么,而是追問模型在真實世界怎么用得起來。系統效率優化、復雜環境泛化、推理可靠性保障,這些聽起來不那么性感的方向,正在成為新的技術高地。這種轉向,與阿里的產業基因密不可分。作為年研發投入超 15%、坐擁數萬塊 GPU 集群和數十億級真實業務數據的云服務商,阿里比純研究機構更清楚:技術價值最終要在產業閉環里兌現。依托 7000 余名技術人才(含 2000+博士)和魔搭社區等開放平臺,阿里已經構建起全球領先的 AI 全棧能力。

但 255 篇論文也拋出了一個新命題:當外部合作成為主流產出模式,如何在工程能力、場景需求與學術原創之間找到更深層的平衡?這不僅是阿里的挑戰,也是中國產業 AI 的集體課題。畢竟,頂會論文只是入場券,定義下一代 AI 基礎設施的能力,才是真正的終局之戰。

計算機系統方向偷偷發力,全力押注工程可落地

255 篇論文背后,阿里系的彈藥到底投向了哪里?


圖 1 阿里系論文數量概覽

基座大模型:阿里的超配戰略

數據不會說謊。ICLR 2026 整體接收論文中,基座大模型方向占 33.2%,而阿里系在這一方向的占比高達 51.8%——偏好指數 1.56,超配幅度接近六成。這意味著當行業還在均衡布局時,阿里選擇了把雞蛋放在最重的籃子里。


圖 2 阿里系論文研究領域大類分布

更細顆粒度地看,阿里系在 foundation or frontier models(含 LLM)方向砸了 72 篇論文,占總量 28.2%;多模態應用 47 篇、數據集與評測基準 30 篇、生成模型 30 篇——從底層架構到上層應用,從訓練數據到評測標準,阿里正在構建一套完整的技術閉環。


圖 3 阿里系論文一級研究方向 Top 10

一個值得玩味的細節是Junyang Lin(林俊旸)一人署名 8 篇論文,其中 1 篇 Oral。這位阿里大模型骨干的選題清單,堪稱阿里技術路線的縮影——多模態推理、軟件工程智能體、推測式解碼、全模態感知...清一色的大模型+多模態主線。

系統方向是被忽視的隱形重倉


圖 4 阿里與整體 ICLR 方向分布對比


圖 5 阿里方向偏好指數

如果說基座大模型是明牌,那計算機系統方向就是阿里的暗牌。表面上看,系統方向只有 5 篇論文,數量少得可憐。但別忘了,整個 ICLR 2026 在系統方向的占比僅 0.8%——阿里的偏好指數高達 2.44,重倉程度甚至超過基座大模型。

這透露了一個關鍵信號:當所有人都在卷模型能力,阿里已經開始死磕底層基礎設施。畢竟,對于手握數萬塊 GPU 集群的云服務商來說,系統效率才是真正的護城河。

Oral 質量占比:與大盤持平,未見明顯超車


圖 6 阿里與整體 ICLR Oral 占比對比

最后看一個硬核指標:Oral 占比。阿里系 Oral 論文 10 篇,占比 3.9%;ICLR 整體 Oral 占比 4.2%。-0.3 個百分點的差距,說明阿里在論文質量上穩住了基本盤,但并未形成顯著的精品優勢。

換句話說,相比頂級突破性成果,阿里更擅長規;a出,把三個特征串起來看,阿里在 ICLR 2026 的打法已經非常清晰:

1.方向聚焦:基座大模型絕對重倉,多模態緊隨其后,系統方向暗中發力

2.生態作戰:96%的論文依賴外部合作,把自己變成產業研究平臺

3.工程導向:偏好指數顯示,阿里明顯回避純理論方向,全力押注工程可落地領域

這不是傳統意義上的學術機構打法,而是平臺型科技公司的典型策略——用產業資源換學術影響力,用合作網絡換規模效應,最終目標不是頂會獎杯,而是 AI 基礎設施的定義權。

注:

  • 偏好指數 = 阿里在某方向的論文占比 / 整體 ICLR 在該方向的論文占比。偏好指數大于 1 表示阿里在該方向相對超配,小于 1 表示相對低配。

  • 占比差值 = 阿里在某方向的論文占比 - 整體 ICLR 在該方向的論文占比,用于直觀看結構差異。

  • 本文新增的這些指標都屬于描述性統計,用于說明方向結構,不做顯著性檢驗。

10篇Oral看阿里系ICLR 2026的真正重心


我們聚焦在阿里系在 ICLR 上的 10 篇Oral文章,相關研究大致沿著泛化性、推理可靠性、計算效率以及對齊與交互能力四條主線展開,并逐步形成了從數據構建、模型設計、先驗注入、推理增強到評測范式重構的多層次研究圖景。

首先,在泛化能力方面,現有工作已不再滿足于封閉分布下的性能提升,而是更加關注模型在未見偽造類型、跨域場景以及復雜真實環境中的魯棒性。一類研究從數據與基準構建入手,試圖通過更貼近實際應用條件的訓練與評測設置縮小實驗環境與工業場景之間的差距。例如,HydraFake 強調多樣化偽造技術、真實世界 forgery 以及嚴格的 out-of-domain 協議,從數據層面推動深偽檢測研究由“同分布識別”轉向“面向開放場景的泛化檢測”;另一類工作從模型機制本身出發增強泛化能力。以 Camera-Aware MLLM 為代表的研究指出,僅依賴 RGB 輸入的空間智能建模容易將幾何屬性與相機成像條件混合編碼,導致模型過擬合于訓練相機分布,因此有必要將相機內參顯式納入視覺 token 的條件建模之中,并輔以相機感知的數據增強策略與幾何先驗蒸餾,以提升跨相機條件下的空間推理能力。

推理能力與可靠性方面,一條重要方向是通過結構化推理機制增強模型的中間決策質量。Veritas 通過在傳統 chain-of-thought 之外引入 planning 與 self-reflection 等關鍵模式,使模型能夠以更接近人工鑒偽流程的方式逐步分析偽造線索;VC-STaR 從視覺對比的角度出發,利用對比式 VQA 樣本幫助模型更準確地定位判別性視覺證據,并在此基礎上生成質量更高、幻覺更少的視覺推理路徑,進而實現視覺推理能力的自我提升。


VERITAS

效率與優化方面,相關研究主要覆蓋訓練階段與推理階段兩個層面。訓練階段的工作更多關注如何在不犧牲最終性能的前提下降低傳統優化范式中的冗余設計。WSM 即代表了一類重新審視學習率衰減機制的研究,其核心觀點在于通過 checkpoint merging 建立學習率調度與模型平均之間的形式聯系,從而以一種 decay-free 的方式近似或替代常見的 cosine decay、linear decay 等退火策略。該類方法的意義不僅在于優化效率本身,也在于其為長期預訓練和后續監督微調提供了更統一的訓練動力學解釋。

對齊、交互與決策能力方面,研究關注點則進一步擴展至模型如何在開放環境中適應用戶偏好、完成動態任務并實現可擴展的行為優化。P-GenRM 代表了個性化對齊方向的重要進展,其通過將用戶偏好表征為結構化評價鏈,并在測試階段引入基于個體與原型的雙粒度縮放機制,使獎勵模型不僅能夠適配特定用戶的細粒度偏好,還能借助相似用戶群體的原型知識增強對新用戶的泛化能力。


P-GenRM

綜合來看,一方面,研究者通過更真實的數據分布、動態交互環境和更嚴格的評測協議不斷暴露現有模型在開放世界中的能力缺口;另一方面,又通過結構化推理、先驗知識注入、訓練與解碼機制優化以及個性化對齊等方法,系統性地彌補模型在泛化性、可靠性、效率和實用性上的不足。

作者: Cheng Gao, Shi Yuchen, Wang Shijie

*排名不分先后,按照首字母排序

Ref.

https://arxiv.org/pdf/2602.12116

https://arxiv.org/pdf/2508.21048

https://papercopilot.com/statistics/iclr-statistics/

數據來自 openreview 公開信息

加入ZF討論群,請先添加小助手微信

我們相信認知能夠跨越階層,

致力于為年輕人提供高質量的科技和財經內容。

稿件經采用可獲邀進入Z Finance內部社群,優秀者將成為簽約作者,00后更有機會成為Z Finance的早期共創成員。

我們正在招募新一期的實習生

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
醪糟再次被關注!醫生發現:高血脂患者喝醪糟,不用多久4大變化

醪糟再次被關注!醫生發現:高血脂患者喝醪糟,不用多久4大變化

芹姐說生活
2026-04-19 15:52:53
鐘楚紅、林青霞,我感覺最左邊的這位長相也不差,她到底是誰

鐘楚紅、林青霞,我感覺最左邊的這位長相也不差,她到底是誰

草莓解說體育
2026-05-09 05:34:27
外交部:堅決反對任何對中方的無端指責和惡意抹黑,相信挪威方面將切實保障中國公民合法權益

外交部:堅決反對任何對中方的無端指責和惡意抹黑,相信挪威方面將切實保障中國公民合法權益

環球網資訊
2026-05-08 15:50:22
斯諾克單賽季獎金榜:趙心童破百萬,世界第1歷史第3,吳宜澤第2

斯諾克單賽季獎金榜:趙心童破百萬,世界第1歷史第3,吳宜澤第2

劉姚堯的文字城堡
2026-05-08 09:00:42
網友偶然碰到佟麗婭吃早餐啦。她都43歲了,素顏的狀態卻特別好。

網友偶然碰到佟麗婭吃早餐啦。她都43歲了,素顏的狀態卻特別好。

東方不敗然多多
2026-05-08 16:46:11
47歲高圓圓沈陽菜市場賣辣白菜!顏值封神,網友:狠狠羨慕趙又廷

47歲高圓圓沈陽菜市場賣辣白菜!顏值封神,網友:狠狠羨慕趙又廷

可樂談情感
2026-05-08 14:09:54
發現了1個殘酷真相:被美軍抓走的馬杜羅,如今已經被徹底遺忘

發現了1個殘酷真相:被美軍抓走的馬杜羅,如今已經被徹底遺忘

共工之錨
2026-05-07 23:58:12
軍售放行后,日烏開始共制武器

軍售放行后,日烏開始共制武器

鳳凰WEEKLY
2026-05-06 19:44:21
一個北方縣城公務員的一生:一眼望到頭,卻是普通人最好的歸宿

一個北方縣城公務員的一生:一眼望到頭,卻是普通人最好的歸宿

王姐懶人家常菜
2026-05-08 03:48:09
這下輪到銀行發愁了!越來越多的儲戶,要把存款分散到多家銀行

這下輪到銀行發愁了!越來越多的儲戶,要把存款分散到多家銀行

夢史
2026-05-09 00:53:33
現役球員季后賽總得分TOP6,只有哈登沒有總冠軍

現役球員季后賽總得分TOP6,只有哈登沒有總冠軍

懂球帝
2026-05-08 11:07:06
機關下設的事業單位,比如各種“中心”,名義上是獨立機構,實際上早成了機關的內設處室?

機關下設的事業單位,比如各種“中心”,名義上是獨立機構,實際上早成了機關的內設處室?

碧翰烽
2026-05-08 07:33:09
不出 5 年,中國貶值最快的不是房子和現金,而是這 3 樣東西

不出 5 年,中國貶值最快的不是房子和現金,而是這 3 樣東西

細說職場
2026-04-26 21:04:20
王健林,被逼到崩潰邊緣...

王健林,被逼到崩潰邊緣...

鳴金網
2026-04-16 19:42:33
亞馬遜爆款衛衣:買家稱"實物比照片貴十倍"

亞馬遜爆款衛衣:買家稱"實物比照片貴十倍"

影視情報室
2026-05-08 00:14:58
34歲肖戰高調官宣喜訊,官方發文全網恭喜,終于等到

34歲肖戰高調官宣喜訊,官方發文全網恭喜,終于等到

豬小艷吖
2026-05-07 11:21:34
4.7萬億!馬斯克打破人類財富紀錄:他一個人的錢抵得過160個國家

4.7萬億!馬斯克打破人類財富紀錄:他一個人的錢抵得過160個國家

通鑒史智
2026-03-15 11:45:00
世乒賽最新戰報!四強全部落位,雨果爆冷,法國3-0橫掃巴西,半決賽對陣出爐,國乒迎生死考驗

世乒賽最新戰報!四強全部落位,雨果爆冷,法國3-0橫掃巴西,半決賽對陣出爐,國乒迎生死考驗

體壇最前線66
2026-05-09 05:39:01
1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

哄動一時啊
2026-02-17 22:21:25
中央定調,延遲退休后,1970年出生的,60歲能領到養老金了嗎?

中央定調,延遲退休后,1970年出生的,60歲能領到養老金了嗎?

阿腩講娛樂
2026-05-09 06:10:06
2026-05-09 08:40:49
ZFinance
ZFinance
Z世代的一站式AI、科技和財經資訊
177文章數 16關注度
往期回顧 全部

科技要聞

美國政府強力下場 蘋果英特爾達成代工協議

頭條要聞

媒體:特朗普若順利來華 將是美總統時隔十年再訪中國

頭條要聞

媒體:特朗普若順利來華 將是美總統時隔十年再訪中國

體育要聞

他把首勝讓給隊友,然后用一年時間還清賬單

娛樂要聞

古天樂被曝隱婚生子,新娘竟是她

財經要聞

白宮:特朗普計劃5月14日至15日訪問中國

汽車要聞

MG 4X實車亮相 將于5月11日開啟盲訂

態度原創

手機
本地
房產
藝術
公開課

手機要聞

OPPO K15系列手機規格曝光:6.78英寸直屏、8000mAh電池

本地新聞

用蘇繡的方式,打開江西婺源

房產要聞

豪擲6.8億拿地!何猷君大手筆投資三亞!

藝術要聞

清風拂面,心曠神怡

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版