无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

CVPR 2026 四篇論文透視:大廠如何靠「算法瘦身」對抗算力漲價?

0
分享至


2026年,大廠們不再比誰的GPU多,而是比誰的算法更聰明。

作者丨陳淑瑜

編輯丨岑 峰

一個在2026年越來越難以回避的問題是:如果H100全面斷供、電費賬單直線飆升、訓練一次大模型的成本足以買下一家創業公司,大模型的故事還講得下去嗎?

也許頂級學術會議的論文能給大家一個新的啟發。

今年的CVPR收到了四千余篇投稿,其中一個清晰的信號正在浮現:大廠不再比拼GPU數量,而是較量如何把GPU用得更好。算力封鎖之下,算法正在成為新的護城河。

在論文的汪洋中,字節跳動Seed團隊是出手最密集的玩家之一。

AI 科技評論聚焦四篇來自字節跳動的論文——TEMF、Beyond Token Eviction、Mixture-of-Depths Attention和GenieDrive。它們全都圍繞一個核心命題展開:當算力不再能夠"暴力"解決,算法如何接棒?

這四篇論文覆蓋了一條完整的鏈條:從生成模型的采樣步數壓縮,到推理過程的顯存瘦身,再到注意力計算資源的動態分配,最終延伸到端側部署的物理感知。它們不是孤立的創新,而是Seed團隊圍繞"算力降本"這一命題打出的組合拳。

01


采樣降速:一步生成的尺度跨越

大模型的推理成本,很大程度上藏在采樣步數里。

以Stable Diffusion為代表的多步迭代生成,一個看似簡單的512×512圖像,背后可能是50到100次神經網絡前向傳播。訓練時模型學到的是“每一步該怎么加噪”,但推理時模型需要做的是“每一步該怎么去噪”,這兩個過程天然不對稱,訓練目標與推理目標之間存在一道看不見的裂縫。

傳統MeanFlow的尺度差距問題正源于此:一步生成的質量始終無法與多步采樣競爭,而多步采樣意味著成倍增加的算力消耗。

字節跳動Seed團隊提交的TEMF(Temporal Equilibrium MeanFlow)正是對這一困境的直接回應。

TEMF的核心設計是讓模型在訓練階段就同時學習“從數據到噪聲”和“從噪聲到數據”的雙向變換,而非像傳統歸一化流那樣只學習單向映射。

雙向建模的效果立竿見影,模型在訓練時就熟悉了反向采樣的路徑,推理時不再需要依賴多步迭代來逐步精煉,可以直接從噪聲出發、在單次前向傳播中完成整個生成過程

這種從百次計算到一次計算的跨越,在實際部署中帶來的成本削減是數量級的。


論文地址:

https://cvpr.thecvf.com/virtual/2026/poster/39823

有意思的是,這道裂縫的修補并非只有一種解法。同期Meta發表的Improved Mean Flows從原理層面分析了快轉發聲模型訓練與推理不對稱的根源,并提出了自己的改進框架。(Improved Mean Flows的論文解讀可閱讀:)


論文地址: https://arxiv.org/abs/2512.02012

兩支獨立團隊在幾乎同一時間節點做出了相似的技術判斷——一步生成不是天方夜譚,關鍵在于彌合訓練與推理之間的結構性裂縫。這不是巧合,這是行業共識正在形成的信號。

02


顯存瘦身:KV Cache的精準壓縮

如果說TEMF解決的是計算次數的問題,那么另一篇字節跳動Seed團隊的工作Beyond Token Eviction,則直指推理過程中另一個更隱蔽的成本中心:顯存占用

理解KV Cache的機制,是理解大模型推理成本的關鍵切口。

當大語言模型處理一段文本時,它需要記住此前所有詞元的信息才能生成下一個詞元。每一個經過注意力計算的詞元,都會在顯存中留下一組對應的向量,這些向量是模型“上下文記憶”的物理載體。

問題在于,這種“記憶”是只增不減的。當上下文窗口從4K擴展到32K、再到100K,KV Cache的顯存占用也在同步膨脹。

一個有100K上下文窗口的模型,僅KV Cache就可能消耗40到60GB的顯存,而消費級顯卡的顯存上限不過24GB,就連專業級A100也不過80GB。也就是說,在不遠的將來,顯存瓶頸會比計算瓶頸更早到來。

傳統解法“Token Eviction”是在顯存壓力過大時,將一部分“不那么重要”的舊Token驅逐出去,釋放空間給新的Token。

而Beyond Token Eviction的突破則在于“混合維度預算分配”策略。它不再將Token的存留視為非此即彼的二元判斷,而是允許不同Token擁有不同的“精度維度”指標。重要的Token保留更高的維度,從而完整存儲其語義信息;不那么關鍵的Token被壓縮到更低的維度,以更少的空間保存其核心語義。

這種“混合維度”策略的本質是對信息做“有損壓縮”而非“徹底刪除”。被壓縮的Token仍然保留著足夠用于后續推理的語義信息,而模型通過訓練學會了“自適應地”判斷哪些Token值得高精度、哪些可以接受低精度。

系統不再需要在“全部保留”和“全部丟棄”之間做選擇,而是在精度與效率之間找到了一個可調的平衡點。


用于KV緩存壓縮的雙階段尺寸分配流程

更難得的是,這套方案無需對模型進行任何重訓練。云廠商可以直接將它部署在現有推理框架上,以工程側的輕量改動換取顯存占用的大幅下降。


論文地址:https://arxiv.org/pdf/2603.20616

這正是當前大廠在降本路徑上最務實的選擇:不是推翻重來,而是在既有架構上做“微創手術”。

03


計算平等:讓模型自己分配算力

采樣步數降了,顯存空間省了,但字節在注意力計算的效率問題上也沒有閑著。他們的Mixture-of-Depths Attention,從計算資源分配策略的維度提供了一種正交解法。

傳統Transformer在處理每個Token時,都會執行完整的注意力計算。這意味著,即使某個Token在當前語境下的語義貢獻微乎其微,它仍然會消耗與其他Token同等的計算資源。這種“一視同仁”的計算策略,本質上是一種隱性的算力浪費。

新的思路由此出發:并非所有Token都需要被“深度處理”。它引入了一種動態路由機制,讓模型在運行時自主決定——哪些Token值得走完整的注意力計算路徑,哪些Token可以被引導至更輕量的快速路徑。


混合深度注意力機制MoDA

結果隨之而來:系統層面的有效計算量顯著下降,但模型輸出的質量并未等比例衰減。真正重要的Token仍然得到了充分的計算資源,而大量“搭便車”的Token被引導至旁路。

這種“讓模型自己判斷輕重緩急”的思路,代表了算法層面“降本增效”的一種優雅路徑。這與混合專家(MoE)模型的設計哲學一脈相承,但不是整個模型層的專家切換,而是在每個注意力層做細粒度的資源調度。

模型在訓練過程中學會動態分配計算預算,而非通過硬編碼的稀疏規則強行削減計算量——好鋼用在刀刃上,這是2026年算法工程師們最希望模型學會的本事。


論文地址:https://arxiv.org/pdf/2603.15619

04


端側部署:物理感知驅動的世界模型

上述三篇工作幾乎都在回答同一個問題:如何在有限的算力約束下,讓模型跑得更快、占得更少。但字節跳動在GenieDrive這篇工作中,提出了一個更遠見的問題:高效模型在端側能做什么?

自動駕駛的視覺感知系統,一直是算力軍備競賽的重災區。傳統自動駕駛的感知系統依賴多傳感器融合,各司其職又彼此冗余,在算力有限的嵌入式平臺上捉襟見肘。

GenieDrive把這個問題拆解得更深了一層。它搭建了一種“物理感知驅動的4D占用引導視頻生成”框架,不再將視覺感知視為一個“看懂圖像”的問題,而是將其視為一個“理解物理世界如何運轉”的問題,不僅讓模型生成視覺上逼真的駕駛場景視頻,還讓模型具備對物理規律的基本理解,比如運動物體的軌跡遵循物理動量、遮擋關系遵循空間一致性、光照變化遵循物理反射模型。

這種設計的直接效果是:GenieDrive生成的不是一段“視覺上逼真的視頻”,而是一個“物理上可信的4D模擬環境”。

當這個模擬環境可以直接服務于下游的軌跡規劃和決策控制時,端側模型的商業價值就超越了單純的速度競賽。比如說如果模型能夠準確預測“兩秒后前方車輛會因為慣性繼續滑行兩米”,這個信息對于緊急制動的決策價值,遠高于“那個地方有一輛車”的語義標簽。

值得注意的是,GenieDrive的高效性并不來自單一算法的突破,而是來自“4D表示+物理先驗+端到端聯合優化”的協同設計。它代表了2026年大廠在高效視覺表征上的另一條路徑:不只是讓模型跑得更快,而是讓模型“想得更少、做得更準”。


論文地址:

https://www.paperdigest.org/paper/?paper_id=cvpr-36900-2026-04-21

05


結語:算法天才的元年

縱觀字節跳動Seed團隊在CVPR 2026上這四篇論文,一個清晰的敘事正在浮現:算力封鎖并沒有殺死創新,反而催生了一種更精致的工程哲學。

TEMF用“時間均衡”彌合了訓練與推理的結構裂縫,讓一步生成從不可能變成了工程現實;

Beyond Token Eviction用“混合維度”重新定義了信息的取舍策略,讓顯存壓縮從粗暴刪除變成了精細調控;

Mixture-of-Depths讓計算資源學會了「按需分配」,讓模型自己成為計算預算的聰明管家;

GenieDrive則將高效表征引向了物理可解釋的端側應用,讓速度競賽升維為智能競賽。

這四條路徑指向同一個結論:2026年不是“大模型時代的終結”,而是“聰明模型時代的元年”。當暴力堆砌算力的路徑變得不可持續,那些能夠用更少資源做更多事情的算法天才,正在成為這個時代最稀缺的人才。

對于CTO和云廠商而言,字節的這組論文給出了一個清晰的信號:與其等待下一代芯片的算力提升,不如今天就擁抱這些算法優化帶來的降本紅利。

對于軟硬件開發者而言,這意味著新的機會窗口正在打開:適配ELSA這類硬件無關內核的編譯器優化、基于動態注意力路由的模型壓縮工具、面向4D物理感知模型的端側部署框架,每一個環節都是尚未被充分開采的富礦。

算力封鎖的本質是一道經濟命題,但它的解法,最終要靠算法給出。

這次去 CVPR 現場,一定不要錯過

【認識大牛+賺外快】的機會

需要你做什么:把你最關注的10個大會報告,每頁PPT都拍下來

你能獲得什么?

認識大牛:你將可以進入CVPR名師博士社群;

錢多活少:提供豐厚獎金,任務量精簡;

聽會自由:你的行程你做主,順手就把外快賺。拍下你最感興趣的10個報告PPT即可。

如果你即將前往CVPR,想邊聽會邊賺錢,還能順便為AI學術社區做貢獻、認識更多大牛,歡迎聯系我們:[添加微信號:MS_Yahei]

【限額5位,先到先得】

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
李中華任鄭州市委副書記

李中華任鄭州市委副書記

汲古知新
2026-06-13 00:08:56
60歲男子與女子在車內發生親密行為猝死,家屬起訴女方索賠32萬余元被駁回

60歲男子與女子在車內發生親密行為猝死,家屬起訴女方索賠32萬余元被駁回

紅星新聞
2026-06-13 11:34:09
巴基斯坦總理:伊朗和美國已就協議文本達成一致

巴基斯坦總理:伊朗和美國已就協議文本達成一致

財聯社
2026-06-13 00:32:03
具俊曄首曝與大S20年前舊居,蹭熱度令人不恥

具俊曄首曝與大S20年前舊居,蹭熱度令人不恥

仙味少女心
2026-06-13 23:14:06
美國隊追平隊史世界杯最大比分勝利!阿湯哥、小李子、貝克漢姆……一眾名流現場觀賽

美國隊追平隊史世界杯最大比分勝利!阿湯哥、小李子、貝克漢姆……一眾名流現場觀賽

紅星新聞
2026-06-13 12:05:58
成都蛋烘糕婆婆:配合拍視頻1000一條,否則追究相關法律責任

成都蛋烘糕婆婆:配合拍視頻1000一條,否則追究相關法律責任

映射生活的身影
2026-06-13 19:55:10
癌癥的源頭被查出,燒烤沒上榜,第1名大家可能每天都在吃!

癌癥的源頭被查出,燒烤沒上榜,第1名大家可能每天都在吃!

路醫生健康科普
2026-06-12 16:23:10
水果姐為美國男足揭幕戰表演,與提烏斯-盧卡一同獻唱

水果姐為美國男足揭幕戰表演,與提烏斯-盧卡一同獻唱

懂球帝
2026-06-13 09:17:14
“去上海住哥哥家被警告”引群嘲,揭開了當下社會最殘酷的真相

“去上海住哥哥家被警告”引群嘲,揭開了當下社會最殘酷的真相

卷史
2026-06-13 06:29:19
釘釘員工自曝作息大改,內部爭議曝光

釘釘員工自曝作息大改,內部爭議曝光

影視情報室
2026-06-14 00:39:31
中紀委怒批:公務員也是人,正常生活不應問責處理!

中紀委怒批:公務員也是人,正常生活不應問責處理!

細說職場
2026-06-13 12:51:02
震撼,波黑球迷開始在多倫多街頭集結,并高喊口號支持巴勒斯坦

震撼,波黑球迷開始在多倫多街頭集結,并高喊口號支持巴勒斯坦

懂球帝
2026-06-13 01:18:15
先定罪,再調查,保證沒有冤假錯案

先定罪,再調查,保證沒有冤假錯案

我是歷史其實挺有趣
2026-06-13 12:14:28
口交、肛交等進入式性服務是賣淫行為嗎?最高院定調了!

口交、肛交等進入式性服務是賣淫行為嗎?最高院定調了!

黯泉
2026-06-02 11:54:54
她29歲中央委員、37歲省委書記,41歲主動到縣里任職

她29歲中央委員、37歲省委書記,41歲主動到縣里任職

數字化看世界
2026-05-31 17:37:58
中日要開戰?日專家曾預測:與中國發生沖突,最長只能堅持兩周

中日要開戰?日專家曾預測:與中國發生沖突,最長只能堅持兩周

別吵吵
2026-06-09 08:56:42
王毅收到蒙古國外長的邀請,稀土外運日本一事,想聽聽中方想法?

王毅收到蒙古國外長的邀請,稀土外運日本一事,想聽聽中方想法?

共工之錨
2026-06-13 00:25:29
斯坦福顛覆認知!對腸道好的不是粗糧,發酵食物反而護腸、強免疫

斯坦福顛覆認知!對腸道好的不是粗糧,發酵食物反而護腸、強免疫

思思夜話
2026-06-12 13:24:03
什么是知識的詛咒?網友:但凡被知識污染一點也想不出淡硫酸這詞

什么是知識的詛咒?網友:但凡被知識污染一點也想不出淡硫酸這詞

另子維愛讀史
2026-06-13 23:39:37
蘋果首款折疊屏“iPhone Ultra”細節全曝光 無折痕、取消Face ID

蘋果首款折疊屏“iPhone Ultra”細節全曝光 無折痕、取消Face ID

CNMO科技
2026-06-11 09:30:19
2026-06-14 06:16:49
AI科技評論 incentive-icons
AI科技評論
點評學術,服務AI
7372文章數 20757關注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

特朗普:美伊協議計劃周日簽署 如不順利還有終極手段

頭條要聞

特朗普:美伊協議計劃周日簽署 如不順利還有終極手段

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

親子
教育
游戲
藝術
手機

親子要聞

真正覺醒的家庭

教育要聞

干脆把爹媽也換了!女兒高考完讓家長崩潰,不讓人喘口氣嗎嘛

LPL淘汰賽:就差一點,今天無奇跡!BLG五局戰勝WE,決賽見

藝術要聞

廣州再建一座“小蠻腰”?190米,頂著個球,2027年見!

手機要聞

比華為三折疊還稀缺!iPhone Ultra國行備貨量不足:博主直言搶到賺到

無障礙瀏覽 進入關懷版