網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

3B激活參數！商湯絕影Sage登頂PinchBench，端側第一

2026-04-22 13:03:13　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：YHluck

【新智元導讀】一個3B激活參數的端側模型，在全球Agent權威評測中，以94%任務完成率，超越了Claude、GPT-5.4、Gemini等國際主流云側和端側大模型。商湯絕影Sage來了，它不是「更聰明的語音助手「，而是第一個真正能在車里「辦成復雜事「的智能體基座。

有人可能不信。

一個部署在車端的小模型，憑什么在Agent評測上贏過Claude、GPT-5.4？

數字擺在這里——在公開Agent評測基準PinchBench上，商湯絕影Sage端側大模型最佳任務完成率：94%。

同場較量的對手？Claude-Opus-4.6（93.3%）、GPT-5.4（90.5%）、Google-Gemini-3（87.0%）、Qwen3.5-27B（90.0%）……全部落后。

這不是一場「以大打大」的勝利。

Sage的激活參數只有3B，總參數量32B（MoE架構）。而小米MiMo-v2-Pro的激活參數是42B、總參數規模超1T——Sage所需激活算力僅為其1/14，顯存占用約為其1/31，但在PinchBench上的任務完成率仍高出6.6個百分點。

1/14的算力，多出6.6個百分點。

這是什么概念？

這意味著一件事被徹底證明了：「只有大模型才能做好Agent任務」，這個判斷，錯了。

從「聽懂指令「到「說到做到」

座艙缺的從來不是語音

先說說這個問題的背景。

今天的智能座艙，卡在哪兒？

不是沒有AI，是AI「太淺了」。

用戶說「幫我訂今晚回北京的高鐵，順便把車內溫度調低兩度」——現有的語音助手，大概率會拆解成兩件事分開問你確認，甚至直接說「我不太明白您的意思」。

這叫「能聽懂指令」，但不叫「能辦成一件復雜的事」。

真正的Agent能力，需要模型跨越多個步驟、多個工具、多輪推理，最終完成任務閉環。這種能力，過去只存在于云端大模型里。

原因很直接：車端芯片算力有限，大參數模型跑不動；小模型又沒有足夠的推理深度。

智能座艙因此陷入兩難：

依賴云端：有延遲、有成本、有斷網風險；堅守端側：有響應速度，但沒有真正的智能體能力。

Sage的發布，第一次打破了這個僵局。

效果先看

Sage在車里能「干」什么

空談技術路線，不如先看能力。

場景一：復合指令一次解析，多系統自動聯動

用戶說：「今晚出門晚，車內預熱一下，幫我把導航設回家，音樂切換到輕松一點的。」

Sage不需要用戶一句一句確認。

它一次性解析復合指令，自動聯動空調、導航、音樂三個系統，完成任務閉環——整個流程，首字響應約0.5秒，用戶幾乎感覺不到「等待」。

場景二：主動感知，不等喚醒

后排坐著孩子，傳感器檢測到，Sage主動觸發兒童模式：鎖定車窗控制權、切換適齡內容、調整音量上限。

沒有人喚醒它，它已經做了。

場景三：實時路況判斷，主動提出方案

進入擁堵路段，結合實時路況感知，Sage主動問：「當前路段預計延誤23分鐘，是否切換到備選路線？」

不只是回答，而是主動發起。

這三個場景，指向同一個能力轉變：Sage不再是「被動喚醒、單次響應」的語音助手，而是一個真正懂場景、會主動思考的出行伙伴。

在OrinX平臺部署下，Sage可實現首字響應（TTFT）約0.5秒、單Token推理延遲（TPOT）低至0.03秒、生成吞吐達到80tk/s，平均任務時長優于主流API模型，保證座艙體驗的穩定性和實時感。

兩項黑科技

一個讓它「學得快」

一個讓它「做事不出錯」

Sage在PinchBench跑贏一眾大模型的背后，真正的功臣是商湯絕影自研的兩項后訓練技術：SCOUT和ERL。

SCOUT：省60%算力，讓車載AI快速「學會」復雜出行任務

全稱：Sub-Scale Collaboration on Unseen Tasks（分級協同學習框架）。

它解決的是一個工程現實問題——讓大模型學習復雜任務，太貴了。

出行場景涉及空間規劃、多設備聯動、多步決策，直接讓大模型在真實任務中自己反復試錯，既慢又燒算力。

SCOUT的思路是「探路與吸收解耦」：先派一個輕量小模型快速跑一遍，把走得通的路徑篩出來，再把這些高價值經驗喂給大模型學習。

用類比來說，就是「小模型先探路、踩雷、找通道，大模型再吸收精華、直接上手」。

結果是：在復雜任務能力注入過程中，GPU小時消耗節省約60%，同時快速掌握更多真實用車場景技能。

技術論文已上傳arXiv：https://arxiv.org/abs/2601.21754

ERL：讓模型「邊想邊糾錯」，任務完成率提升20%

全稱：Erasable Reinforcement Learning（可擦除強化學習）。

這項技術已被機器學習頂級會議ICLR 2026收錄。

它解決的核心問題是：復雜任務鏈路里，一步出錯，全盤崩。

用戶說一句話，模型可能需要10步推理和執行。哪怕第7步偏了一點，前面6步的努力就白費，整個任務流程失效。

ERL讓模型能夠自動識別推理過程中的錯誤步驟，對錯誤內容進行擦除并重新生成，從源頭阻斷偏差擴散——就像給推理過程裝上了「實時橡皮擦」。

這項技術讓Sage在多跳復雜推理基準上較此前SOTA取得顯著提升，裝車后復雜任務完成率提升20%。

技術論文已上傳arXiv：https://arxiv.org/abs/2510.00861

SCOUT負責學習效率，ERL負責執行穩定性，兩項技術前后協同，共同推動Sage從語言大模型演進為能獨立完成復雜任務的智能體。

能力天花板

Sage和同級端側旗艦的差距有多大

PinchBench上的94%是綜合結果，具體能力維度上，Sage和行業參照點的差距更直觀。

對比對象：Google-Gemma4——本月最新發布的同量級端側旗艦。

跨學科專業知識（MMLUPro）：Sage 76分，領先同級端側模型約10%。端側模型，已具備云端級通用知識密度。

研究生級專業推理（GPQA Diamond）：Sage 77分，提升33%。這是考察深度推理的維度，也是Agent能否應對復雜決策的關鍵。

座艙語義與視覺理解（Human Semantic Understanding）：Sage 91分，提升32%。依托原生車載數據建立的差異化優勢，直接影響真實座艙體驗。

工具調用與任務閉環（τ2-bench）：Sage 80分，較Gemma4提升38%，接近翻倍領先。

最后這個數字值得單獨說一下。

τ2-bench，專門評估模型調用工具、走完多步任務的實戰能力——也就是「會聊天」和「會辦事」之間的分水嶺。

接近翻倍的領先，直接印證了Sage作為端側智能體基座在真實任務執行上的核心優勢。

市場轉折點

汽車AI的上半場，靠指令

下半場，靠Agent

為什么「端側Agent基座」這件事，現在重要？

先看一組行業現實。

當前搭載了「智能語音」的汽車，普遍存在同一個用戶體驗瓶頸：語音助手能聽，但不能想；能應答，但不能執行；能單步，但不能多步。

這不是某一家車企的問題，是整個行業在AI算力、模型能力和車端部署之間的結構性矛盾。

依賴云端方案的代價在放大：每次對話都要消耗Token，單任務token消耗就可達數十萬量級；網絡抖動就會影響體驗；數據隱私也是潛在風險。

端側部署才是量產落地的唯一可行路徑——但端側模型的能力天花板，一直是整個行業的卡脖子問題。

Sage的出現，正好踩在這個時間窗口。

Sage可接入OpenClaw、Hermes等主流Agent框架，不只是一個座艙大模型，而是一個為更多端側智能體落地提供核心支撐的基座——可覆蓋出行、家庭等全場景智能體部署。

北京車展期間，商湯絕影將正式推出搭載Sage端側多模態智能體基座大模型的SageBox，為汽車邁入超級智能體時代打下技術底座。

這意味著，車企在引入端側Agent能力時，有了一套經過全球評測驗證的量產方案。

商湯絕影

從「懂AI」到「懂車AI」的技術積累

Sage不是一款從零起步的產品。

它背后是商湯絕影多年在汽車AI領域的技術沉淀——從智能駕駛感知到座艙語義理解，再到今天的端側智能體基座，每一步都在向「真正懂車、懂人、懂場景」靠近。

Sage之所以能在Human Semantic Understanding（座艙語義與視覺理解）上拿到91分、提升32%，正是原生車載數據訓練的結果。

通用大模型的訓練數據里，沒有「車內乘員狀態感知」，沒有「駕駛場景多步決策」，沒有「空調+導航+影音聯動」這種出行場景特有的任務鏈路。

Sage有。

這種原生優勢，不是靠刷榜刷出來的，是靠在真實出行場景里長期訓練出來的。

智能座艙

正在迎來它真正的「奇點時刻」

回頭看汽車AI的發展歷程。

第一階段：語音識別，能聽懂人話。

第二階段：語音助手，能應答簡單指令。

第三階段：大模型接入，能對話、能聊天。

現在，第四階段來了——

能獨立規劃、能多步執行、能主動感知、能在車端實時完成復雜任務的端側智能體。

Sage代表的技術方向，不只是「更聰明的語音助手」，而是從根本上改變人與汽車的協作方式。

用戶不再需要把一件事拆成十個指令說給汽車聽，汽車開始真正理解「你想要什么」，然后想辦法幫你做到。

3B激活參數贏過了一眾云端旗艦，這個結果告訴行業：智能座艙的上限，不在云端，在端側原生技術路線上還有更多可能。

SageBox即將亮相北京車展。

下一代汽車AI的樣子，已經在那里了。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

設計大氣配置齊全，配副駕零重力座椅！全新阿爾法S5座艙體驗

汽車焦點 2026-04-21 10:53:54
30 跟貼 30
多維舒適+硬核安全，問界M7用硬實力打造30萬級SUV價值之選

汽車天涯 2026-04-22 13:41:01
0 跟貼 0

日產又掀桌子？天籟鴻蒙座艙，優惠后就賣12萬？

汽湃 2026-04-21 11:26:06
0 跟貼 0

上海首臺零跑D19提車，落地花了多少錢？

AL 頻道 2026-04-22 14:53:16
0 跟貼 0
最懂中國家庭的四驅方盒子哈弗猛龍 PLUS

凹凸之道 2026-04-22 13:09:50
0 跟貼 0

理想Livis是什么？不止是車型，更是技術與體驗的升級延伸

凡兮說 2026-04-22 14:07:06
0 跟貼 0

風云T9L深度試駕，不堆參數堆體驗，奇瑞這次變了

車行生活 2026-04-20 21:18:53
6 跟貼 6
智駕深水區，傳統車企靠AI破局？

蓋世汽車 2026-04-22 10:40:06
0 跟貼 0

理想汽車首發高德AI Agent，小鵬蔚來各有動作

i黑馬 2026-04-22 11:38:24
2 跟貼 2
基于異構邊緣終端的端側AI統一架構研究與實踐

通信世界 2026-01-20 11:56:04
0 跟貼 0
渡船以渡車為主渡客為輔，女子慢悠悠上船被直接落下

南陽日報 2026-04-21 18:57:27
144 跟貼 144
“90后”的他半月內兩上《新聞聯播》，現在又交新作業

貝殼財經 2026-04-22 15:16:18
0 跟貼 0
寧德時代麒麟凝聚態電池發布，最高續航1500公里

新京報 2026-04-21 20:38:22
1794 跟貼 1794
英偉達 CEO 黃仁勛：AI 智能體不會取代軟件公司，反而會使軟件需求暴增！

知了3C 2026-04-22 03:24:06
0 跟貼 0
滿分座艙滿配登場別克至境E7正式上市交付置換價15.49萬起

那輛車 2026-04-22 14:48:15
0 跟貼 0
從通才到專家，NeoCognition融資4000萬美元押注AI自主進化

智東西 2026-04-22 12:23:09
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
座艙卷起來了！奧迪E7X全新內飾揭秘：甄選頭層牛皮 28道原木工序

快科技 2026-04-22 14:53:06
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
華為乾崑用三個故事把智能汽車的"安全"講清楚了

汽車相對論 2026-04-21 19:31:49
4 跟貼 4
PackingStar雙智能體博弈，攻克14維難題

量子位 2026-02-16 13:12:43
0 跟貼 0
俄軍總參謀長稱已完全控制盧甘斯克地區

財聯社 2026-04-21 17:16:23
2180 跟貼 2180
大爺駕駛MPV強穿掛壁公路，出來時全車被刮花

荔枝新聞 2026-04-22 05:14:55
91 跟貼 91
什么是Token？5分鐘徹底搞懂大模型Token 原理、計算方式與作用詳解！

盧菁老師 2026-04-20 11:49:21
0 跟貼 0
Meta采集員工鼠標和鍵盤輸入數據只為訓練AI！

財聯社 2026-04-22 14:18:13
4 跟貼 4
V8發動機模型

制造科技 2026-04-19 17:41:19
0 跟貼 0
他們為什么要用機器把魚兒到處撒

酒癡說夢 2026-04-20 10:47:20
1 跟貼 1
巴鐵丈母娘來河南農村，第一次見機器收玉米：中國高科技太牛了!

呆毛隆隆 2026-04-22 09:44:32
0 跟貼 0
深耕智造賽道！孝感這家企業為汽車織就高速“神經網絡”

孝感匯 2026-04-22 11:29:25
0 跟貼 0
謝鋒:中國大蒜做夢也沒想到會被美列為"國家安全威脅"

極目新聞 2026-04-22 08:45:19
278 跟貼 278
油漆調色機器搭配，最后效果出乎意料，比例把控的太好了！

湯細目生活 2026-04-18 11:18:42
0 跟貼 0
自爆機器人來了

呆毛隆隆 2026-04-22 01:24:27
0 跟貼 0
【你的AI靠不靠譜？】大模型項目落地評測標準：5 大類 30項指標，從技術到商業全覆蓋！AI大模型

盧菁老師 2026-04-22 09:25:00
0 跟貼 0
安心養蝦！從OpenClaw 看云上AI安全落地路徑

量子位 2026-04-18 19:55:39
0 跟貼 0
機器人跑贏人類半馬之后：關節進化、資本狂熱與一場國產替代的技術革命

每日經濟新聞 2026-04-22 14:09:05
0 跟貼 0
華為Pura X Max首發伴隨式AI：小藝從“隨叫隨到”到“無處不在”

雷科技 2026-04-22 12:00:31
0 跟貼 0
爆火！把智能體當游戲角色來玩，一個人就是一個公司

機器之心Pro 2026-02-12 18:04:44
0 跟貼 0
汽車車尾放了個“手機”，大哥下車提醒結果被無視了，網友：那是個模型吧

星沙時報 2026-04-21 17:02:16
3 跟貼 3
亦莊機器人馬拉松現場名場面合集

量子位 2026-04-20 00:34:54
5 跟貼 5
全球首個世界統一模型發布，機器人家庭成員來了！

量子位 2026-04-22 13:48:58
0 跟貼 0

“我是上海人”，視頻中女子至少說了10遍！一健身房沖突登上熱搜

“我是上海人”，視頻中女子至少說了10遍！一健身房沖突登上熱搜

火山詩話

2026-04-22 06:18:32

伊朗：將于29日舉行展現國家力量的大游行，精銳部隊隨時準備開火

伊朗：將于29日舉行展現國家力量的大游行，精銳部隊隨時準備開火

上游新聞

2026-04-22 07:08:07

出獄12年，他抱著舊鋼琴直播哽咽：楊鈺瑩是我這輩子沒翻過去的山

出獄12年，他抱著舊鋼琴直播哽咽：楊鈺瑩是我這輩子沒翻過去的山

西莫的藝術宮殿

2026-04-22 12:31:04

燃氣公司上門安檢，根本不是查漏氣！真正目的其實是這3個

燃氣公司上門安檢，根本不是查漏氣！真正目的其實是這3個

匹夫來搞笑

2026-04-20 13:24:51

四年暴跌120億，微信是怎么“殺死”口香糖行業的？

四年暴跌120億，微信是怎么“殺死”口香糖行業的？

流蘇晚晴

2026-04-19 20:34:47

41歲詹姆斯再演“控場神作”，湖人穩勝火箭！這才是傳奇的含金量

41歲詹姆斯再演“控場神作”，湖人穩勝火箭！這才是傳奇的含金量

石月故事集

2026-04-22 14:47:35

廣州男子放棄月薪過萬白領工作，甘愿從學徒做起，終成咖啡烘焙全國冠軍

廣州男子放棄月薪過萬白領工作，甘愿從學徒做起，終成咖啡烘焙全國冠軍

環球網資訊

2026-04-22 14:42:17

宣布退役又被球隊叫回來了？想白嫖1100萬沒門，雄鹿要求其轉顧問

宣布退役又被球隊叫回來了？想白嫖1100萬沒門，雄鹿要求其轉顧問

大魚簡科

2026-04-22 14:40:56

1948年這才是蔣中正和宋美齡真實的貌相，不是演員飾演的角色！

1948年這才是蔣中正和宋美齡真實的貌相，不是演員飾演的角色！

手工制作阿殲

2026-04-22 09:56:04

肝脂降低20%！復旦研究：這樣吃，僅需三個月，超8成人脂肪肝好轉

肝脂降低20%！復旦研究：這樣吃，僅需三個月，超8成人脂肪肝好轉

思思夜話

2026-04-21 11:18:45

鄭少秋4個女兒：老大55歲自縊，老二38歲抑郁，老三老四享盡父愛

鄭少秋4個女兒：老大55歲自縊，老二38歲抑郁，老三老四享盡父愛

照見古今

2026-04-08 18:17:49

趙麗穎從頭到腳都美得亮眼，這張圖誰看了不叫一聲封神？

趙麗穎從頭到腳都美得亮眼，這張圖誰看了不叫一聲封神？

可樂談情感

2026-04-22 12:10:12

許家印認罪！2.4萬億窟窿，家族只拿走500億，其余真金白銀去哪了

許家印認罪！2.4萬億窟窿，家族只拿走500億，其余真金白銀去哪了

混沌錄

2026-04-21 20:59:13

存款大局已定！若無意外，2026年銀行利率或將迎來4大變化

存款大局已定！若無意外，2026年銀行利率或將迎來4大變化

復轉這些年

2026-04-21 18:33:57

還得靠馬寧？亞冠主裁昏了頭:因日本隊未完成換人吹掉對手絕平球

還得靠馬寧？亞冠主裁昏了頭:因日本隊未完成換人吹掉對手絕平球

風過鄉

2026-04-22 07:02:48

“老實人”任重甘愿成為接盤俠，迎娶內娛第一海王，網友：配一臉

“老實人”任重甘愿成為接盤俠，迎娶內娛第一海王，網友：配一臉

秋姐居

2026-04-22 14:42:03

“哥，媽病了，和嫂子取消各管各媽”哥哥：離了，讓她自生自滅吧

“哥，媽病了，和嫂子取消各管各媽”哥哥：離了，讓她自生自滅吧

廣西秦胖胖

2026-04-21 10:49:58

從中國出發的貨輪，美軍以運送武器為由炮擊并扣押，東大嚴正回應

從中國出發的貨輪，美軍以運送武器為由炮擊并扣押，東大嚴正回應

阿龍聊軍事

2026-04-22 14:56:36

本想秀恩愛，沒想到成笑柄，自毀體面的郭富城，證實熊黛林沒說謊

本想秀恩愛，沒想到成笑柄，自毀體面的郭富城，證實熊黛林沒說謊

阿郎娛樂

2026-04-22 03:43:18

A股：今天，4月22日，行情很反常，釋放了兩個重要信號！

A股：今天，4月22日，行情很反常，釋放了兩個重要信號！

明心

2026-04-22 11:35:14

AI產業主平臺領航智能+時代

15037文章數 66797關注度

往期回顧全部

汽車要聞

純電續航301km+激光雷達宋Pro DM-i飛馳版9.99萬起

頭條要聞

媒體:愛奇藝AI藝人庫惹眾怒 CEO龔宇的解釋站不住腳

頭條要聞

媒體:愛奇藝AI藝人庫惹眾怒 CEO龔宇的解釋站不住腳

體育要聞

網易傳媒再度簽約法國隊和阿根廷隊

娛樂要聞

復婚無望！baby黃曉明陪小海綿零交流

財經要聞

伊朗拒絕出席特朗普宣布延長停火期限

科技要聞

對話梅濤：沒有視頻底座，具身智能走不遠

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

房產

教育

親子

旅游

家居要聞

極簡繪夢克制和諧

詩意光影窺見自然之境
自然慢調慢享時光
法式線條時光靜淌

房產要聞

狂搶284輪！中海海口再拿重磅宅地！

教育要聞

“難怪窮女孩嫁不到真少爺”，高鐵小少爺事件，撕碎普通家長幻想

親子要聞

飛鶴，困在“人海戰術”里

旅游要聞

北京歡樂谷也有摩天輪了，北京最高、6月底運營

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版