4月24日,商湯絕影在本屆北京車展重磅發布SageBox(千機智盒),為自主智能體進化提供了一套全棧量產級創新方案,以顛覆性技術突破,為車企破解行業痛點的同時,帶來從成本到體驗的多重價值革新。
![]()
作為面向全場景的端側智能中樞,SageBox 最具革命性的突破是通過搭載端側多模態智能體基座大模型Sage 32B,實現“一次投入、Token 永久免費”。按單臺車日均節省 30 元云端成本計算,每 1 萬輛車每年可為車企節省至少 1 億元,徹底擺脫了云端按次計費的成本枷鎖。
![]()
Sage Box以“Sage 32B 端側模型+千機系統(Sage AIOS)+New Member 原生智能體執行” 三層架構為支撐。 Sage 大模型采用 MoE 架構,激活參數僅 3B,在 Orin X 等主流車規平臺即可高效運行,突破原車 SoC 算力天花板;基于 Harness 架構的千機 AIOS,大幅提升多任務調度效率并降低開發壁壘,解決系統開發難題;本地部署模式徹底擺脫云端依賴,從根源上消除 Token 成本無底洞,同時保障交互低時延與數據安全。
SageBox 的發布,不僅為車企打造高性能、低成本、可量產的高階智能座艙方案,更依托一腦多形核心架構打破車載場景邊界。依托端側原生與全棧自研技術優勢,它可靈活適配多元場景,實現全域能力復用,推動行業向超級智能體進化的全新路徑。
零成本、快響應、高精準,商湯絕影引領座艙智能體新發展
Sage Box依托專為原生智能體座艙打造的端側大模型,憑借 Token(詞元) 零成本交互、Always-on 實時響應、超 90% 場景推理精度三大核心優勢,從成本、體驗、智能三大維度突破行業瓶頸,全面升級智能座艙交互體驗,為座艙智能體落地奠定堅實基礎。
![]()
針對行業普遍存在的云端 API 調用 Token 計費痛點,Sage 32B 依托端側原生部署架構實現 Token 零成本交互。經輕量化優化與車載算力深度適配,滿足全場景用車需求,日均可節省30 元 Token 使用費,年均節省 Token 使用費萬元左右。對車企而言,可徹底免除云端服務費用,打破規模化運營成本壁壘;對用戶來說,交互無次數限制,可自由暢聊并下達指令。
在響應速度上,Sage 端側大模型實現 Always-on 全天候待命,指令整體延遲低于 0.5 秒,單次推理延遲僅 0.03 秒,生成吞吐達80 token/秒。不同于云端模型易受網絡波動影響,該模型常駐本地算力單元,無需聯網與云端調度,隧道、車庫等弱網環境也能即時反饋。
在智能理解層面,Sage 端側大模型場景推理精度超 90%,可一次性解析用戶復雜需求,自動聯動空調、影音、導航等車載系統完成任務閉環,還能結合傳感器感知乘員與路況信息,提供兒童模式、智能路線調整等主動服務。
94%高成功率超旗艦模型,Sage 模型性能超越一線云端大模型
商湯絕影發布的 Sage 端側多模態智能體基座大模型,以 MoE 架構、自研后訓練技術與車端原生優化,實現了端側模型性能反超云端旗艦的突破,為車載智能體規模化落地提供了兼具高性能、低成本與高可靠的核心支撐。
![]()
Sage 采用 32B 總參的 MoE 架構,激活參數僅 3B,是行業首款能在車端實現復雜智能體能力的基座大模型。在國際公開評測 PinchBench 中,其最佳任務完成率達 94%,超越 Claude、GPT、Gemini 等一眾云端大模型,打破“只有大模型才能做好智能體任務”的慣性認知。對比小米 MiMo-v2-Pro,Sage 激活算力僅為其1/14,顯存占用約1/31,卻實現了6.6個百分點的任務完成率領先,展現出端側原生路線的極致高效。目前該模型已在英偉達 Orin X 平臺完成部署,為量產落地奠定基礎。
![]()
![]()
支撐 Sage 性能突破的,是商湯絕影自研的 SCOUT 與 ERL 兩大后訓練技術。SCOUT 分級協同學習框架創新采用“小模型探路、大模型吸收”的機制,讓模型學習復雜出行場景任務時節省60%的 GPU 算力,大幅降低訓練成本與周期,快速掌握多設備聯動、多步決策等用車場景技能;ERL 可擦除強化學習技術,能讓模型自動識別并擦除推理過程中的錯誤步驟,阻斷偏差擴散,使復雜任務完成率提升20%,解決了多步推理中“一步錯、步步錯”的行業難題,該技術已被機器學習頂會 ICLR 2026 收錄。
在 Orin X 平臺上,Sage 實現0.5秒首字響應、0.03秒單 Token 推理延遲與80tk/S生成吞吐,平均任務時長優于主流 API 模型。其場景推理精度超 90%,長鏈路工具調用、邏輯規劃、環境感知任務成功率分別達92%、89%、94%,復雜指令遵循率提升40%。模型可一次性解析復合指令,聯動空調、影音、導航完成任務閉環;結合傳感器感知乘員狀態與路況,還能主動提供兒童模式、路線調整等服務,徹底告別 “被動喚醒、單次響應” 的傳統語音助手,進化為懂場景、會思考、能服務的出行伙伴。
此外,Sage 支持 OpenClaw、Hermes 等主流智能體框架,可覆蓋出行、家庭等全場景,為更多端側智能體落地提供核心支撐。
40%決策提速、百種工具調用,New Member 讓車載智能 “說到做到”
New Member 是商湯絕影 SageBox 千機智盒的執行層原生智能體,作為車載版“Claw”,它是連接“思考層”與真實場景的關鍵橋梁,為車載自主智能體提供從感知到執行的全鏈路閉環能力。
![]()
它以 Always-on 多模態感知為基礎,實現小于1秒的低時延響應,可實時捕捉座艙內外的多模態信號,為后續決策提供毫秒級輸入,支撐主動交互與環境理解。
結合專屬認知記憶框架,通過沉淀用戶習慣與場景數據,在意圖理解與任務規劃時快速匹配最優策略,將決策效率提升40%;同時內置超100種車控及生態工具技能,通過“意圖理解→任務規劃→工具調用→記憶迭代”的完整執行閉環,將 Sage 端側模型的“思考指令”轉化為可落地的車控、服務動作,讓智能體從“會想”真正走向“會做”,賦能座艙實現全場景自主執行。
以 AIOS 為核心、打造高效安全智能中樞
Sage AIOS是商湯絕影 SageBox 的核心調度中樞,基于 Harness 架構深度打造,為車載自主智能體提供高效、低成本、高安全的底層支撐,破解行業 AIOS 開發難題。
![]()
對比通用 OpenClaw 架構,Harness 架構通過工具、資源、環境等多維度約束,實現了Tokens 消耗降低 50%、多任務調度效率提升 30%,大幅降低車載大模型運行成本,為智能體規模化落地掃清成本障礙。
安全層面,千機系統構建了三層加固體系:運行沙盒隔離、工具調用管控、數據訪問防護,為智能體運行筑牢全鏈路安全屏障,確保復雜車載環境下的穩定可控。
系統內核以多模融合、模型調度、記憶服務、本地 RAG 等模塊為核心,為 New Member 原生智能體提供上下文窗口、任務調度、提示詞構建等基礎能力;向下對接多模態模型與數據底座,向上支撐全場景智能體任務,實現從感知到執行的全鏈路協同調度,成為千機智盒實現 “能思考、善調度、會執行” 閉環的關鍵支撐,為智能座艙向自主智能體進化提供堅實系統底座。
一腦多形全域賦能,構筑全場景智能新生態
商湯絕影 SageBox 千機智盒以“一腦多形”核心能力,打破單一設備的智能邊界,為車載、家用、陪伴等全場景智能終端注入統一的可進化 AI 大腦,構建起覆蓋生活全維度的智能生態。
![]()
作為核心智能中樞,千機智盒向下兼容車載座艙、家用邊緣設備、陪伴機器人等多元終端,向上支撐個性化場景需求。在車載座艙場景,它化身專屬座艙大腦,依托生成式智駕與原生智能體,打造艙駕融合的智慧出行體驗;在家用邊緣場景,可成為智能家居控制中樞,聯動燈光、家電實現無感智能交互;在陪伴機器人場景,則能賦予設備擬人化感知與執行能力,提供情感陪伴、任務協助等全場景服務。
千機智盒憑借端側大模型、AIOS 調度與原生智能體三層技術架構,實現跨終端的統一智能能力輸出,無需為不同設備單獨開發智能系統。這種“一腦驅動多終端”的模式,不僅降低智能設備研發成本,更讓各場景終端共享自主智能體能力,推動智能終端從單一功能工具,進化為可感知、會思考、能執行的全場景智能伙伴,加速全場景智能生態的落地普及。
立足全棧 AI 技術積淀,商湯絕影 SageBox 千機智盒以端側超強模型能力、零 Token 極致降本、全鏈路智能體閉環三大核心優勢,從車載座艙的自主智能體升級,到一腦多形的全場景生態延伸,為車企帶來億元級規模化降本紅利,更以領先行業的 AI 底座技術,重新定義終端智能體的發展范式。
未來,商湯絕影將持續深耕生成式 AI 前沿領域,攜手產業伙伴協同共進,加速智能汽車向超級智能體全面進化,以全域、高效、普惠的智能技術,賦能智慧出行與全場景智慧生活,開啟自主智能體規模化落地的全新時代。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.