无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

騰訊AI還有一張暗牌

0
分享至



  • “明牌秀肌肉,暗牌亮底牌。一個是產品生態的廣度,一個是工程基礎設施的深度。”

撰文|司曉柏

編輯|翟文婷

騰訊AI剛打完一手明牌。元寶、龍蝦特工隊、養蝦全景圖,產品矩陣鋪到桌面上,生態布局畫得清清楚楚。

但明牌底下還壓著一張暗牌。

3月27日,騰訊云上海峰會。MiniMax的Agent首席架構師阿島講了一個訓練困境——大模型的強化學習撞上了沙箱瓶頸,十萬級并發環境在K8S上根本跑不動。同一場峰會,湯道生丟出一句判斷:「AI落地不只是一道算法題,更是一道工程題。」

一個是大模型公司技術同學的切膚之痛,一個是大廠掌門人的戰略洞察。兩個人從不同方向,撞進了同一件事——它不在任何產品發布清單上,藏在底層:十萬級并發沙箱、百毫秒級啟動、兩群工程師在行業還沒反應過來之前,悄悄把基礎設施推到了下一個屬于Agent的時代。

這才是那張名為「工程」的暗牌。

01 白板上的四個字

2022年初,MiniMax還沒有這個名字。創始人閆俊杰在一間簡陋辦公室的白板上寫下「下一代AI」。彼時GPT-3剛發布不久,ChatGPT要再等一年,「AGI」這個詞還沒幾個人聊。四年后的2026年1月,MiniMax港交所上市,首日漲幅達到109%,市值突破1000億港元。

但阿島——繆宇航,公司內部都這么叫他——站在峰會臺上翻出這張白板老照片時,講的不是上市的事。

他反復說的是一個技術困境:模型訓練的底層邏輯變了。模型不再是做完一道題就交卷——它得在真實環境里操作文件、寫代碼、調用工具、處理異常,每次試錯都要一個獨立運行環境。當需求膨脹到十萬級并發,云計算的底層架構被撞出了裂縫。

02 K8S撐不住了

大模型過去靠經典強化學習變聰明——給個問題,生成回答,打分,更新參數。但到了2025年下半年,天花板肉眼可見了。模型在封閉環境里「做題」已經很強,一放到真實世界立刻大打折扣——沒有持久狀態,每次對話都是全新開始;只能寫代碼不能跑代碼,缺少「寫→跑→看→修」的自我驗證循環;無法獲取實時知識,也無法搭建真實的工作環境。

說到底,裸模型像一臺空轉的引擎,引擎本身不是汽車。MiniMax從M2.5版本開始押另一條路:Agentic RL(基于強化學習的智能體訓練)——直接把模型扔進真實操作系統環境里干活。走通了,能力質變。但它需要全新的訓練基礎設施。

但是,以前我們可能只是讓AI寫一段話,或者處理一個簡單的函數,但隨著Agent的到來,我們現在要求AI去修理一輛正在跑的超級大卡車,或者是從頭造出一臺能用的iPhone。這意味著在Agent時代,模型面對的訓練任務是地獄級的。

每個訓練任務可能推演(Roll out)出上百條嘗試路徑(Trajectory),每條路徑都需要一個獨立的沙箱環境。面對成千上萬個用戶請求(Query),每個請求都要同時開啟上百個沙箱并發運行。

阿島說了句大實話:「一開始我們在K8S上跑。然后發現真的不行,并發完全起不來。」K8S——Kubernetes,現代云計算事實上的調度標準。但這套為微服務時代設計的系統,面對Agent訓練動輒幾萬個沙箱同時拉起的場景,扛不住了。

騰訊云Agent Runtime產品副總經理于廣游(Gary)捅破了一層窗戶紙:「每一個大模型企業內部,訓練沙箱基礎設施面臨兩大困境。第一,它是CPU的,不是GPU的,所以很難發論文。第二,搞K8S那群人看到你竟然要拉master(指向K8S系統核心頻繁索要資源)拉幾千下幾萬下,把我拉垮了,第一反應是——你能不能不要拉這么多。」

這種高頻、海量的調度需求,正是目前大模型落地工程中最隱形、也最頭疼的「摩擦力」,它直接卡住了模型迭代的脖子。

偏偏MiniMax一個月發一個模型版本,國內可能唯一做到這個頻率的,全球只有OpenAI保持類似節奏。算一筆賬:Agentic RL訓練時,GPU集群等沙箱啟動的每一秒都在空轉燒錢。十萬個并發沙箱,啟動要幾分鐘,累積等待可能吞掉數小時甚至數天的GPU算力。

沙箱慢一天,模型落后一天。「現在的競爭就是這么激烈。」

03 百萬級吞吐怎么來的

問題擺在那里,MiniMax和騰訊云很快走到了一起。

2026年3月18日,雙方宣布合作:基于騰訊云Agent Runtime沙箱產品,MiniMax部署了百萬級吞吐、十萬級并發的Agent RL沙箱,測試環境全量平穩運行。阿島說:「據我們所知,這是國內最大的訓練沙箱系統之一。」Gary說,規模比同行高出至少一個數量級。

效果最直觀的數字是啟動速度——從幾分鐘壓到百毫秒級,快了數倍。前面那筆GPU空轉的賬,直接被壓縮了一個量級。

撐住這個規模,騰訊云在底層做了大量累活。計算層:調度優化、內核鎖優化、快照技術、內存映射。存儲層:專門開發了加速存儲方案。Gary打了個比方——「過去需要買一塊云盤,現在可以理解成買一個鏡像盤或者沙箱盤,磁盤本身就是鏡像本身。」

他指出,大家現在都在嘗試用「舊瓶裝新酒」,但這兩個舊瓶子(K8S和Serverless)的設計初衷,剛好和Agent的性格完全相反:把Agent想象成一個有記憶、要長時間閉關思考的專家,但K8S按照慣例把給Agent關掉重啟,Agent就會瞬間失憶,Serverless(無服務器計算)就像是頻繁開關的「聲控燈」,但正在「寫論文」的Agent卻需要燈光長亮。

這就是為什么騰訊云要給Agent造一個新的流水線。Gary強調,「這些不是因為我們比別人更聰明,而是我們真正認識到這里的問題跟價值」。

對于Agent需要怎樣的訓練設施,業內還有一個容易被忽視的區別:大多數AI公司解決沙箱問題的思路是在本地搭環境——進程跑在自己機器上,安全靠手動確認,電腦一關任務就斷。

騰訊云走的是另一條路:把整個Harness拆成「控制面+執行面」的云原生架構。控制面做編排、權限、審計;執行面就是Agent Runtime沙箱,每個任務跑在獨立的云端隔離環境里,毫秒級啟動,用完即焚,任務狀態持久化存儲,沙箱銷毀了也能從斷點恢復。一個是「帶安全帶的智能終端」,一個是「帶監控和隔離艙的云工廠」——對企業場景來說,安全、協作、彈性缺一不可,后者才是生產級方案。

04 同一堵墻

湯道生的判斷干脆利落——主流大模型推理能力都不差了,國內開源跟海外閉源的差距在收窄。比拼重心正在轉移:不是「誰的模型更強」,是誰能通過工程化手段把模型用好。

他在峰會上把「工程題」拆得很細:模型要真正落地,需要工具調用能力、需要上下文管理、需要長記憶、需要安全的執行環境、需要工作流編排——這些東西加在一起,他用了一個詞概括:Harness,模型的「腳手架」。湯道生的意思很明確,騰訊云要做的不是賣算力,而是幫企業把這套腳手架搭起來。

行業正在形成一個共識性公式:Agent = Model + Harness。Model負責「想」,Harness負責讓智能變得「有用」——工具調用、代碼執行沙箱、上下文工程、長記憶管理、工作流編排,一整套系統工程。模型決定能力下限,Harness決定能力上限。有實踐數據可以佐證:花三個月調Prompt,質量提升20%;花兩周搭Harness,任務完成率從35%飆到82%。

這不是騰訊一家的發現。

2026年2月,HashiCorp聯合創始人Mitchell Hashimoto正式提出「Harness Engineering」。幾乎同期,OpenAI做了一個激進實驗——3名工程師,5個月,100萬行代碼,零行人工代碼,人類只管設計Harness。Anthropic、LangChain也摸到了類似結論。

全世界最頂尖的工程大腦,在不同時區同時碰到了同一堵墻:模型的能力天花板還遠,但工程框架的地板才決定實際效果。行業的關注點正在從「Prompt工程」轉向「上下文工程」——不再只是「怎么寫指令」,而是「如何構建模型看到的全部信息體系」。

阿島把這變成了一個畫面:「就像一輛F1賽車,我們去開,能順利開回來就不錯了。但真正的賽車手能刷出世界紀錄。今天Agent也是同樣的——我們能不能為它打造企業級的F1車身,也就是Harness?」

MiniMax的實踐印證了這一點。MiniMax M2.7 正式開啟模型的自我進化,AI深度參與了模型的訓練,強化學習中50%-70%的工作由Agent自主完成。人類研究員的角色變了,變成跟Agent聊實驗idea。

但前提是:沙箱夠快、夠穩、夠大。Harness是一套系統工程,包含文件系統、代碼執行、記憶、搜索、上下文管理、編排六大組件——而沙箱是其中最底層的那一塊,所有上層能力都建立在「模型能不能真正在一個環境里跑起來」這個前提之上。否則再精巧的Harness設計,也卡在最不起眼的環節上。湯道生那句「AI落地是一道工程題」,說的不只是Harness設計,更是底層基礎設施的硬功夫。

05 兩群工程師的氣味相投

阿島在峰會上放了那張MiniMax Day 1的白板照片。「成立的Day 1就有騰訊云提供支持。那時候我們還是名不見經傳的小公司,騰訊云并沒有因為我們小就怠慢,和我們一起搭建了訓練算力集群,一起服務了第一個爆款產品。」

四年,合作從算力集群到Agent RL沙箱、全球合規、上層應用接入。阿島說騰訊云「非常技術驅動,思維也非常agent first」。聽著像客套,但對照實際發生的事看,它指向一種具體的行為模式:遇到問題,不繞路,不等標準,先把手弄臟。

K8S跑不動,就一起從頭設計專用沙箱。行業還沒認識到Agent基礎設施的價值,就自己先投進去。這種默契是項目里做出來的,不是會議室里談出來的。

MiniMax模型開源,騰訊云通過TokenHub分發模型服務。阿島說:「哪怕已經上市了,我們仍然是一家只有幾百人的小公司,不可能服務那么多大客戶。」騰訊云幫他把模型送到更多客戶手里;MiniMax那些極端的訓練需求,也在倒逼騰訊云向Agent時代進化。

而MiniMax不是唯一一個撞上這堵墻的。任何一家認真做Agentic RL的公司,遲早都會遇到同樣的沙箱瓶頸。區別只在于,有沒有人先把路趟出來。

Gary說:「我們是在兩個時代的臨界點上,一起攜手。」阿島的表述類似:「一個新時代對舊時代的——其實我們是在一邊的。」

06 那張暗牌

MiniMax的M2.7在AA大模型榜單國產模型排名第一,跟Claude在SWE-bench Verified上差距只剩0.6%。

阿島判斷:「再過一兩年能留在牌桌上的公司可能不超過5家。」靠什么留?衡量這個時代工程師的水平,基本上看一個指標——他同時能并發多少個Agent為他工作,他每天能燃燒多少Token。

這個指標適用于個人,也適用于公司。訓練效率真正的瓶頸,不在GPU——在沙箱。

湯道生在上海峰會上還宣布了騰訊云底層平臺Cube全面開源,企業可直接用于智能體訓練和部署。這實際上就是騰訊回應「沙箱困境」的其中一個解法,通過開源,讓大模型的腳手架更好用。

騰訊已經把AI的明牌攤在桌上——產品矩陣、生態全景圖、IM入口、Skill工具箱,面向用戶,展示得明明白白。Cube開源則是另一種姿態,面向的不是用戶,是盟友。不是「看我們有什么」,是「這些能力你們拿去用。」

明牌秀肌肉,暗牌亮底牌。一個是產品生態的廣度,一個是工程基礎設施的深度。

湯道生那句話,「AI落地是一道工程題」,或許還可以再加半句:工程題的解法,從來不是一個人悶頭做的。

四年前那塊白板上寫著「下一代AI」。四年了,字沒變。寫字的人,多了幾個。

聲明:個人原創,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
馬刺全隊力挺陷爭議的福克斯

馬刺全隊力挺陷爭議的福克斯

體壇周報
2026-06-14 08:35:14
蘇超最新積分榜大洗牌!1-0、3-0!蘇超瘋狂一夜!泰州絕殺南通

蘇超最新積分榜大洗牌!1-0、3-0!蘇超瘋狂一夜!泰州絕殺南通

劉哥談體育
2026-06-14 07:30:35
雷軍犯天條了,竟然遭到整個中國家電行業集體圍剿。

雷軍犯天條了,竟然遭到整個中國家電行業集體圍剿。

流蘇晚晴
2026-06-12 13:02:17
世界杯觀感:小組賽正失去魅力,拿3分就出線讓國際足聯很頭疼

世界杯觀感:小組賽正失去魅力,拿3分就出線讓國際足聯很頭疼

濤哥侃球
2026-06-13 23:49:33
快訊!菲防長感覺到痛了,但悔之晚矣!

快訊!菲防長感覺到痛了,但悔之晚矣!

做個平凡的軒友
2026-06-14 09:59:02
摩洛哥同時派出11名非本國出生球員,世界杯歷史第一隊

摩洛哥同時派出11名非本國出生球員,世界杯歷史第一隊

懂球帝
2026-06-14 08:13:13
中國建筑集團大重組

中國建筑集團大重組

地產微資訊
2026-06-14 09:06:30
醒醒吧:吹捧君王制,是跪在奴隸社會的廢墟上舔骨頭

醒醒吧:吹捧君王制,是跪在奴隸社會的廢墟上舔骨頭

浪子說
2026-06-09 10:57:05
搶在王毅專機起飛前,蒙古就對中國亮出危險4字,逼華做兩件事

搶在王毅專機起飛前,蒙古就對中國亮出危險4字,逼華做兩件事

阿訊說天下
2026-06-14 01:29:09
“摸奶子”再惹爭議,OPPO的流量反噬開始了

“摸奶子”再惹爭議,OPPO的流量反噬開始了

品牌頭版
2026-05-13 10:18:15
中國國民黨主席鄭麗文發表聲明

中國國民黨主席鄭麗文發表聲明

葉葉夜
2026-06-13 15:52:20
6月14日,人社部公布2026年養老金調整通知了嗎?會提低控高嗎?

6月14日,人社部公布2026年養老金調整通知了嗎?會提低控高嗎?

社保小達人
2026-06-14 10:21:23
普京再次回應戰爭起源:不是俄開戰,是基輔先向頓巴斯開火

普京再次回應戰爭起源:不是俄開戰,是基輔先向頓巴斯開火

桂系007
2026-06-12 23:57:08
河南一國企領導疑值班期間在辦公室飲酒,被紀委人員突擊檢查?河南省國資委回應

河南一國企領導疑值班期間在辦公室飲酒,被紀委人員突擊檢查?河南省國資委回應

極目新聞
2026-06-13 20:47:12
8000多輛軍車成了廢鐵,克里米亞徹底斷供!

8000多輛軍車成了廢鐵,克里米亞徹底斷供!

果媽聊娛樂
2026-06-13 15:24:53
終于看懂英皇為何集體缺席了!半個港圈給94歲修哥捧場

終于看懂英皇為何集體缺席了!半個港圈給94歲修哥捧場

南萬說娛26
2026-06-13 09:09:00
大水沖了沙漠!災禍變喜事?50,萬畝胡楊命保住了

大水沖了沙漠!災禍變喜事?50,萬畝胡楊命保住了

完善法
2026-06-13 20:58:57
B組首輪綜述:本是菜雞互啄的雞肋,硬是啄出了死亡之組的味道

B組首輪綜述:本是菜雞互啄的雞肋,硬是啄出了死亡之組的味道

濤哥侃球
2026-06-14 07:26:54
A股,重大調整!明起實施

A股,重大調整!明起實施

證券時報e公司
2026-06-14 08:06:32
“SpaceX沒說,但所有線索都指向中國”

“SpaceX沒說,但所有線索都指向中國”

觀察者網
2026-06-12 09:23:04
2026-06-14 12:04:49
新莓daybreak incentive-icons
新莓daybreak
理解人,發現變化
457文章數 774關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

陜西橋梁垮塌致25輛車墜河62人死亡失蹤 官方公布細節

頭條要聞

陜西橋梁垮塌致25輛車墜河62人死亡失蹤 官方公布細節

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

具俊曄曝大S離世前虛弱照,難怪小s退讓

財經要聞

金價跌至900元關口,大媽又來抄底了!

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

房產
時尚
數碼
游戲
公開課

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

伊姐周六熱推:電視劇《南部檔案》;電視劇《意外調查組》......

數碼要聞

多名球星展示新款Beats頭戴式耳機

立省30%!《明末:淵虛之羽》開啟Steam限時折扣

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版