網易首頁 > 網易號 > 正文 申請入駐

騰訊出牌方式變了

0
分享至


出品|虎嗅黃青春頻道

作者|商業消費主筆黃青春

題圖|視覺中國

姚順雨執掌騰訊混元后的首秀,最終被 DeepSeek-V4 的討論淹沒了。

4 月 23 日,騰訊正式發布并開源混元 Hy3 preview 語言模型——這是姚順雨主導混元技術體系全面重建后,交出的首份落地成果。

在此之前,市場對姚順雨的期待值早已拉滿:清華姚班出身、OpenAI 前核心研究員、AI 領域頂尖專家,入職即獲得集團層面雙線匯報的最高權限,一手推動騰訊混元大模型研發架構重構,還打破盤桓多年的部門墻,讓成立十年的 AI Lab 打散重組。

有鑒于此,外界翹首以盼騰訊拿出一款顛覆性的新模型,但 Hy3 preview 最終的市場聲量與討論度并不及預期。這很大程度上源于,同期 GPT-5.5、小米 Mimo、Kimi K2.6 等新模型密集發布,次日 DeepSeek-V4 也強勢登場。

這讓混元有限的聲量徹底在這輪大模型更新浪潮中“失聲”,業內因此有人揶揄騰訊,“不如關停混元,高價收購 DeepSeek”。

對此,騰訊內部人士向虎嗅透露,與外界期待姚順雨“單騎救主”的英雄主義敘事不同,團隊對這一版本并未設定過高目標,因為 Hy3preview 并非對 Hy2.0 的迭代,而是騰訊混元技術體系的一次推倒重建。

“Hy3 預覽版與 DeepSeek-V4 的核心差異在于,后者暫不考慮商業化,專注于突破技術上限;而混元從研發之初就以適配騰訊業務生態為核心,強調與場景的深度綁定。如今 AI 行業已進入下半場,模型能力、生態資源與工程化實力將形成協同效應——畢竟騰訊從來不是一家單純的模型公司!痹搩炔咳耸勘硎。

騰訊終究“差了一口氣”?

從官宣預熱到最終發布,Hy3 preview 的表現與市場拉滿的期待存在明顯落差。

自高調宣布姚順雨加盟以來,騰訊便對其展現了超乎尋常的重視:一人身兼“CEO/總裁辦公室”首席 AI 科學家、AI Infra 部與大語言模型部負責人兩大職務,同時向騰訊總裁劉熾平、技術工程事業群總裁盧山雙線匯報。

這種人事安排在騰訊發展史上頗為罕見,等于從集團層面確立了大模型的戰略核心地位,也向市場傳遞出騰訊 All in AI 的決心。

3 月 18 日的財報電話會上,劉熾平的表態更將市場期待推至頂峰:他明確透露混元全新技術體系下的旗艦模型 Hy3.0 正處于內部業務測試階段,計劃于 4 月對外推出,且相較于 Hy2.0 的能力提升幅度,將超過混元歷史上任何一次版本迭代。

疊加 2026 年二季度全球大模型賽道進入新一輪密集發布期:Anthropic 發布 Claude Opus 4.7、阿里推出 Qwen3.6-Max-Preview、Kimi 開源 K2.6、小米官宣 Mimo 全系列新模型,GPT-5.5 與 DeepSeek V4 前后腳上桌——如此“神仙打架”的貼身肉搏,市場自然期待騰訊能拿出一款足以改寫國內大模型格局的旗艦產品。

然而,與拉滿的市場預期形成鮮明對比的是,Hy3 preview 雖踩點交付,但技術突破有限,在各個維度均未給市場帶來預期中的驚喜。

首先,騰訊高管承諾 4 月推出核心版本,4 月底卻只發布了 Hy3 預覽版,勉強踩中時間節點,未體現出騰訊作為行業巨頭應有的執行力與爆發力。

對此,騰訊內部人士向虎嗅表示,實際上 Hy3 預覽版是技術重建的起點,正式版及更高級別的版本還在同步研發測試中。“Hy3 基本完成了對原有技術架構的全面重構,這個版本的核心目標是驗證全新技術路線、磨合重組后的團隊并跑通完整研發流程,且僅用不到三個月就完成交付,而行業同類技術重構通常需要 6-12 個月!

其次,在行業動輒以 1T 參數炸場的當下,Hy3 preview 總參數 295B、激活參數 21B 的規格無法給市場帶來沖擊力,被業內人士吐槽不夠頂尖、不夠震撼。

從實測與行業評測結果來看,Hy3 preview 的綜合能力雖達到國內一線水平,但極限推理能力仍遜于 GLM-5、Gemini 3.1 等頂級模型;代碼與智能體能力僅相當于 GLM-4.7——也就是智譜 AI 四個月前的技術水平,既沒有實現市場期待的代差級突破,更談不上對標全球頂級模型。

可如果拋開市場的高預期濾鏡,回歸模型本身的技術與落地能力,Hy3 preview 已然是騰訊混元歷史上進步幅度最大、實用性最強的版本。

推理效率層面,得益于模型架構與推理框架的深度協同,Hy3 preview 整體推理效率提升 40%,首 token 延遲降低 54%,端到端時長降低 47%,成本較上一代模型大幅下降——等于說,決定用戶體驗與商業化可行性的核心指標均被大幅優化。

復雜推理能力層面,Hy3 preview 在 FrontierScience-Olympiad 拿下 70.0 分、IMO Answer Bench 達到 84.3 分,整體表現超過 GLM-5、Kimi-K2.5,接近 Gemini 3.1 Pro 與 GPT-5.4。

代碼與智能體能力是 Hy3 preview 提升最顯著的方向。在 SWE-Bench Verified 基準測試中達到 74.4% 的通過率,逼近 GLM-5 與 Kimi-K2.5;在 Terminal-Bench 2.0 測試中取得 54.4% 的得分,超過 GLM-4.7 等模型,擠進行業第一梯隊;在涵蓋 16 項基準的 Agent 綜合評測中,平均得分從 Hy2 的 35 分躍升至 56 分,接近 GLM-5 與 Kimi-K2.5 所在的旗艦區間。


這些能力躍升背后,是 Hy3 preview 從研發之初就確立了與產品深度協同設計(Co-Design)的研發路線。

虎嗅獲悉,Hy3 preview發布之時,已率先接入騰訊云、元寶、IMA、CodeBuddy、WorkBuddy、QQ 等十余條核心產品線,且在每一個落地場景中都拿到了可量化的業務成果。

在辦公場景,騰訊文檔 AI PPT 功能接入后,生成成功率提升 20%,評測得分提升 10%,生成耗時縮短 20%,在模板選擇、內容生成、視覺匹配等環節幻覺顯著減少,契合度大幅提升;WorkBuddy 產品接入后,與國內同尺寸模型的用戶盲評勝率達到 56%,能穩定覆蓋文檔處理、數據分析、知識檢索、工具鏈編排等復雜辦公場景。

在社交與內容場景,元寶 APP 已與模型完成深度協同優化,提升了意圖理解、文本創作、深度搜索的核心能力,能為用戶帶來更具“活人感”的交互體驗;公眾號 AI 分身場景中,模型在用戶意圖理解、復雜上下文承接、知識信息組織方面的能力顯著提升。

在游戲場景,《和平精英》已全面接入 AI NPC 玩法,局外人設扮演場景中,模型能精準理解角色設定,輸出高關聯、高增量的交互內容;局內復雜對戰場景中,回復節奏貼近真實玩家,展現了極強的穩定性與擬人化能力,累計體驗用戶已突破 1.1 億。

除此之外,QQ 瀏覽器、騰訊新聞、騰訊客服等數十款騰訊核心產品,均在接入過程中,Hy3 preview 已真正融入騰訊業務生態,而非一款孤立的實驗室模型。

務實主義的路線錯位?

“Hy3 preview 是混元大模型重建的第一步!痹 Hy3 preview 發布的官方推文中,姚順雨如是寫道。

即便首秀沒能刷出與騰訊影響力匹配的聲量,并不意味著 Hy3 preview 是一款失敗的模型;⑿嵴J為,某種程度上,姚順雨為混元制定的核心路線,與當下行業的狂歡邏輯、市場的期待方向,存在明顯的偏移與錯位。

騰訊混元團隊向虎嗅表示,外界多是圍觀視角,難以體會此次技術重建之難——不僅要搭建全新的基礎設施,還要更換整套訓練范式,幾乎等同于從零開始重做一個大模型。

“比如數據審核就是姚順雨親自抓的,在三個多月內主導完成了對過往繁雜、冗余 SFT 數據的全面去重與精細化管控。目前,模型效果已經取得階段性進步,但仍存在一些已知問題,比如工具調用中的錯誤恢復能力不足,以及對推理超參數較為敏感。希望通過這次開源和發布,獲得來自開源社區和用戶的真實反饋,助力 Hy3 正式版進一步提升實用性。”上述人士說道。

事實上,姚順雨入職騰訊后,對混元團隊推行的第一項核心變革,就是否定“唯榜單論”的研發邏輯。他在內部會議上指出,過去混元模型過度追逐榜單成績,甚至直接將打榜專用語料混入訓練集,導致數據被嚴重污染,影響模型在真實場景中的表現。有鑒于此,姚順雨為團隊劃出一條清晰的路徑:不迷信打榜,更不用盯著榜單做事。

虎嗅獨家獲悉,今年 2 月,姚順雨主導重建了預訓練和強化學習的基礎設施,并確立了模型研發追求實用性的三大核心原則:

  • 能力體系化:不推崇偏科,即便是代碼智能體這類單一應用場景,也涉及推理、長文、指令、對話、代碼、工具等多種能力的深度協同。

  • 評測真實性:主動跳出易被刷榜的公開榜單,通過自建題目、最新考試、人工評測、產品眾測等方式評估和改進模型的真實戰斗力。

  • 性價比追求:實用性離不開商業合理性,通過深度協同模型架構與推理框架設計,大幅降低任務成本,讓智能用得起、用得好。

與此同時,混元團隊在繼續擴大預訓練和強化學習的規模,提升模型的智能上限,并通過與騰訊更多產品場景的深入協同設計,進一步探索基于產品場景的特色能力。

基于這一理念,Hy3 preview 跳出行業通用的公開評測體系,騰訊混元團隊自建了 50 余個基準測試集,通過自建題目、最新考試、人工評測、產品眾測等多種方式,綜合評估模型的真實戰斗力。

據虎嗅了解,騰訊專門打造了 CL-bench、CL-bench-Life、Hy-Backend、Hy-SWE Max 等一系列貼合真實業務場景的評測體系,核心目標只有一個:驗證模型在真實場景中的可用性,而非實驗室里的紙面跑分。

要知道,當下大模型賽道,公開榜單的分數是最直觀、最易傳播的能力證明,更是模型出圈、獲得市場認可的保證——如果不打榜、不拿出碾壓同行的榜單數據,市場就會默認你不具備對應的能力,普通用戶更不會感知到你的技術進步。

拿 Hy3 preview 受爭議的 295B 參數規格來說,這恰恰是姚順雨“實用優先、放棄炸場”路線的體現。在行業普遍通過“堆參數、規模擴容(Scale Up)”實現能力提升的當下,姚順雨選擇反其道而行之:Hy3 preview 總參數甚至小于前一版本,核心資源并未投入到參數規模擴張上,而聚焦于數據質量的提升,近乎完成了對 Hy2 模型底座的重構。

這一反行業常規的演進路線,源于騰訊混元對技術實用性的判斷:

  • 能力邊界:復雜推理、長上下文理解、指令遵循等核心實用能力,在 300B 參數量級已能充分釋放,盲目擴大參數帶來的能力邊際收益已大幅遞減。

  • 成本控制:300B 級混合專家模型(MoE)經量化后可實現單機部署,而 1T 級模型必須跨節點運行,多機通信會導致延遲、吞吐和運維復雜度顯著上升,推理成本更是相差數倍。

  • 落地可行性:絕大多數商業場景可通過檢索增強生成(RAG)、智能體(Agent)等工程手段彌補與頂級模型的能力差距,而 300B 級模型的低推理成本和低微調門檻,讓私有化部署與行業定制化成為可能。


順著上述判斷,Hy3 preview 要將價格打下來:騰訊云公開的 API 定價,在 0-16K 上下文范圍內,輸入最低 1.2 元 / 百萬 tokens,命中緩存后低至 0.4 元 / 百萬 tokens,輸出最低 4 元 / 百萬 tokens;與此同時,推出的個人版套餐最低 28 元 / 月,在同級別旗艦開源 MoE 模型賽道中,處于最低價梯隊。

然而,市場期待的是騰訊向上突破、拿出一款“碾壓同行、對標 GPT”的頂級旗艦,期待看到巨頭拿出炸場的參數、震撼的行業跑分,而非精打細算的性價比、面向落地的工程化產品。

這種市場期待與騰訊實際戰略選擇之間的錯位,正是市場產生心理落差的核心原因。


當然,騰訊在 AI 賽道最大的底牌是其無可替代的生態體系與工程化能力,這也是市場始終對騰訊混元抱有逆襲期待的核心原因。

在生態層面,騰訊“兩肋生風”:手握微信 14.18 億月活的國民級流量入口,還有 QQ、游戲、辦公、內容、金融等全場景應用矩陣,是國內擁有最多真實應用場景的互聯網巨頭——而真實場景的用戶反饋、海量的業務數據,是模型迭代最核心的“燃料”。

在商業化層面,AI 正扛著騰訊業務跑:

  • 2025 年騰訊廣告收入同比增長 19% 至 1449.73 億元,核心驅動力就是 AI 改寫了廣告業務的底層邏輯;

  • 游戲業務收入同比增長 22% 達 2416 億元,超 40 款騰訊游戲落地 AI 應用,覆蓋研發、玩法、運營全鏈路,人效與收入均實現大幅提升;

  • 騰訊云更是首次實現規;,大模型相關產品收入近兩年增長 50 倍。

從最終結果來看,姚順雨僅用三個月時間完成技術重建,并實現全業務場景快速落地,讓此前掉隊的騰訊混元重新躋身國內大模型第一梯隊。他為騰訊混元制定的“不偏科、不刷榜、重性價比、深度貼合業務場景”研發路線,正契合 AI 行業從參數狂歡向落地實用回歸的長期大趨勢。

正如姚順雨年初回應虎嗅的那樣,大模型上半場競爭的核心是模型訓練與參數突破,下半場的競爭重心將轉向任務定義、系統構建與真實問題解決能力——從這個角度看,騰訊的生態優勢、工程化能力、商業化體系,在 AI 下半場擁有巨大的想象空間。

# 虎嗅商業消費主筆黃青春、黃青春頻道出品人,關注文娛社交、游戲影音等多個領域,行業人士交流加微信:724051399,新聞線索亦可郵件至huangqingchun@huxiu.com

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4853487.html?f=wyxwapp

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
普惠公司:美國第六代戰機F-47配套的XA103變循環發動機相關情況

普惠公司:美國第六代戰機F-47配套的XA103變循環發動機相關情況

止戈軍是我
2026-04-27 21:44:17
畸形母愛毀星二代:母乳12年同床15年荒唐事

畸形母愛毀星二代:母乳12年同床15年荒唐事

看盡落塵花q
2026-04-25 14:10:18
演員陸毅嘴唇發紫,被網友提醒去醫院體檢;陸毅聽勸后回應:心臟沒問題,體重卻超標了,身高1米8,體重180斤,“我是方的”

演員陸毅嘴唇發紫,被網友提醒去醫院體檢;陸毅聽勸后回應:心臟沒問題,體重卻超標了,身高1米8,體重180斤,“我是方的”

浙江之聲
2026-04-27 13:09:03
美媒:白宮晚宴槍擊后,一女子趁亂順走多瓶紅酒,還有多名與會人員被拍到攜帶酒瓶離開;眾人逃命亂作一團時,好萊塢資深經紀人淡定吃沙拉

美媒:白宮晚宴槍擊后,一女子趁亂順走多瓶紅酒,還有多名與會人員被拍到攜帶酒瓶離開;眾人逃命亂作一團時,好萊塢資深經紀人淡定吃沙拉

魯中晨報
2026-04-27 16:36:04
印度每年榨糖,剩下7500萬噸甘蔗渣,中國人用它造出了科技王炸!

印度每年榨糖,剩下7500萬噸甘蔗渣,中國人用它造出了科技王炸!

泠泠說史
2026-04-27 21:51:27
隨著吳宜澤13-11勝塞爾比,火箭12-13,世錦賽8強對陣出爐附賽程

隨著吳宜澤13-11勝塞爾比,火箭12-13,世錦賽8強對陣出爐附賽程

小火箭愛體育
2026-04-28 00:09:23
只喝燒開的自來水,不碰桶裝水,不買礦泉水,最后結果如何?

只喝燒開的自來水,不碰桶裝水,不買礦泉水,最后結果如何?

芹姐說生活
2026-04-26 15:17:10
臺灣人真的很可憐

臺灣人真的很可憐

覆言國際
2026-04-27 18:49:55
2859.2克黃金制品被警方扣押三十年 最新進展:雙方約定見面溝通賠償事宜 代理律師:和解的可能性很大

2859.2克黃金制品被警方扣押三十年 最新進展:雙方約定見面溝通賠償事宜 代理律師:和解的可能性很大

每日經濟新聞
2026-04-27 18:05:32
嫌棄國企老公沒本事,女子離婚帶42萬存款追夢,結局讓人捧腹!

嫌棄國企老公沒本事,女子離婚帶42萬存款追夢,結局讓人捧腹!

塵埃里的看客
2026-04-27 15:53:46
不用等金價跌了!2026這波行情,跟10年前走得一模一樣

不用等金價跌了!2026這波行情,跟10年前走得一模一樣

牛鍋巴小釩
2026-04-28 00:16:28
水官高速免費后才發現有些深圳人很摳,連10塊錢都舍不得出

水官高速免費后才發現有些深圳人很摳,連10塊錢都舍不得出

虎哥閑聊
2026-04-28 09:36:10
這條新聞在今天看來,諷刺至極!

這條新聞在今天看來,諷刺至極!

胖胖說他不胖
2026-04-27 09:00:43
當著日本航母的面,055射了一枚導彈,美國反導體系沉默了

當著日本航母的面,055射了一枚導彈,美國反導體系沉默了

看過人間的月色
2026-04-27 08:33:11
臺灣最新民調出爐,蔣萬安、鄭麗文支持率驚人,民眾黨大將已表態

臺灣最新民調出爐,蔣萬安、鄭麗文支持率驚人,民眾黨大將已表態

老頭的傳奇色彩
2026-04-27 12:52:27
三個中國人,一場“豪賭”,終結日本20年壟斷

三個中國人,一場“豪賭”,終結日本20年壟斷

最商業Plus
2026-04-27 08:52:03
3比1!黑八只差一步!活塞成了NBA笑話

3比1!黑八只差一步!活塞成了NBA笑話

籃球教學論壇
2026-04-28 11:33:59
成都一泳池遭投火鍋底料等,8人被拘

成都一泳池遭投火鍋底料等,8人被拘

環球網資訊
2026-04-28 10:54:24
泡泡瑪特推出Labubu冰箱,售價5999元,上千人預約

泡泡瑪特推出Labubu冰箱,售價5999元,上千人預約

大象新聞
2026-04-26 13:01:02
狂勝32分!東部首個賽點誕生,塔圖姆30+11+7,恩比德空砍26+10

狂勝32分!東部首個賽點誕生,塔圖姆30+11+7,恩比德空砍26+10

籃球掃地僧
2026-04-27 23:25:41
2026-04-28 11:51:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業資訊與觀點交流平臺
26201文章數 687696關注度
往期回顧 全部

科技要聞

10億周活目標落空!傳OpenAI爆發內部分歧

頭條要聞

美軍事資產被指"損失慘重" 修復費用可能高達50億美元

頭條要聞

美軍事資產被指"損失慘重" 修復費用可能高達50億美元

體育要聞

人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

娛樂要聞

楊冪險遭蒸汽眼罩毀容!傷照曝光…

財經要聞

俞敏洪再遭重擊

汽車要聞

上汽大眾“攻山頭” ID.ERA 9X劍指細分前三

態度原創

藝術
本地
時尚
公開課
軍事航空

藝術要聞

靜·觀--第二屆全國靜物油畫作品展 作品選刊

本地新聞

用青花瓷的方式,打開西溪濕地

T恤+闊腿褲、襯衫+闊腿褲,今年夏天最火的搭配,誰穿誰時髦!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗外長折返伊斯蘭堡內情披露

無障礙瀏覽 進入關懷版