網易首頁 > 網易號 > 正文申請入駐

要砸1000億！米哈游準備認真做AI

2026-05-16 17:11:36　來源: 游戲日報

北京舉報

分享至

成為全球游戲行業最具影響力的價值連接者

5月15日，米哈游于北京舉辦AI大模型技術分享會暨頂尖校招宣講，以非公開形式面向高校頂尖人才與技術圈核心人士，官宣千億級AI投入與全棧自研路線，標志米哈游發展戰略將朝向AI驅動科技企業進一步押注。

在本次分享會中，米哈游聯合創始人劉偉（大偉哥）也登臺分享了自己對于AI業務的愿景，并拋出了一個頗為震撼的數字：未來三年，最多投入1000億元以深耕AI領域。他坦言，“就算最終不成功，沒做出來，也認了，就當放一場大煙花。”這份決絕，彰顯出米哈游深耕AI領域的堅定決心。

戰略層面不搞“大公司病”

在本次分享會中，大偉哥首先提到：“公司的創始人也必須是技術負責人，必須在一線做所有的事情，只有這種方式才能將大模型做成。”

當今時代下，AI大模型范式迭代極快，決策層若脫離了技術一線，只靠匯報來做決策，高昂的管理成本不僅會拖垮團隊，更會讓企業被時代淘汰。因此，最高決策者必須扎根在代碼與訓練曲線一線，只有這樣才能守住極致的技術敏銳度。

事實上，米哈游早已踐行這一理念。在游戲日報此前關于劉偉在上海交通大學演講的報道中便提及，聯合創始人蔡浩宇無論公司規模如何擴張，始終堅守技術一線；在AI大模型時代來臨后，他義無反顧的把米哈游所有東西都拋在身后，從零開始學習鉆研。最近Agent技術十分火熱，蔡浩宇也會親手搭建Agent，即便每日睡眠不足五六小時也始終保持極高的研發熱情。

另外，組建團隊做AI需要警惕“大牛陷阱”，堅持扁平化優先。大偉哥提到，“我們不希望招一個大牛。大牛有自己很強的ego（自我），有自己的scope（負責內容）......但只有一個年輕的、志同道合的團隊，才有可能真正實現彎道超車。”

這其實指出，傳統AI經驗在LLM時代反而可能成為“負資產”，影響項目的推進。一些固守局部優化，執著于“守邊界”、“搶地盤”的資深管理者，往往有強烈的自我意識，但這會扼殺全局視角的創新。在今天，從數據、模型到Infra，真正能實現突破的，是志同道合、扁平化的年輕團隊，而非沉迷于個人Scope的“大牛”。

此外，在研發效率層面，大偉哥還提出了“AI for AI，Model with Model”的核心邏輯，讓AI進入自主研發循環。真正的效率提升并非盲目擴招，而是讓大模型自主分析訓練瓶頸、編寫復雜的GPU內核代碼、定位程序漏洞。誰能率先搭建“自動調優沙盒”，誰就能在迭代速度上實現降維打擊。

技術層面的“薪火”

除了在公司戰略層面，游戲日報也整理了大偉哥在前沿技術層面的一些洞見。

在基建層面，米哈游重新定義了AI Infra的價值邊界，大偉哥指出，模型能力的上限正由基礎設施重新界定。在萬卡規模下，通信、計算、數據的協同設計早已不是簡單的“底層修管道”，而是直接決定算法模型能跑多大參數、支撐多長的Context。系統工程的核心，就是在正確性與極致性能之間找到最優解。

而在AI預訓練環節，米哈游強調數據與工程的關系博弈。大偉哥認為，數據是要占據0~90分的量級，模型則是做90~95分的突破。在此前提下，數據清洗、去重與配比決定了模型的基礎，小規模訓練下看似有效的模型Trick，在極限Scale下往往會失效，唯有優質的數據分布才能帶來穩定收益。

同時，大規模訓練的本質是消滅“小概率事件”，要把小概率事件變成一個確定性的工程，不然的話，“一個簡單的Loss Spike（損失值異常飆升）會導致整個模型去瘋。”

即便是在單卡上無足輕重的Token異常、算子Bug，看起來可能毫無波瀾，但在萬卡集群中則會被無限放大，直接導致模型的災難性崩潰。因此，擁有從梯度到底層算子的全鏈路可觀測能力，是預訓練保持穩定、不被“炸毀”的唯一保障。

在后訓練與多模態領域，米哈游則提出了通往AGI的真實路徑，提出智能的終極公式是“Context × Permission”，單純喂長文本，或給一個沒有環境的Function Call都毫無意義，真正的Agent需要讓模型讀取真實世界的上下文（如代碼庫、聊天記錄），并擁有執行修改的權限，二者相乘才是智能的上限。

而在強化學習方面，米哈游認為簡單采用RLHF（人類反饋強化學習）已不是未來方向，下一代RL（強化學習）需要讓模型在真實交互環境中試錯，以“修改代碼導致pipeline崩潰”這類真實代價作為Reward信號，解決長周期任務的學分分配問題。

未來的多模態也要摒棄簡單的“語音轉文字+文字轉語音”的外掛式流水線，而是在預訓練早期就將音頻等模態特征融入基座，讓模型擁有原生物理感知能力的同時，保留其強大的邏輯推理內核。

米哈游的野望

綜合游戲日報之前的報道，不難發現米哈游近日在AI領域動作頻頻。

米哈游創始人蔡浩宇在硅谷的AI創業公司Anuttacon剛經歷了一次重大的戰略轉向。公司最初的目標是利用AI技術（包括大語言模型、語音、視頻）打造“像人”的互動系統，并發布了一款實驗性AI對話游戲《Whispers from the Star》進行驗證。

如今，這款游戲在Steam平臺的評分定位在特別好評（82%好評率），即便整體上得到認可，同時也有不少玩家反饋AI模型還不夠智能，未能完全實現玩法概念目標。

而最近，公司停止了多模態表演模型等原有方向的研發，將幾乎全部算力和核心團隊都集中投入到通用大語言模型（LLM）和智能體Agent的構建上，LLM相關團隊整體回流國內，進入集中作戰狀態，蔡浩宇也將研發重心從美國轉移回了中國。

在前不久的大偉哥交大演講中，AI也是高頻出現的詞匯。大偉哥指出，人工智能的應用與影響已實現階段性躍遷，其范圍遠超早期的聊天對話（Chatbot）功能，如今已進入能夠自主規劃、使用工具并執行復雜任務的“智能體”（Agent）階段。當前，智能體已能深度參與大部分非圖形界面的軟件工程，成為開發者的強大協作者。

在游戲產業，這種變革尤為顯著，其影響是雙重的。一方面，在游戲制作端，AI正作為“超級輔助”滲透到美術、敘事、設計、編程等全流程，極大地提升效率并降低創作門檻。另一方面，在游戲體驗端，更具顛覆性的未來正在臨近：預計未來兩三年內，AI將實現“千人千面”的個性化游戲體驗，能夠為每位玩家實時生成獨一無二的劇情、任務和玩法，使游戲從固定劇本進化為動態世界。

在這種技術背景下，人類與AI的協作關系正在被重新定義。在當前階段，AI的核心角色是高效的“解題者”，擅長在人類設定的框架內執行任務、生成內容。而人類不可替代的獨特優勢，則在于成為“出題者”——即擁有定義問題、設定愿景和探索未知的能力。

而最近，米哈游AI技術已實現部分落地——通過自然語言交互，帕姆AI能夠主動理解并滿足玩家需求，不僅可以用它查詢攻略（如角色養成、配隊建議），還可以與扮演列車長帕姆的AI進行趣味互動，其回復符合角色設定，體驗自然。

在技術層面，為應對千萬級玩家的高并發挑戰，米哈游采用了多模塊協同系統、將邏輯推理嵌入模型權重以提升響應速度、應用FP8混合精度訓練以降低成本。同時，通過深度定制化訓練將游戲世界觀“刻入”模型基因，并采用知識庫與模型能力層分離的架構，使兩者能獨立優化，并讓模型具備基于反饋的在線強化學習能力，持續進化。

“帕姆幫幫”作為米哈游AI技術進入實際應用階段的標志，盡管目前作為“測試版”尚有改進空間，但其底層架構具備通用性，可擴展至其他NPC，就在此前，米哈游已構想過如“星穹狼人殺”等AI驅動的新玩法，讓AI角色擁有自主行為與策略。這標志著游戲交互方式從傳統UI向自然語言的變革，AI正從開發工具轉變為游戲體驗的核心組成部分，目前也收獲了良好的口碑。

同樣的，AI NPC系統也在不久前開啟二測的《星布谷地》中得到了應用。以咖啡店老板娘“娜洛”為例，其具備長線記憶功能、個性化的情感反應和擬人化的高自由度對話能力，旨在與玩家建立深度的情感連接，從而構成游戲的核心差異化競爭力。即便有時回應略顯刻板，但也仍展現出了一定的邏輯反應潛力。

從戰略啟航到階段成果落地，米哈游AI事業的版圖已然越來越清晰。從短期看，AI是革新游戲生產方式、重構玩家交互體驗的核心工具；從長期看，集中攻堅通用AI與智能體，是米哈游布局下一代數字內容、探索AI原生數字世界的關鍵一步。隨著技術持續迭代與團隊整合完成，這場由米哈游主導的游戲AI革命，或將持續釋放更大的產業能量。

看見趨勢，讀懂行業，立即加入

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.