成為全球游戲行業最具影響力的價值連接者
5月15日,米哈游于北京舉辦AI大模型技術分享會暨頂尖校招宣講,以非公開形式面向高校頂尖人才與技術圈核心人士,官宣千億級AI投入與全棧自研路線,標志米哈游發展戰略將朝向AI驅動科技企業進一步押注。
![]()
在本次分享會中,米哈游聯合創始人劉偉(大偉哥)也登臺分享了自己對于AI業務的愿景,并拋出了一個頗為震撼的數字:未來三年,最多投入1000億元以深耕AI領域。他坦言,“就算最終不成功,沒做出來,也認了,就當放一場大煙花。”這份決絕,彰顯出米哈游深耕AI領域的堅定決心。
戰略層面不搞“大公司病”
在本次分享會中,大偉哥首先提到:“公司的創始人也必須是技術負責人,必須在一線做所有的事情,只有這種方式才能將大模型做成。”
當今時代下,AI大模型范式迭代極快,決策層若脫離了技術一線,只靠匯報來做決策,高昂的管理成本不僅會拖垮團隊,更會讓企業被時代淘汰。因此,最高決策者必須扎根在代碼與訓練曲線一線,只有這樣才能守住極致的技術敏銳度。
事實上,米哈游早已踐行這一理念。在游戲日報此前關于劉偉在上海交通大學演講的報道中便提及,聯合創始人蔡浩宇無論公司規模如何擴張,始終堅守技術一線;在AI大模型時代來臨后,他義無反顧的把米哈游所有東西都拋在身后,從零開始學習鉆研。最近Agent技術十分火熱,蔡浩宇也會親手搭建Agent,即便每日睡眠不足五六小時也始終保持極高的研發熱情。
另外,組建團隊做AI需要警惕“大牛陷阱”,堅持扁平化優先。大偉哥提到,“我們不希望招一個大牛。大牛有自己很強的ego(自我),有自己的scope(負責內容)......但只有一個年輕的、志同道合的團隊,才有可能真正實現彎道超車。”
這其實指出,傳統AI經驗在LLM時代反而可能成為“負資產”,影響項目的推進。一些固守局部優化,執著于“守邊界”、“搶地盤”的資深管理者,往往有強烈的自我意識,但這會扼殺全局視角的創新。在今天,從數據、模型到Infra,真正能實現突破的,是志同道合、扁平化的年輕團隊,而非沉迷于個人Scope的“大牛”。
此外,在研發效率層面,大偉哥還提出了“AI for AI,Model with Model”的核心邏輯,讓AI進入自主研發循環。真正的效率提升并非盲目擴招,而是讓大模型自主分析訓練瓶頸、編寫復雜的GPU內核代碼、定位程序漏洞。誰能率先搭建“自動調優沙盒”,誰就能在迭代速度上實現降維打擊。
技術層面的“薪火”
除了在公司戰略層面,游戲日報也整理了大偉哥在前沿技術層面的一些洞見。
在基建層面,米哈游重新定義了AI Infra的價值邊界,大偉哥指出,模型能力的上限正由基礎設施重新界定。在萬卡規模下,通信、計算、數據的協同設計早已不是簡單的“底層修管道”,而是直接決定算法模型能跑多大參數、支撐多長的Context。系統工程的核心,就是在正確性與極致性能之間找到最優解。
而在AI預訓練環節,米哈游強調數據與工程的關系博弈。大偉哥認為,數據是要占據0~90分的量級,模型則是做90~95分的突破。在此前提下,數據清洗、去重與配比決定了模型的基礎,小規模訓練下看似有效的模型Trick,在極限Scale下往往會失效,唯有優質的數據分布才能帶來穩定收益。
同時,大規模訓練的本質是消滅“小概率事件”,要把小概率事件變成一個確定性的工程,不然的話,“一個簡單的Loss Spike(損失值異常飆升)會導致整個模型去瘋。”
即便是在單卡上無足輕重的Token異常、算子Bug,看起來可能毫無波瀾,但在萬卡集群中則會被無限放大,直接導致模型的災難性崩潰。因此,擁有從梯度到底層算子的全鏈路可觀測能力,是預訓練保持穩定、不被“炸毀”的唯一保障。
在后訓練與多模態領域,米哈游則提出了通往AGI的真實路徑,提出智能的終極公式是“Context × Permission”,單純喂長文本,或給一個沒有環境的Function Call都毫無意義,真正的Agent需要讓模型讀取真實世界的上下文(如代碼庫、聊天記錄),并擁有執行修改的權限,二者相乘才是智能的上限。
而在強化學習方面,米哈游認為簡單采用RLHF(人類反饋強化學習)已不是未來方向,下一代RL(強化學習)需要讓模型在真實交互環境中試錯,以“修改代碼導致pipeline崩潰”這類真實代價作為Reward信號,解決長周期任務的學分分配問題。
未來的多模態也要摒棄簡單的“語音轉文字+文字轉語音”的外掛式流水線,而是在預訓練早期就將音頻等模態特征融入基座,讓模型擁有原生物理感知能力的同時,保留其強大的邏輯推理內核。
米哈游的野望
綜合游戲日報之前的報道,不難發現米哈游近日在AI領域動作頻頻。
米哈游創始人蔡浩宇在硅谷的AI創業公司Anuttacon剛經歷了一次重大的戰略轉向。公司最初的目標是利用AI技術(包括大語言模型、語音、視頻)打造“像人”的互動系統,并發布了一款實驗性AI對話游戲《Whispers from the Star》進行驗證。
如今,這款游戲在Steam平臺的評分定位在特別好評(82%好評率),即便整體上得到認可,同時也有不少玩家反饋AI模型還不夠智能,未能完全實現玩法概念目標。
![]()
而最近,公司停止了多模態表演模型等原有方向的研發,將幾乎全部算力和核心團隊都集中投入到通用大語言模型(LLM)和智能體Agent的構建上,LLM相關團隊整體回流國內,進入集中作戰狀態,蔡浩宇也將研發重心從美國轉移回了中國。
在前不久的大偉哥交大演講中,AI也是高頻出現的詞匯。大偉哥指出,人工智能的應用與影響已實現階段性躍遷,其范圍遠超早期的聊天對話(Chatbot)功能,如今已進入能夠自主規劃、使用工具并執行復雜任務的“智能體”(Agent)階段。當前,智能體已能深度參與大部分非圖形界面的軟件工程,成為開發者的強大協作者。
![]()
在游戲產業,這種變革尤為顯著,其影響是雙重的。一方面,在游戲制作端,AI正作為“超級輔助”滲透到美術、敘事、設計、編程等全流程,極大地提升效率并降低創作門檻。另一方面,在游戲體驗端,更具顛覆性的未來正在臨近:預計未來兩三年內,AI將實現“千人千面”的個性化游戲體驗,能夠為每位玩家實時生成獨一無二的劇情、任務和玩法,使游戲從固定劇本進化為動態世界。
在這種技術背景下,人類與AI的協作關系正在被重新定義。在當前階段,AI的核心角色是高效的“解題者”,擅長在人類設定的框架內執行任務、生成內容。而人類不可替代的獨特優勢,則在于成為“出題者”——即擁有定義問題、設定愿景和探索未知的能力。
而最近,米哈游AI技術已實現部分落地——通過自然語言交互,帕姆AI能夠主動理解并滿足玩家需求,不僅可以用它查詢攻略(如角色養成、配隊建議),還可以與扮演列車長帕姆的AI進行趣味互動,其回復符合角色設定,體驗自然。
![]()
在技術層面,為應對千萬級玩家的高并發挑戰,米哈游采用了多模塊協同系統、將邏輯推理嵌入模型權重以提升響應速度、應用FP8混合精度訓練以降低成本。同時,通過深度定制化訓練將游戲世界觀“刻入”模型基因,并采用知識庫與模型能力層分離的架構,使兩者能獨立優化,并讓模型具備基于反饋的在線強化學習能力,持續進化。
“帕姆幫幫”作為米哈游AI技術進入實際應用階段的標志,盡管目前作為“測試版”尚有改進空間,但其底層架構具備通用性,可擴展至其他NPC,就在此前,米哈游已構想過如“星穹狼人殺”等AI驅動的新玩法,讓AI角色擁有自主行為與策略。這標志著游戲交互方式從傳統UI向自然語言的變革,AI正從開發工具轉變為游戲體驗的核心組成部分,目前也收獲了良好的口碑。
同樣的,AI NPC系統也在不久前開啟二測的《星布谷地》中得到了應用。以咖啡店老板娘“娜洛”為例,其具備長線記憶功能、個性化的情感反應和擬人化的高自由度對話能力,旨在與玩家建立深度的情感連接,從而構成游戲的核心差異化競爭力。即便有時回應略顯刻板,但也仍展現出了一定的邏輯反應潛力。
![]()
從戰略啟航到階段成果落地,米哈游AI事業的版圖已然越來越清晰。從短期看,AI是革新游戲生產方式、重構玩家交互體驗的核心工具;從長期看,集中攻堅通用AI與智能體,是米哈游布局下一代數字內容、探索AI原生數字世界的關鍵一步。隨著技術持續迭代與團隊整合完成,這場由米哈游主導的游戲AI革命,或將持續釋放更大的產業能量。
看見趨勢,讀懂行業,立即加入
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.