網易首頁 > 網易號 > 正文 申請入駐

關于MiniMax的新模型,我想說點不一樣的

0
分享至



新眸原創·作者 | 棠寧

這兩天,大家聊的最多的不是又出了什么刷新榜單的新模型,也不是又簽了什么千萬級的行業訂單,而是兩個字:漲價。

就在昨天,阿里云和百度智能云同步發布了公告,旗下AI算力與存儲產品將在4月18日正式調價,最高漲幅達到34%。而在這之前,亞馬遜AWS、微軟Azure、谷歌云已經完成了一輪AI相關服務的價格上調,部分特定項目的漲幅甚至達到100%。全球云廠商集體進入算力漲價周期,沒有一家能置身事外。

打個比方,現在做大模型,就像開著車上了沒有出口的高速,油門不敢松,松了就會被后面的車瞬間超過,但油價一直在漲,油箱里的融資款越燒越少,沒人知道自己能不能撐到下一個服務區。

這話不是矯情。如果你留意阿里2026財報Q3前瞻和剛剛發布的騰訊財報,你會發現兩者最大的共通點,就是加大了對AI基礎設施與大模型研發的大額持續投入,當然,這也不可避免地讓昔日互聯網巨頭在營收增速上放慢了腳步。

幾乎在同一時間,上海的大模型創業公司MiniMax,發布了新一代旗艦大模型M2.7。和行業里常見的“參數規模再創新高”、“權威榜單全面領先”的發布邏輯不同,這款模型最核心的標簽,是“自進化”。

據官方介紹,這是全球第一個實現商用的自進化大模型,它可以深度參與自身訓練優化的全流程,在部分研發場景可承擔30%到50%的工作量。

一邊是全行業都在為算力成本、研發效率焦慮,在軍備競賽的泥潭中越陷越深;一邊是一家成立僅4年多的創業公司,讓大模型從被研發的工具,變成了研發的參與者,甚至是主體。這一槍,算是打到了行業的七寸上。

01

3年競賽,大模型的背后難點

大模型行業走到今天,整整三年時間,幾乎所有玩家都困在同一場軍備競賽里。

2023年ChatGPT引爆生成式AI浪潮的時候,行業的競爭焦點是參數規模。從百億參數到千億參數,再到萬億參數,大模型的參數膨脹速度,遠超摩爾定律曾經的節奏,仿佛參數規模就是衡量大模型能力的唯一標尺,誰家的參數更大,誰家就站在了行業的頂端。

很快,參數競賽就走到了盡頭,大家發現,參數規模的提升,帶來的能力增長越來越有限,反而對算力的需求呈指數級上漲。于是行業的競爭焦點,轉向了算力資源的爭奪。高端AI芯片的供需缺口持續擴大,國內的大模型公司紛紛鎖定長期算力訂單,行業一度出現“一卡難求”的局面,甚至有創業公司為了保障算力穩定,直接包下了整個智算中心的機柜。

到了2025年,單純的算力軍備競賽也卷不動了,行業的戰場延伸到了落地場景。大廠們紛紛把大模型和自己的云服務、硬件產品、生態體系綁定,試圖在千行百業的落地中搶到先發優勢,競爭從技術研發,蔓延到了生態、渠道、客戶資源的全面比拼。

但這場持續了三年的競賽,代價越來越沉重,已經開始影響到整個行業的發展。

大廠尚且如此,創業公司的生存壓力更是肉眼可見。我接觸過的不少大模型創業者,都有過類似的經歷:融到的第一筆錢,一半先打給了云廠商鎖定算力,剩下的錢大部分用來支付算法團隊的薪酬,留給產品打磨、場景落地的資金少之又少。行業就像一個高速運轉的跑步機,所有人都必須不停往前跑,一旦停下來就會被趕超,但跑的越快,消耗的成本就越高,陷入了“越卷越貴,越貴越卷”的死循環。

而這個問題的根源,是大模型研發效率的底層瓶頸。

傳統的大模型研發,是一套完全由人驅動的標準化流程。從最開始的數據清洗、標注,到模型架構的設計、預訓練的參數調整,再到后續的微調、對齊、評測、bug修復,每一個環節都需要大量的算法工程師、數據標注人員、產品經理深度參與。

一個千億參數級別的大模型,從立項到正式發布,往往需要一個幾百人的團隊,花費3到6個月的時間,中間還要消耗數億的算力成本。即便是迭代速度最快的頭部廠商,一個完整的大版本更新,也需要至少兩個月的研發周期。

更讓人無奈的是,這種“手工作坊”式的研發模式,正在遭遇明顯的邊際效益遞減。從GPT-3到GPT-4,再到GPT-5,OpenAI的每一次迭代,都投入了比上一次更多的算力和人力,但普通用戶能感知到的能力提升,卻越來越有限。

國內的大模型玩家也是如此,從2023年到2026年,國內已經發布了數百款大模型,參數規模越來越大,訓練數據越來越多,但真正能重構行業流程、帶來顛覆性體驗的能力突破,卻寥寥無幾。很多大模型的迭代,只是在特定榜單上的分數提升,很難轉化為用戶可感知的體驗升級。

02

自進化給大模型行業

找了個新出口

從這個角度看,MiniMax的M2.7,給大家指了一條全新的路。

M2.7的核心突破,不是參數規模的提升,或是某個特定場景能力的優化,而是對大模型研發范式的重構。

在M2.7之前,大模型在自身的研發流程里,最多只能承擔輔助工具的角色。算法工程師可以用它寫一些訓練相關的代碼,做一些簡單的數據清洗工作,但核心的模型架構設計、訓練流程控制、對齊優化等關鍵環節,還是必須由人來完成。大模型始終是一個被研發的對象,而不是研發的參與者,整個研發流程的核心驅動力,始終是人。

而M2.7的“自進化”能力,第一次讓大模型深度參與到了自身研發的全流程中。

根據MiniMax官方披露的信息,M2.7可以完成數據篩選與清洗、訓練數據的構建、模型架構的迭代優化、訓練過程中的參數調整、對齊與評測,甚至是自身推理代碼的優化等多個環節的工作。在部分特定研發流程中,M2.7可以承擔30%到50%的工作量,研發人員只需要完成頂層的目標設定、關鍵環節的審核與把控,以及最終的效果驗收。

這個變化的本質,是把大模型的研發模式,從過去的“人驅動模型迭代”,轉向了“模型驅動模型迭代”。

最直觀的改變,就是研發效率的提升和成本的下降。

同樣的一個大模型迭代版本,過去需要一個200人的算法團隊花費3個月的時間完成,現在只需要更少的人力、更短的周期就能落地,人力成本和時間成本都有顯著下降。而在算力成本上,因為M2.7可以自主優化訓練流程,調整訓練參數,提升算力的使用效率,同樣的訓練任務,消耗的算力資源也會明顯減少。對于本就面臨資金壓力的創業公司來說,這種效率的提升,直接意味著生存空間的擴大。

很多人會有疑問,讓大模型參與自己的研發,會不會犧牲基礎能力?

從官方發布的信息來看,并沒有。M2.7的編程能力已經追平了OpenAI的GPT-5.3-Codex,在多模態理解、長上下文處理、邏輯推理等核心能力上,也進入了國內大模型的第一梯隊。自進化能力的實現,沒有以犧牲基礎能力為代價,反而通過模型的自主優化,實現了基礎能力的同步提升。

對于一家成立僅4年多的創業公司來說,這樣的成績并非偶然。MiniMax成立于2022年,是國內最早一批入局大模型賽道的創業公司,此前已經發布了多個版本的通用大模型,在多模態生成、長對話等領域積累了成熟的技術能力,也沉淀了大量的模型研發數據與經驗,這些都為自進化大模型的研發提供了堅實的基礎。而這次自進化大模型的發布,也讓MiniMax從國內大模型的第二梯隊,一躍進入了技術創新的第一陣營。

M2.7的發布,之所以能在行業內引發這么大的震動,核心原因在于,它打破了大模型行業過去三年的競爭邏輯。

過去三年,大模型行業的競爭,本質上是資源的競爭。誰能拿到更多的算力,誰能組建更大的算法團隊,誰能投入更多的資金,誰就能在競爭中占據優勢。大廠憑借著自己的資金優勢、算力優勢、生態優勢,在這場競爭中占據了絕對的主導地位,創業公司想要突圍,只能在細分場景里尋找機會,很難在通用大模型的核心技術上,和大廠正面抗衡。

行業的馬太效應越來越明顯,頭部廠商占據了絕大多數的算力資源、人才資源和市場份額,中小玩家的生存空間越來越小。

但自進化大模型的出現,改變了這個游戲規則。當大模型可以自己研發自己的時候,資源的重要性會相對下降,技術創新的權重會被無限放大。創業公司不需要再和大廠拼算力、拼資金、拼團隊規模,只需要在核心技術上實現突破,就能用更少的資源,實現更快的迭代速度,在競爭中拿到自己的一席之地。

和當年的DeepSeek類似,相當于給陷入內卷的行業,打開了一條全新賽道,讓技術創新重新成為行業競爭的核心。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
華誼兄弟7年虧80億申請破產,王中磊落魄兒子美國瀟灑

華誼兄弟7年虧80億申請破產,王中磊落魄兒子美國瀟灑

圓夢的小老頭
2026-04-25 08:49:42
上海富商花2000萬,讓情人生3個孩子,2019年后得知娃都不是他的

上海富商花2000萬,讓情人生3個孩子,2019年后得知娃都不是他的

漢史趣聞
2026-04-24 18:35:46
終于官宣!國家明令:即日起,非法放貸、暴力催收一律嚴打不留情

終于官宣!國家明令:即日起,非法放貸、暴力催收一律嚴打不留情

牛鍋巴小釩
2026-04-25 12:15:10
事發上海地鐵!警方通報:2人車廂內大打出手,均被行拘!公共視頻還原事發經過

事發上海地鐵!警方通報:2人車廂內大打出手,均被行拘!公共視頻還原事發經過

新民晚報
2026-04-25 12:50:21
知名博主被封禁:朝鮮風云,終成江湖絕響

知名博主被封禁:朝鮮風云,終成江湖絕響

虔青
2026-04-24 19:18:03
陸毅女兒近照曝光,16歲身高已超170cm,校花級美貌太驚艷了

陸毅女兒近照曝光,16歲身高已超170cm,校花級美貌太驚艷了

黎兜兜
2026-04-24 15:10:25
黑尾醬,徹底消失了?

黑尾醬,徹底消失了?

生如稗草
2026-03-15 08:48:11
別不當回事!4月30日前趕緊辦完,5月1日全面嚴查,誰躲都沒用

別不當回事!4月30日前趕緊辦完,5月1日全面嚴查,誰躲都沒用

復轉這些年
2026-04-24 21:20:33
21股暴增1000%!2026一季報瘋了,最高321倍

21股暴增1000%!2026一季報瘋了,最高321倍

慧眼看世界哈哈
2026-04-25 07:24:33
國乒男團陣容落定!關鍵二單敲定,王皓布局精妙球迷直呼穩了

國乒男團陣容落定!關鍵二單敲定,王皓布局精妙球迷直呼穩了

阿晞體育
2026-04-25 09:42:40
湖人頭號奇兵!斯馬特21+10+5斷兩數據全場最高 統治加時連場給力

湖人頭號奇兵!斯馬特21+10+5斷兩數據全場最高 統治加時連場給力

醉臥浮生
2026-04-25 11:14:52
秦皇島大姐逃單偷狗后續:正臉曝光,被人認出已社死,攤主不和解

秦皇島大姐逃單偷狗后續:正臉曝光,被人認出已社死,攤主不和解

奇思妙想草葉君
2026-04-24 11:33:43
悲催!37歲名牌大學畢業、年薪30萬女醫生被技術男嫌棄,當場崩潰

悲催!37歲名牌大學畢業、年薪30萬女醫生被技術男嫌棄,當場崩潰

火山詩話
2026-04-24 06:14:58
李詩灃湯杯狀態堪憂!韓國男隊被丹麥隊暴揍!

李詩灃湯杯狀態堪憂!韓國男隊被丹麥隊暴揍!

楊晨大神
2026-04-25 12:14:01
上海人終于體會到了引進印度人的“快樂”!

上海人終于體會到了引進印度人的“快樂”!

步論天下事
2026-04-25 09:34:47
明查|日本自衛隊坦克炸膛涉“中國制造”?型號搞錯了,且此“中國”非中國

明查|日本自衛隊坦克炸膛涉“中國制造”?型號搞錯了,且此“中國”非中國

澎湃新聞
2026-04-25 07:16:29
快訊!不等了,菲律賓喊話中國了!

快訊!不等了,菲律賓喊話中國了!

達文西看世界
2026-04-25 09:47:33
臺球皇帝亨得利:丁俊暉碰上趙心童就打雞血,但他防守壓力太大了

臺球皇帝亨得利:丁俊暉碰上趙心童就打雞血,但他防守壓力太大了

楊華評論
2026-04-25 01:56:27
北京車展名場面:雷軍打卡蔚來展臺 李斌聞訊一路小跑趕來

北京車展名場面:雷軍打卡蔚來展臺 李斌聞訊一路小跑趕來

快科技
2026-04-24 20:54:03
詹姆斯絕平三分,湖人不可思議的逆轉

詹姆斯絕平三分,湖人不可思議的逆轉

只關于籃球
2026-04-25 14:32:28
2026-04-25 15:04:49
新眸深度 incentive-icons
新眸深度
看見商業另一面。
1481文章數 2479關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

"蚊子大軍"來襲北極圈也被攻破 各地疾控發出重要預警

頭條要聞

"蚊子大軍"來襲北極圈也被攻破 各地疾控發出重要預警

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

手機
游戲
家居
親子
公開課

手機要聞

打破沉悶色調:谷歌有望推出松綠色Pixel 11 Pro Fold折疊手機

PS5實體版僅需180元!這款索尼3A級大作真心不能錯過

家居要聞

自然肌理 溫潤美學

親子要聞

當54歲的日本老公有了女兒,每天捧在手心都怕要化了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版