僅僅2個月,Mureka再次宣布版本升級。
3月27日,2026年中關村論壇年會上,昆侖萬維旗下天工AI舉辦“世界模型前沿技術與天工AIGC全家桶大模型生態(tài)”專場發(fā)布會,發(fā)布昆侖萬維2026 AGI戰(zhàn)略的同時,也官宣AI音樂平臺Mureka正式發(fā)布V9模型。
![]()
隨后,北京市經(jīng)濟和信息化局二級巡視員張宇航發(fā)表致辭,表示昆侖萬維作為扎根北京、輻射全國、走向世界的優(yōu)秀科技企業(yè),為人工智能的產(chǎn)業(yè)發(fā)展注入新的活力。
天工AI董事長兼CEO周亞輝也提出了公司對AGI發(fā)展階段的判斷:AI行業(yè)已經(jīng)歷了從移動互聯(lián)網(wǎng)流量邏輯到大模型工具化的轉(zhuǎn)變,正在向以AI為基礎設施的平臺經(jīng)濟階段演進,而評判AGI現(xiàn)實程度的關鍵也逐步從概念討論收斂為一個更實際的問題——能否自動化大多數(shù)具備經(jīng)濟價值的工作。
![]()
基于這一判斷,昆侖萬維將2026年的AGI戰(zhàn)略升級為“3+1”生態(tài)架構:底層以多模態(tài)大模型為基礎,中層通過統(tǒng)一的智能體系統(tǒng)調(diào)度模型能力,上層則構建面向內(nèi)容生產(chǎn)與分發(fā)的AI原生平臺體系,試圖把“模型能力”轉(zhuǎn)化為可運轉(zhuǎn)的生產(chǎn)力。如果說這一戰(zhàn)略試圖回答的是“AI如何進入真實生產(chǎn)關系”,那么Mureka V9模型則意味著這一思路在音樂領域的具體落地。
此前,Mureka V8已在國際權威AI音樂評測平臺Artificial Analysis上成功登頂vocals(人聲)、instrumental(樂器)雙榜第一,綜合實力超越Suno V4.5、Udio v1.5 Allegro、Lyria 2等國際主流AI音樂模型,加冕目前全球綜合能力最強的AI音樂模型,為其技術迭代奠定了堅實基礎。
![]()
那么,當AI音樂行業(yè)告別粗放增長,此次MurekaV9將在新質(zhì)生產(chǎn)力、版權合規(guī)與生態(tài)共建中扮演怎樣的角色?
![]()
音樂創(chuàng)作的“表達偏差”被終結了?
近幾年,AI生成音樂迎來了飛速發(fā)展,但問題暴露得同樣迅速。
比如,AI音樂往往會被認為生成作品質(zhì)感不足、情感表達單薄、場景適配弱,尤其是創(chuàng)作意圖與生成結果的“表達偏差”。即便結構正確,卻由于缺乏真實情緒的牽引,仍停留在統(tǒng)計意義上的模仿,總覺得少了點人味兒。
換句話說,過去的AI音樂生成的常見問題還只是“能不能生成”,要想邁進專業(yè)化門檻,接下來AI要做的是“能按你想的方式寫出來”。
正是在這一行業(yè)共性瓶頸之下,Mureka的技術演進路線更顯清晰與針對性。此次Mureka V9升級,依然建立在MusiCoT(Music Chain-of-Thought)技術體系的持續(xù)迭代之上,進一步強化了模型對音樂結構、歌詞段落、表達意圖與聲音呈現(xiàn)之間關系的協(xié)同建模。
![]()
據(jù)音樂先聲的親身體驗,用統(tǒng)一的測試方法來看,V8與V9的最大差異其實并不體現(xiàn)在旋律優(yōu)劣這種主觀維度,其核心提升主要體現(xiàn)在可控性、音質(zhì)、效率、表達性等更行業(yè)化的指標。
以之前我們使用V8模型生成《再給我多一點時間》為例,與V9模型在相同歌詞、風格設定和提示詞下的生成結果相比,后者的表現(xiàn)更能貼合提示詞中的具體細節(jié)要求,實現(xiàn)段落級歌詞語義控制,且能在多輪迭代中,真正聽懂用戶對作品風格、情緒、形式等層面的反饋。
( Prompt:BPM 95-105,木吉他分解和弦為主+輕掃弦點綴,原聲鋼琴單音旋律鋪底,輕量流行鼓組(底鼓輕柔、踩镲八分音符、軍鼓輕擊,鈴鼓沙錘輕點綴),柔潤電貝斯根音輕彈跳驅(qū)動,副歌加微量短樂句點綴,極淡電子Pad鋪墊氛圍;清甜溫潤女聲/清透干凈男聲,中文標準發(fā)音,咬字清晰,主歌輕柔敘事,預副歌情緒漸升,副歌旋律上揚柔和有記憶點。)
比如在V9的作品中,模型不僅遵循了“清甜溫潤女聲/清透干凈男聲”“中文標準發(fā)音、咬字清晰”等聲音指令,還在主歌輕柔敘事、預副歌情緒漸升,以及副歌旋律上揚柔和有記憶點的稍微偏抽象的要求上,能明顯感受到更穩(wěn)定的響應力度。
值得注意的是,V9模型生成作品在音質(zhì)上的提升,不只是抽象的“更好聽”,而是體現(xiàn)在錄音師級別的混音控制力上,這點很驚艷。
以生成歌曲《Sunlight on your face》為例,人聲清晰度更高,伴奏鋪底更有層次,頻段之間的擁擠和互相遮蔽明顯減少,整體聲音也不容易發(fā)悶或發(fā)飄,呈現(xiàn)出更穩(wěn)定的結像與更自然的空間展開。在此基礎上,作品整體的通透感、密度感與完成度都有所提升,更接近經(jīng)過認真后期處理的成品狀態(tài)。
此外,《Sunlight on your face》在情緒表達上沒有一味堆疊演唱和編排元素,而是通過適度留白,讓人聲、旋律與伴奏之間保留出呼吸感。這種巧妙處理,讓主線表達更集中,細節(jié)也更容易被聽見,伴奏也不會因為過度堆疊而顯得混亂,最終呈現(xiàn)出的,是一種更清晰、更通透也更具完成度的整體聽感。
( Prompt:新靈魂 / 私密爵士人聲作品。靈感:日落閣樓工作室,暖光中浮塵輕揚。核心:氣聲近距離男聲 + 溫暖 Rhodes 鋼琴。氛圍:安靜、懷舊、時光靜止 —— 復古閣樓里,金色陽光緩緩透過百葉窗褪去。)
從生成效率來看,V9在底層推理鏈路上完成了進一步優(yōu)化,顯著提升了文本到音樂關鍵環(huán)節(jié)的處理效率,并帶來整體生成速度、多樣性的同步改善。對創(chuàng)作者來說,意味著從輸入想法到聽到結果之間的等待更短,試錯成本更低,迭代創(chuàng)作也更順暢。
這種生成多樣性上的顛覆式升級,在實際的創(chuàng)作場景中尤為明顯。以我們此前生成的《Sleepless Nights》為例,同樣的提示詞和歌詞下,在使用V8時,為了找到符合預期的結果,我們需要生成超過10個版本并經(jīng)過多輪篩選;而在V9模型下,僅通過4版輸出就能夠精準定位滿意版本,且每一版在風格和旋律上都保持了明顯的差異性。
這一迭代顯著提升了相同創(chuàng)作方向下的產(chǎn)出多樣性,不僅能更快達到創(chuàng)作預期,也有效解決了旋律走向、結構編排與聽感上的重復率,使得音樂輸出更有新鮮度和探索空間。
這對于高頻迭代和批量試歌場景,這會是非常關鍵的一步。也意味著Mureka 對創(chuàng)作的理解發(fā)生了根本性變化:創(chuàng)作不再是寫出一首歌,而是在版本空間中進行選擇、判斷與迭代。
從以上維度更新來看,Mureka V9模型進一步融合了對歌詞段落設計、語義重心與音樂組織方式的細粒度思考,讓模型在旋律推進、段落表達、音色安排與整體完成度之間建立更穩(wěn)定的內(nèi)在一致性,完成了朝“高可控創(chuàng)作”邁出的又一步。
![]()
AI音樂下半場,
從技術創(chuàng)新走向產(chǎn)業(yè)應用
今年起,AI音樂正在從技術議題,變成制度議題。
如果說其發(fā)展的上半場的關鍵詞是“可能性”,那么下半場的核心,必然是如何在規(guī)制與市場之間實現(xiàn)可持續(xù)發(fā)展。
在國內(nèi),《國務院關于深入實施“人工智能+”行動的意見》中明確提出,要推動人工智能與各行業(yè)深度融合,同時完善數(shù)據(jù)產(chǎn)權與版權制度,建立與AI發(fā)展相適配的規(guī)則體系。
同時,地方層面也在迅速跟進。例如去年11月,北京市率先發(fā)布了《北京市促進“人工智能+視聽”產(chǎn)業(yè)高質(zhì)量發(fā)展行動方案(2025-2029年)》,積極布局“人工智能+視聽”領域垂類大模型研發(fā),加快算法模型突破。
在2026中關村論壇年會上,北京市東城區(qū)人民政府黨組成員、副區(qū)長鄧慧敏在發(fā)言中提到,“十五五”期間,東城將大力發(fā)展動漫影視、數(shù)字演繹、藝人經(jīng)紀、游戲電競等新型賽道,做大做強數(shù)字文娛產(chǎn)業(yè)。北京市經(jīng)濟和信息化局二級巡視員張宇航也表示,北京市經(jīng)濟和信息化局也將聚焦大模型的關鍵技術,以文娛、文旅、教育等場景為牽引,加速AI在游戲創(chuàng)作、數(shù)字文娛等領域的融合應用。
![]()
在國際層面,趨勢同樣清晰。從美國版權局確立“人類創(chuàng)造性控制”為版權保護核心,到歐盟強制要求AI公司建立“數(shù)據(jù)族譜”證明訓練數(shù)據(jù)合法,全球范圍內(nèi),AI音樂的訓練與生成版權邊界正被不斷收緊。
不難預見,一套適配AI時代的版權規(guī)則與合規(guī)體系正在加速成型,這也將定義AI音樂的合規(guī)底線,更影響著其下一階段的發(fā)展主軸。
對于技術產(chǎn)品而言,其評價標準也隨之發(fā)生變化,從單純關注生成質(zhì)量,走向?qū)τ柧殧?shù)據(jù)合法性、輸出合規(guī)性與可用價值的綜合考量,真正的競爭將在產(chǎn)業(yè)生態(tài)、規(guī)則理解與落地能力之間展開。
![]()
作為國內(nèi)最早明確將All in AGI并寫入年報的上市公司之一,昆侖萬維在Mureka大模型的布局不僅是一個產(chǎn)品,更是國家戰(zhàn)略的生動實踐,照見了從政策意圖、技術創(chuàng)新走向產(chǎn)業(yè)應用的張力與可能性。
作為AI技術在文化創(chuàng)意產(chǎn)業(yè)落地的典型代表,Mureka積極響應了“人工智能+”行動號召,不沉迷于參數(shù)迭代的內(nèi)卷,而是通過技術核心引擎,打破音樂創(chuàng)作的高門檻,大幅提升創(chuàng)作效率,成為將技術創(chuàng)新轉(zhuǎn)化為重塑數(shù)字音樂產(chǎn)業(yè)的新質(zhì)生產(chǎn)力。
![]()
與此同時,Mureka也契合北京市年初提出的建設“全球人工智能第一城”的新目標,憑借MusiCoT技術在多模態(tài)理解與復雜邏輯推理上的優(yōu)勢,直觀展現(xiàn)了中國自主研發(fā)大模型的全球競爭力,成為文化與科技深度融合的鮮活樣本。
更難得的是,在國家強化AI版權治理的趨勢下,Mureka V9始終堅守合規(guī)訓練的底線,用可溯源的技術設計,為AI輔助創(chuàng)作提供了一個安全、可溯源的技術范本,精準契合了數(shù)字版權與合規(guī)發(fā)展的國家戰(zhàn)略導向。
從更長線的角度來看,Mureka V9所代表的,不只是一次模型升級,而是一種兼顧合規(guī)性、市場價值與產(chǎn)業(yè)生態(tài)建設的可持續(xù)發(fā)展路徑,即在可控的技術框架內(nèi),實現(xiàn)真實可用的創(chuàng)作能力,并逐步建立長期有效的產(chǎn)業(yè)生態(tài)。
結語
回顧這一次Mureka V9模型的發(fā)布,我們可以看到一個比技術更大的變遷正在展開。
當技術走向成熟,需要解決意圖與表達之間的偏差;而產(chǎn)品走向可持續(xù),則需要在規(guī)則、合規(guī)與價值分配之間找到平衡點。當AI的參與變得可控、可理解、可規(guī)范時,音樂不會因為技術改變而變質(zhì),反而打開新的表達邊界。
這或許才是AI音樂從生成能力走向產(chǎn)業(yè)革命的真正起點。
作者 | 李沁予 編輯 | 范志輝
*本文圖源網(wǎng)絡,如侵權聯(lián)系刪改
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.