![]()
在大模型賽道沉寂已久的Meta終于冒頭了。
4月9日,Meta旗下的超級(jí)智能實(shí)驗(yàn)室(Meta Superintelligence Labs, MSL)突然官宣了首款自研大模型Muse Spark。目前,這款模型已在meta.ai網(wǎng)站和Meta AI App上線,API預(yù)覽版向部分用戶開放。受到這一好消息的提振,Meta股價(jià)當(dāng)日一度大漲近9%,創(chuàng)下自今年1月以來最大單日漲幅。截至收盤,Meta股價(jià)收漲6.5%。
一年之前,Meta的開源大模型Llama4一經(jīng)發(fā)布就迅速陷入造假爭(zhēng)議。網(wǎng)友實(shí)測(cè)后發(fā)現(xiàn)Llama4的性能遠(yuǎn)不如官方給出的數(shù)據(jù)。在幾個(gè)月后離職的Meta前首席科學(xué)家楊立昆(LeCun)也對(duì)媒體曝光了內(nèi)幕,稱Llama4團(tuán)隊(duì)在不同測(cè)試中換上了不同版本的模型來湊數(shù)。
而被騙的扎克伯格則開始了對(duì)AI團(tuán)隊(duì)的大破大立,一邊對(duì)原團(tuán)隊(duì)大幅度裁員,一邊為新成立的超級(jí)智能實(shí)驗(yàn)室啟動(dòng)科技史上堪稱最激進(jìn)的人才招募計(jì)劃,不惜一切代價(jià)挖掘行業(yè)領(lǐng)袖,收購(gòu)技術(shù)精英團(tuán)隊(duì)。
其中最引人矚目的一筆支出無疑是Meta斥資143億美元收購(gòu)數(shù)據(jù)標(biāo)注公司Scale AI近49%股權(quán),并任命其聯(lián)合創(chuàng)始人汪滔(Alexandr Wang)為首席人工智能官,負(fù)責(zé)領(lǐng)導(dǎo)MSL的工作。
Meta在同時(shí)期延攬的技術(shù)精英還包括前蘋果基礎(chǔ)模型團(tuán)隊(duì)(AFM)負(fù)責(zé)人龐若明,來自O(shè)penAI的大型語(yǔ)言模型專家Trapit Bansal、強(qiáng)化學(xué)習(xí)權(quán)威Shuchao Bi,從事多模態(tài)AI研發(fā)的Allan Jabri和Lu Liu;來自DeepMind的機(jī)器學(xué)習(xí)先驅(qū)Jack Rae和圖像生成頂尖專家Huiwen Chang;還有Claude核心開發(fā)者Anton Bakhtin和推理系統(tǒng)專家Joel Pobar等等。
Meta顯然是不差人也不差錢,但在此前的9個(gè)月里,Meta自研大模型的進(jìn)度一直在云里霧里。只有在Meta財(cái)報(bào)會(huì)議和扎克伯格的部分采訪中,人們才知道了這個(gè)代號(hào)牛油果的新模型的少量消息。今年3月,一度有傳言稱汪滔因?yàn)榇竽P瓦M(jìn)度遲緩而離職,但Meta很快進(jìn)行了辟謠。
一邊是其他科技大廠以穩(wěn)健的姿態(tài)高頻進(jìn)行著大模型的版本更新,一邊是MSL團(tuán)隊(duì)在長(zhǎng)達(dá)9個(gè)月的時(shí)間里閉門煉丹,汪滔和他的團(tuán)隊(duì)顯然承擔(dān)了不小的壓力。
隨著Muse Spark的空降發(fā)布,汪滔看上去心情無比釋放,先是在X上連發(fā)8條消息介紹Muse Spark,并將其在BenchMark上的各項(xiàng)分?jǐn)?shù)置頂,隨后又轉(zhuǎn)發(fā)了50多條消息,其中有團(tuán)隊(duì)成員的感言,有科技媒體的報(bào)道,也有不少普通網(wǎng)友的夸贊。
![]()
如果要總結(jié)這個(gè)讓Meta基本滿意的新模型水平,可以說它終于擺脫了Llama4“遙遙落后”的局面,綜合表現(xiàn)擠進(jìn)了全球大模型的第一梯隊(duì)。
第三方評(píng)測(cè)機(jī)構(gòu)Artificial Analysis給Muse Spark綜合智能指數(shù)的打分是52分,低于57分的Gemini3.1、57分的GPT5.4和53分的Claude Opus4.6,排名全球第四。而此前Llama4的評(píng)分僅為18分。
![]()
如果分開看Muse Spark在不同領(lǐng)域的評(píng)分,可以看出Muse Spark在考驗(yàn)高難度專業(yè)知識(shí)的Humanity’s Last Exam with tools(HLE,人類最后的考試)中分?jǐn)?shù)僅為50.4,在五個(gè)主流前沿大模型中排名最末。
Muse Spark在考察AI的純視覺抽象推理的ARC AGI 2中同樣表現(xiàn)較差,分?jǐn)?shù)為42.5,而在這一測(cè)試中表現(xiàn)最好的Gemini3.1Pro的分?jǐn)?shù)為76.5,兩者差距明顯。
Muse Spark另一個(gè)相對(duì)而言的短板是編程能力,這一點(diǎn)Meta也在博客中承認(rèn),稱Muse Spark在長(zhǎng)時(shí)序agentic系統(tǒng)和編程工作流方面仍有差距”。在LiveCodeBench Pro中,Muse Spark 80分的成績(jī)遠(yuǎn)低于GPT-6.4的87.5;在接近實(shí)戰(zhàn)的Terminal-Bench 2.0(終端編程)中,Muse Spark 的59分低于GPT5.4的75.1。
![]()
除了不錯(cuò)的綜合表現(xiàn),人們關(guān)注另一個(gè)點(diǎn)是,曾經(jīng)把Llama系列向開發(fā)者全面開放的Meta此次選擇了閉源。很多人評(píng)論稱Meta已經(jīng)背離了其“開放科學(xué)”的初衷。
汪滔在X上對(duì)此進(jìn)行了回應(yīng),稱“九個(gè)月前我們從零開始重寫了AI技術(shù)棧,全新基礎(chǔ)設(shè)施、全新架構(gòu)、全新數(shù)據(jù) pipeline……這只是第一步,更大模型已在研發(fā)中,未來版本計(jì)劃開源。”
我們不知道汪滔承諾的“未來會(huì)開源”是否能兌現(xiàn)。但前期為大模型研發(fā)投入巨資的Meta顯然已經(jīng)在探索AI模型的營(yíng)利方式了。
目前,僅未具名的“特定合作伙伴”可使用Muse Spark的“私有 API 預(yù)覽版”,但Meta計(jì)劃未來向更廣泛用戶提供付費(fèi) API 訪問。此外,Meta稱該模型是 “為全產(chǎn)品生態(tài)量身打造”,未來幾周將接入Meta旗下的Facebook、Instagram、WhatsApp以及智能硬件。
此外,Meta 還宣布將會(huì)推出Muse Spark的購(gòu)物模式,大模型可以根據(jù)用戶在Instagram、Facebook上關(guān)注的內(nèi)容和品牌偏好做個(gè)性化的購(gòu)物推薦。
或許Meta當(dāng)下的核心思路是,相較于開源賺的聲譽(yù),用大模型盈利以及用大模型更好地服務(wù)自己的30億用戶更重要。9個(gè)月前,Meta在MSL實(shí)驗(yàn)室成立時(shí)還在聊AGI的理想,現(xiàn)在的Meta更關(guān)心如何讓大模型滲透進(jìn)社交、購(gòu)物、醫(yī)療、硬件等真實(shí)場(chǎng)景。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.