網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Meta九個(gè)月重建AI體系，新模型躋身全球AI第一梯隊(duì)

2026-04-13 19:52:05　來源: 軍聞新大門

四川舉報(bào)

分享至

在大模型賽道沉寂已久的Meta終于冒頭了。

4月9日，Meta旗下的超級(jí)智能實(shí)驗(yàn)室（Meta Superintelligence Labs, MSL）突然官宣了首款自研大模型Muse Spark。目前，這款模型已在meta.ai網(wǎng)站和Meta AI App上線，API預(yù)覽版向部分用戶開放。受到這一好消息的提振，Meta股價(jià)當(dāng)日一度大漲近9%，創(chuàng)下自今年1月以來最大單日漲幅。截至收盤，Meta股價(jià)收漲6.5%。

一年之前，Meta的開源大模型Llama4一經(jīng)發(fā)布就迅速陷入造假爭(zhēng)議。網(wǎng)友實(shí)測(cè)后發(fā)現(xiàn)Llama4的性能遠(yuǎn)不如官方給出的數(shù)據(jù)。在幾個(gè)月后離職的Meta前首席科學(xué)家楊立昆（LeCun）也對(duì)媒體曝光了內(nèi)幕，稱Llama4團(tuán)隊(duì)在不同測(cè)試中換上了不同版本的模型來湊數(shù)。

而被騙的扎克伯格則開始了對(duì)AI團(tuán)隊(duì)的大破大立，一邊對(duì)原團(tuán)隊(duì)大幅度裁員，一邊為新成立的超級(jí)智能實(shí)驗(yàn)室啟動(dòng)科技史上堪稱最激進(jìn)的人才招募計(jì)劃，不惜一切代價(jià)挖掘行業(yè)領(lǐng)袖，收購(gòu)技術(shù)精英團(tuán)隊(duì)。

其中最引人矚目的一筆支出無疑是Meta斥資143億美元收購(gòu)數(shù)據(jù)標(biāo)注公司Scale AI近49%股權(quán)，并任命其聯(lián)合創(chuàng)始人汪滔（Alexandr Wang）為首席人工智能官，負(fù)責(zé)領(lǐng)導(dǎo)MSL的工作。

Meta在同時(shí)期延攬的技術(shù)精英還包括前蘋果基礎(chǔ)模型團(tuán)隊(duì)（AFM）負(fù)責(zé)人龐若明，來自O(shè)penAI的大型語(yǔ)言模型專家Trapit Bansal、強(qiáng)化學(xué)習(xí)權(quán)威Shuchao Bi，從事多模態(tài)AI研發(fā)的Allan Jabri和Lu Liu；來自DeepMind的機(jī)器學(xué)習(xí)先驅(qū)Jack Rae和圖像生成頂尖專家Huiwen Chang；還有Claude核心開發(fā)者Anton Bakhtin和推理系統(tǒng)專家Joel Pobar等等。

Meta顯然是不差人也不差錢，但在此前的9個(gè)月里，Meta自研大模型的進(jìn)度一直在云里霧里。只有在Meta財(cái)報(bào)會(huì)議和扎克伯格的部分采訪中，人們才知道了這個(gè)代號(hào)牛油果的新模型的少量消息。今年3月，一度有傳言稱汪滔因?yàn)榇竽Ｐ瓦M(jìn)度遲緩而離職，但Meta很快進(jìn)行了辟謠。

一邊是其他科技大廠以穩(wěn)健的姿態(tài)高頻進(jìn)行著大模型的版本更新，一邊是MSL團(tuán)隊(duì)在長(zhǎng)達(dá)9個(gè)月的時(shí)間里閉門煉丹，汪滔和他的團(tuán)隊(duì)顯然承擔(dān)了不小的壓力。

隨著Muse Spark的空降發(fā)布，汪滔看上去心情無比釋放，先是在X上連發(fā)8條消息介紹Muse Spark，并將其在BenchMark上的各項(xiàng)分?jǐn)?shù)置頂，隨后又轉(zhuǎn)發(fā)了50多條消息，其中有團(tuán)隊(duì)成員的感言，有科技媒體的報(bào)道，也有不少普通網(wǎng)友的夸贊。

如果要總結(jié)這個(gè)讓Meta基本滿意的新模型水平，可以說它終于擺脫了Llama4“遙遙落后”的局面，綜合表現(xiàn)擠進(jìn)了全球大模型的第一梯隊(duì)。

第三方評(píng)測(cè)機(jī)構(gòu)Artificial Analysis給Muse Spark綜合智能指數(shù)的打分是52分，低于57分的Gemini3.1、57分的GPT5.4和53分的Claude Opus4.6，排名全球第四。而此前Llama4的評(píng)分僅為18分。

如果分開看Muse Spark在不同領(lǐng)域的評(píng)分，可以看出Muse Spark在考驗(yàn)高難度專業(yè)知識(shí)的Humanity’s Last Exam with tools（HLE，人類最后的考試）中分?jǐn)?shù)僅為50.4，在五個(gè)主流前沿大模型中排名最末。

Muse Spark在考察AI的純視覺抽象推理的ARC AGI 2中同樣表現(xiàn)較差，分?jǐn)?shù)為42.5，而在這一測(cè)試中表現(xiàn)最好的Gemini3.1Pro的分?jǐn)?shù)為76.5，兩者差距明顯。

Muse Spark另一個(gè)相對(duì)而言的短板是編程能力，這一點(diǎn)Meta也在博客中承認(rèn)，稱Muse Spark在長(zhǎng)時(shí)序agentic系統(tǒng)和編程工作流方面仍有差距”。在LiveCodeBench Pro中，Muse Spark 80分的成績(jī)遠(yuǎn)低于GPT-6.4的87.5；在接近實(shí)戰(zhàn)的Terminal-Bench 2.0（終端編程）中，Muse Spark 的59分低于GPT5.4的75.1。

除了不錯(cuò)的綜合表現(xiàn)，人們關(guān)注另一個(gè)點(diǎn)是，曾經(jīng)把Llama系列向開發(fā)者全面開放的Meta此次選擇了閉源。很多人評(píng)論稱Meta已經(jīng)背離了其“開放科學(xué)”的初衷。

汪滔在X上對(duì)此進(jìn)行了回應(yīng)，稱“九個(gè)月前我們從零開始重寫了AI技術(shù)棧，全新基礎(chǔ)設(shè)施、全新架構(gòu)、全新數(shù)據(jù) pipeline……這只是第一步，更大模型已在研發(fā)中，未來版本計(jì)劃開源。”

我們不知道汪滔承諾的“未來會(huì)開源”是否能兌現(xiàn)。但前期為大模型研發(fā)投入巨資的Meta顯然已經(jīng)在探索AI模型的營(yíng)利方式了。

目前，僅未具名的“特定合作伙伴”可使用Muse Spark的“私有 API 預(yù)覽版”，但Meta計(jì)劃未來向更廣泛用戶提供付費(fèi) API 訪問。此外，Meta稱該模型是 “為全產(chǎn)品生態(tài)量身打造”，未來幾周將接入Meta旗下的Facebook、Instagram、WhatsApp以及智能硬件。

此外，Meta 還宣布將會(huì)推出Muse Spark的購(gòu)物模式，大模型可以根據(jù)用戶在Instagram、Facebook上關(guān)注的內(nèi)容和品牌偏好做個(gè)性化的購(gòu)物推薦。

或許Meta當(dāng)下的核心思路是，相較于開源賺的聲譽(yù)，用大模型盈利以及用大模型更好地服務(wù)自己的30億用戶更重要。9個(gè)月前，Meta在MSL實(shí)驗(yàn)室成立時(shí)還在聊AGI的理想，現(xiàn)在的Meta更關(guān)心如何讓大模型滲透進(jìn)社交、購(gòu)物、醫(yī)療、硬件等真實(shí)場(chǎng)景。

聲明：個(gè)人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.