亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

汪滔的第一款大模型,讓Meta終于重新上桌了

0
分享至



從汪滔(Alexandr Wang)加入Meta算起,已經(jīng)過去大約十個(gè)月了,世界眼瞅著就要從一個(gè)夏天走到另一個(gè)夏天,Meta的“牛油果”終于熟了。

當(dāng)?shù)貢r(shí)間4月8日,Meta官宣發(fā)布Muse系列的第一款模型Spark。這也是Meta吸納汪滔并建立“超級(jí)智能實(shí)驗(yàn)室(MSL)”之后端上來(lái)的第一盤菜。

汪滔在X上連發(fā)數(shù)條消息介紹新模型,表示:“九個(gè)月前,我們從零開始重建了人工智能技術(shù)棧,包括全新的基礎(chǔ)設(shè)施、架構(gòu)和數(shù)據(jù)管道。Muse Spark 正是這項(xiàng)工作的成果。”

就連之前傳聞與汪滔不和的Meta前首席科學(xué)家楊立昆(Yann LeCun)都趕來(lái)恭喜,氣氛一片祥和。



Meta官方強(qiáng)調(diào),Spark的設(shè)計(jì)初衷是“小巧快速”,用這樣一個(gè)模型打頭陣,而不是“憋大招”直接發(fā)布碾壓態(tài)勢(shì)的模型,Meta也清楚時(shí)間不等人。

目前來(lái)看這一招奏效了,Meta的股價(jià)在當(dāng)日一度上漲約9%。

01

新模型Muse Spark

首先,讓我們來(lái)看看Meta發(fā)了個(gè)什么模型。

新模型名叫Muse Spark,其中Muse是模型系列的名稱。這個(gè)名字也挺有意思的,Muse即“繆斯”,Spark是“火花”。

Meta表示,Muse Spark是Meta迄今為止功能最強(qiáng)大的模型。它目前為Meta AI應(yīng)用和網(wǎng)站提供支持,并將于未來(lái)幾周內(nèi)陸續(xù)登陸WhatsApp、Instagram、Facebook、Messenger和AI眼鏡。Meta還將通過API向部分合作伙伴提供該模型的私有預(yù)覽版。

很明顯,Meta想要充分發(fā)揮自己的平臺(tái)優(yōu)勢(shì),明確表示Muse Spark是專為Meta的產(chǎn)品而打造的。

它將為Meta AI提供更智能、更快速的支持,并隨著時(shí)間的推移解鎖新功能,這些功能可以引用用戶在Instagram、Facebook和Threads上分享的推薦內(nèi)容和信息。

“我們正朝著個(gè)人超級(jí)智能的目標(biāo)邁進(jìn):打造一款能夠隨時(shí)隨地幫助任何人處理他們最關(guān)心之事的智能助手。”

Muse Spark的設(shè)計(jì)初衷是小巧快速,卻足以應(yīng)對(duì)科學(xué)、數(shù)學(xué)和健康領(lǐng)域的復(fù)雜問題,其核心是一個(gè)原生多模態(tài)推理模型。

與以往將視覺和文本“拼接”在一起的版本不同,Muse Spark從底層架構(gòu)開始重建,將視覺信息整合到其內(nèi)部邏輯中。這種架構(gòu)轉(zhuǎn)變實(shí)現(xiàn)了“視覺思維鏈”,使模型能夠標(biāo)注動(dòng)態(tài)環(huán)境——例如識(shí)別復(fù)雜咖啡機(jī)的組件,或通過并排視頻分析糾正用戶的瑜伽姿勢(shì)。



然而,最重要的技術(shù)飛躍是新增的“思考”模式。

Meta聲稱,該功能協(xié)調(diào)多個(gè)子智能體并行推理,使Meta能夠與谷歌的Gemini Deep Think和OpenAI的GPT-5.4 Pro等極端推理模型相媲美。



單模型測(cè)試結(jié)果來(lái)看。

Meta的新模型Muse Spark在綜合智能指數(shù)上表現(xiàn)亮眼。它在Artificial Analysis Intelligence Index(一個(gè)涵蓋多維度基準(zhǔn)的綜合智能評(píng)分)上拿到了52分,位列全球第4名。排在前面的分別是Gemini 3.1 Pro和GPT-5.4(均為約57分),以及Claude Opus 4.6(約53分)。

相比去年Llama 4 Maverick的僅18分,這已經(jīng)是巨大的進(jìn)步,顯示Meta在前沿模型上明顯追趕了回來(lái)。

具體強(qiáng)項(xiàng)和弱項(xiàng):

. PhD級(jí)科學(xué)推理(GPQA Diamond):Muse Spark達(dá)到了89.5%的準(zhǔn)確率,表現(xiàn)相當(dāng)強(qiáng)勁,但仍略微落后于Gemini 3.1 Pro(94.3%)、GPT-5.4(92.8%)和Claude Opus 4.6(92.7%)。

. 圖表與視覺理解(CharXiv Reasoning,在Contemplating模式下):得分86.4,在這項(xiàng)多模態(tài)視覺推理任務(wù)上明顯優(yōu)于競(jìng)品——超過了Gemini 3.1 Pro(80.2)、GPT-5.4(82.8)和Claude Opus 4.6(65.3)。視覺理解和圖表推理是Muse Spark的突出優(yōu)勢(shì)之一。

. 醫(yī)療硬推理(HealthBench Hard):得分42.8%,大幅領(lǐng)先所有主要競(jìng)品,包括GPT-5.4(40.1%)、Gemini 3.1 Pro(20.6%)和Claude Opus 4.6(14.8%)。Meta表示,這得益于他們與超過1000名醫(yī)生合作進(jìn)行的針對(duì)性訓(xùn)練,醫(yī)療相關(guān)能力是它的亮點(diǎn)。

. 軟件工程與編碼(SWE-Bench Verified):得分77.4%,落后于Claude Opus 4.6(80.8%)和Gemini 3.1 Pro(80.6%)。Meta自己也坦承,在長(zhǎng)時(shí)程多步自主任務(wù)(agentic tasks)和復(fù)雜編碼工作流上還有差距,需要繼續(xù)投入。

. 多模態(tài)多學(xué)科理解(MMMU Pro):得分約80.4–80.5%,僅次于Gemini 3.1 Pro(83.9%),在視覺多模態(tài)任務(wù)中排名第二。

總體來(lái)看,Muse Spark在視覺多模態(tài)推理、醫(yī)療領(lǐng)域和高效推理上表現(xiàn)突出,尤其適合Meta自己的社交、內(nèi)容和健康生態(tài);但在純編碼和長(zhǎng)鏈條自主任務(wù)上仍有追趕空間。

02

推遲數(shù)次的“牛油果”

在X上,發(fā)生了一個(gè)有趣的小插曲。

作為Meta如今的AI掌舵手,汪滔(Alexandr Wang)在X上咣咣發(fā)布消息宣傳新模型。

這個(gè)時(shí)候,有人指出,Meta給出的benchmark圖表太混淆視聽,“簡(jiǎn)直是犯罪”。在這張圖表中,Muse Spark的分?jǐn)?shù)排在第一列并且全部標(biāo)成突出高亮色,乍一看,感覺是全面領(lǐng)先,但是細(xì)看便知其實(shí)有些分?jǐn)?shù)是較低的。





在圖表上玩花樣,其實(shí)并不新鮮,OpenAI此前已經(jīng)多次因此受到指責(zé)。

有意思的是,汪滔這次選擇了立刻“滑跪”,回復(fù)該質(zhì)疑:

“抱歉,我們并非有意暗示我們的得分最高。恰恰相反,大多數(shù)評(píng)估結(jié)果表明,我們的模型還有很多需要改進(jìn)的地方。我們不會(huì)再犯同樣的錯(cuò)誤。”



不難看出,Meta也并非要讓Muse Spark達(dá)到全面碾壓之勢(shì),而是要回到AI的競(jìng)爭(zhēng)行列當(dāng)中。

從種種跡象來(lái)看,Muse系列應(yīng)該就是Meta此前內(nèi)部代號(hào)“牛油果(Avocado)”的項(xiàng)目。

牛油果已經(jīng)跳票太久,Meta如今采取了“先小后大”的策略。Meta在官方博文中強(qiáng)調(diào),Spark主打快速小巧,這只是個(gè)開始:

“我們的模型正在按預(yù)期發(fā)展。Muse Spark是我們發(fā)展歷程中的一個(gè)早期數(shù)據(jù)點(diǎn),我們正在開發(fā)更大規(guī)模的模型。”

這和AI行業(yè)(尤其是頭部玩家)習(xí)慣于“炸場(chǎng)”“驚世駭俗”的節(jié)奏不同,但是Meta確實(shí)也沒時(shí)間慢慢來(lái)了。

去年初,Meta發(fā)布Llama 4系列后,模型表現(xiàn)未達(dá)預(yù)期(尤其是Behemoth大模型性能提升不足),隨后暫停了Llama系列的進(jìn)一步開源研發(fā)。

到了去年夏天,Meta斥資143億美元投資Scale AI(持股49%),并直接挖來(lái)Scale AI創(chuàng)始人兼CEO、28歲的汪滔(Alexandr Wang)擔(dān)任首席AI官,正式成立Meta Superintelligence Labs(MSL)。

同時(shí)Meta展開瘋狂挖角,從OpenAI、Google等公司高薪招募數(shù)十名頂尖研究員,部分offer達(dá)到數(shù)百萬(wàn)至上億美元。

成本方面,Meta2025年全年AI相關(guān)資本支出達(dá)722.2億美元;2026年1月財(cái)報(bào)指引顯示,這一數(shù)字將大幅提升至1150億—1350億美元,幾乎翻倍,主要用于MSL的模型訓(xùn)練和數(shù)據(jù)中心擴(kuò)建。

過去這十個(gè)月的時(shí)間里,Meta以及扎克伯格、Meta的AI一把手汪滔身上,都?jí)毫ι酱蟆H藗兤惹械叵肟吹酵籼霞尤搿eta重組之后,究竟會(huì)端上來(lái)一盤什么菜。

至少?gòu)氖袌?chǎng)的第一時(shí)間反饋來(lái)看,Meta放棄“憋大招”轉(zhuǎn)而先上小菜的策略是奏效的,Meta股價(jià)當(dāng)日一度大漲近9%,創(chuàng)下自今年1月以來(lái)最大單日漲幅。截至收盤,Meta收漲6.5%。

一個(gè)值得注意的信息是,過去外界一直認(rèn)為“牛油果”將完全轉(zhuǎn)向閉源,但Meta這次卻沒有把話說(shuō)死。未來(lái),Meta可能走開源與閉源并行的混合策略,將旗艦?zāi)P秃酮?dú)家技術(shù)保留在內(nèi)部的同時(shí)保持新鮮模型對(duì)廣泛開發(fā)者群體的開源可用性。

Meta總算把“牛油果”端上桌了,但這還遠(yuǎn)遠(yuǎn)不是終點(diǎn)。對(duì)汪滔和扎克伯格來(lái)說(shuō),Muse Spark更像是一聲發(fā)令槍,未來(lái)如何,還要看“越來(lái)越強(qiáng)”的承諾能不能兌現(xiàn)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
歐足聯(lián)俱樂部系數(shù)更新:拜仁反超皇馬登頂,前十英超西甲各三隊(duì)

歐足聯(lián)俱樂部系數(shù)更新:拜仁反超皇馬登頂,前十英超西甲各三隊(duì)

懂球帝
2026-04-16 19:28:06
新中國(guó)十位國(guó)家級(jí)女領(lǐng)導(dǎo)人

新中國(guó)十位國(guó)家級(jí)女領(lǐng)導(dǎo)人

祁州校尉
2026-04-11 09:00:31
環(huán)衛(wèi)工撿到藏著30萬(wàn)現(xiàn)金的牛奶箱!在上海一小區(qū)垃圾站旁,失主居然不是來(lái)丟垃圾的人

環(huán)衛(wèi)工撿到藏著30萬(wàn)現(xiàn)金的牛奶箱!在上海一小區(qū)垃圾站旁,失主居然不是來(lái)丟垃圾的人

環(huán)球網(wǎng)資訊
2026-04-15 14:32:25
張?zhí)m沉默了!馬筱梅直接下通知要同住,還給她戴了好奶奶的高帽子

張?zhí)m沉默了!馬筱梅直接下通知要同住,還給她戴了好奶奶的高帽子

橙星文娛
2026-04-16 15:52:02
手握43個(gè)世界冠軍,25歲嫁百億豪門,7年連生4娃,仍被丈夫?qū)櫝蓪?>
    </a>
        <h3>
      <a href=翰飛觀事
2026-04-16 14:36:57
老了才明白:父母一旦超過81,立刻停止兩種行為,否則晚景或凄涼

老了才明白:父母一旦超過81,立刻停止兩種行為,否則晚景或凄涼

三農(nóng)老歷
2026-03-19 13:59:41
斯諾克世錦賽抽簽解讀!趙心童運(yùn)氣爆棚,丁俊暉避免一輪游對(duì)手弱

斯諾克世錦賽抽簽解讀!趙心童運(yùn)氣爆棚,丁俊暉避免一輪游對(duì)手弱

曹說(shuō)體育
2026-04-16 19:22:51
告別戰(zhàn)獨(dú)得2分!29歲樊振東全英文演講:全場(chǎng)動(dòng)情 德甲隊(duì)經(jīng)理哭了

告別戰(zhàn)獨(dú)得2分!29歲樊振東全英文演講:全場(chǎng)動(dòng)情 德甲隊(duì)經(jīng)理哭了

風(fēng)過鄉(xiāng)
2026-04-16 07:26:35
從“日漲百萬(wàn)”到無(wú)人問津,曾經(jīng)一夜爆紅的郭有才,如今怎樣了?

從“日漲百萬(wàn)”到無(wú)人問津,曾經(jīng)一夜爆紅的郭有才,如今怎樣了?

小椰的奶奶
2026-04-16 17:01:09
6月1日起,全國(guó)4.5億司機(jī)都要變!公安部:不卡時(shí)間,專盯狀態(tài)!

6月1日起,全國(guó)4.5億司機(jī)都要變!公安部:不卡時(shí)間,專盯狀態(tài)!

花小貓的美食日常
2026-04-16 15:43:26
1985年,國(guó)安叛徒藏身南美,中國(guó)6名兵王萬(wàn)里鋤奸,F(xiàn)BI顏面盡失

1985年,國(guó)安叛徒藏身南美,中國(guó)6名兵王萬(wàn)里鋤奸,F(xiàn)BI顏面盡失

干史人
2026-04-14 21:10:03
全反了!特朗普未預(yù)料到的一幕已上演,哈里斯:中國(guó)正密切關(guān)注!

全反了!特朗普未預(yù)料到的一幕已上演,哈里斯:中國(guó)正密切關(guān)注!

點(diǎn)燃好奇心
2026-04-16 19:06:13
中資船突破霍爾木茲,卻遭美軍攔截折返,該派我們的軍艦去護(hù)航?

中資船突破霍爾木茲,卻遭美軍攔截折返,該派我們的軍艦去護(hù)航?

閆樹軍論評(píng)
2026-04-16 14:48:04
“高三學(xué)生學(xué)習(xí)困難測(cè)出智障”當(dāng)事人回應(yīng):智力測(cè)試69分不是最終診斷,我被ADHD困擾、正在努力調(diào)整,不要用“智障”標(biāo)簽定義我

“高三學(xué)生學(xué)習(xí)困難測(cè)出智障”當(dāng)事人回應(yīng):智力測(cè)試69分不是最終診斷,我被ADHD困擾、正在努力調(diào)整,不要用“智障”標(biāo)簽定義我

大風(fēng)新聞
2026-04-16 16:28:09
美國(guó),調(diào)查“特朗普交易”

美國(guó),調(diào)查“特朗普交易”

中國(guó)基金報(bào)
2026-04-16 07:41:05
中國(guó)女籃集訓(xùn)進(jìn)展:19人名單僅張子宇等6人報(bào)到 首日僅一人訓(xùn)練

中國(guó)女籃集訓(xùn)進(jìn)展:19人名單僅張子宇等6人報(bào)到 首日僅一人訓(xùn)練

醉臥浮生
2026-04-16 16:38:24
國(guó)臺(tái)辦:統(tǒng)一后臺(tái)灣財(cái)政稅收全用于民生,無(wú)需在防務(wù)上花巨資

國(guó)臺(tái)辦:統(tǒng)一后臺(tái)灣財(cái)政稅收全用于民生,無(wú)需在防務(wù)上花巨資

南方都市報(bào)
2026-04-15 16:48:15
科爾:我們能四度奪冠是有原因的 這是一場(chǎng)展現(xiàn)好勝心的比賽

科爾:我們能四度奪冠是有原因的 這是一場(chǎng)展現(xiàn)好勝心的比賽

北青網(wǎng)-北京青年報(bào)
2026-04-16 19:33:39
67 歲遲志強(qiáng)工作現(xiàn)狀:出獄 37 年后定居黑龍江兒子工作令人淚目

67 歲遲志強(qiáng)工作現(xiàn)狀:出獄 37 年后定居黑龍江兒子工作令人淚目

夢(mèng)錄的西方史話
2026-04-10 14:26:52
決然赴死!伊朗飛行員壯烈犧牲,炸翻美司令部,換掉3架美機(jī)

決然赴死!伊朗飛行員壯烈犧牲,炸翻美司令部,換掉3架美機(jī)

愛吃醋的貓咪
2026-04-14 22:01:04
2026-04-16 19:56:49
字母榜 incentive-icons
字母榜
讓未來(lái)不止于大。
2383文章數(shù) 8059關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰(shuí)在大模型上更高效

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰生意迷霧

汽車要聞

空間大五個(gè)乘客都滿意?體驗(yàn)嵐圖泰山X8

態(tài)度原創(chuàng)

時(shí)尚
手機(jī)
游戲
數(shù)碼
藝術(shù)

初夏最時(shí)髦的30種背心搭配,太好看了!

手機(jī)要聞

OPPO新一代ColorOS 16升級(jí)計(jì)劃出爐:首批5月10日推送 覆蓋25款機(jī)型

任天堂做純主機(jī)?數(shù)毛社表示不可能!

數(shù)碼要聞

OPPO Pad Mini評(píng)測(cè):薄過iPad mini,小屏平板新卷王

藝術(shù)要聞

張大千『 花菓薈萃冊(cè)』

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版