无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

突然襲擊!剛剛,Meta超級智能團隊首個大模型來了

0
分享至


來源:機器之心

Meta 的大模型,卷土重來了!


剛剛,Meta 重金組建的超級智能實驗室(SML)交卷!這也是年輕華人 Alexandr Wang 帶領該團隊后,交出的首份成績。

Meta 一直是生成式 AI 時代最值得關注的公司之一,早在 2023 年初,它憑借開源 Llama 系列模型,迅速積累了一批忠實且規模龐大的用戶群體。然而,這一勢頭在去年戛然而止:Llama 4 發布后評價褒貶不一,最終甚至被曝出存在刷榜(操縱基準測試)的情況。

Llama 4 這次頗為坎坷的發布,促使 Meta 創始人兼 CEO 扎克伯格在 2025 年夏天對公司的 AI 業務進行了徹底重組,成立了一個全新的內部部門 ——Meta Superintelligence Labs(MSL),并邀請年僅 29 歲的前 Scale AI 聯合創始人兼 CEO Alexandr Wang 出任首席 AI 官,負責領導該部門。

在此之后,Meta 又以高薪招募了多位頂級研究員,試圖在大模型與通用智能(AGI)競爭中重新奪回主動權。

如今,Meta 正在展示這一系列調整的成果:全新自研模型 Muse Spark 上線。

Alexandr Wang 在競爭對手社交平臺 X 上表示,「今天,Meta 正式發布 Muse Spark,這是 MSL 推出的首個模型。九個月前,我們從零開始重構了整套 AI 技術棧 —— 包括全新的基礎設施、全新的模型架構以及全新的數據管線。Muse Spark 正是這一系列工作的成果,如今它已成為 Meta AI 的核心驅動力。」


Alexandr Wang 還表示,這是 Meta 迄今發布的最強模型,并具備工具調用、視覺思維鏈(visual chain of thought)以及多智能體協同(multi-agent orchestration)能力。他還透露,這將成為全新 Muse 模型家族的起點。

趙晟佳、Jason Wei等從OpenAI跳槽到Meta的大牛們,也開始「帶貨」新模型。



不過這也引發了外界對于 Meta 現有明星產品線,Llama 系列未來走向的諸多猜測。

Muse Spark 的定位,并非一個通用聊天機器人,而是構建所謂個人超級智能的基礎。按照 Wang 的說法,這類 AI 不只是處理文本,而是能夠看見并理解你周圍的世界,從而成為個體能力的數字延伸。這一愿景,與扎克伯格在 2025 年夏天公開提出的個人超級智能宣言形成呼應。

Muse Spark 目前暫時僅限于在 Meta AI 應用和網站中使用,并通過面向部分用戶開放的私有 API 預覽提供訪問。此外,目前 Meta 也尚未公布該模型的定價信息。至于 Meta 是否已經完全停止 Llama 系列的后續開發,目前仍不明確。

Muse Spark 性能

Muse Spark 在多模態感知、推理、醫療相關任務以及各類 agent 任務上表現出具有競爭力的能力。


Meta 還發布了 Contemplating(深度思考)模式,該模式可以調度多個 agent 并行推理。這使得 Muse Spark 能夠在推理能力上,對標諸如 Gemini Deep Think 和 GPT Pro 等前沿模型的高強度推理模式。

這一點在評測指標上可以看出來。在 Contemplating 模式下,Muse Spark 在 Humanity’s Last Exam 測試中達到了 58%,在 FrontierScience Research 測試中達到了 38%。


Muse Spark 現已上線,Contemplating(深度思考)模式將會在 meta.ai 中逐步推出。

應用場景

Muse Spark 被視為 Meta 邁向個人超級智能的第一步,一種能夠理解用戶所處環境的 AI。從分析周圍場景到輔助健康管理,其更強的推理能力被認為可以支撐一系列高度個性化的應用場景。

多模態能力

從設計之初,Muse Spark 就強調跨領域、跨工具整合視覺信息。在視覺類 STEM 問題、實體識別和空間定位等任務上展現出較強能力。這些能力被整合后,可以支持更具交互性的應用,例如生成簡單小游戲,或通過動態標注幫助用戶排查家中設備問題。

健康領域

在健康場景中,Meta 將個人超級智能視為重要落地方向之一。據介紹,其與超過 1000 名醫生合作構建訓練數據,以提升模型在健康推理方面的準確性和完整性?;谶@些能力,Muse Spark 可以生成交互式內容,用于解釋健康信息,例如食物的營養結構或運動過程中涉及的肌肉群等。

示例展示


提示:我是一名魚素者,且膽固醇偏高。請在推薦的食物上標記綠點,在不推薦的食物上標記紅點。請勿重復標記,并確保圓點的位置準確無誤。當鼠標懸停在圓點上時,請顯示個性化的推薦理由、滿分 10 分的健康評分,以及該食物的熱量、碳水化合物、蛋白質和脂肪含量。健康評分的數值應直接顯示在圓點正上方,無需懸停即可見。懸停時顯示的詳細說明文字,應置于所有其他圓點的上方。


提示:針對這兩張圖片,請分別指出正在拉伸的肌肉部位及其難度等級。當鼠標懸停在圓點上時,請提供關于該肌群的詳細信息,并指導我如何糾正動作姿勢。我希望能提升自己的瑜伽水平。請將我和我的伙伴的圖像并排展示,并分別以 1 到 10 的分數對我們兩人的表現進行評分。

提示:你能把這個變成一個可以在網頁上玩的數獨游戲嗎?


提示:識別咖啡機和磨豆機的關鍵組件,并制作一個交互式教程,通過簡單的網頁演示如何使用該設備制作拿鐵咖啡;當鼠標懸停在操作步驟上時,網頁將高亮顯示對應組件的邊界框。

擴展維度(Scaling Axes)

為了實現個人超級智能,模型能力需要以可預測且高效的方式持續擴展。為此,Meta 從三個維度對 Muse Spark 的規?;芰M行研究與跟蹤:預訓練、強化學習,以及測試時推理。

預訓練(Pretraining)

預訓練階段,是 Muse Spark 獲取核心能力的基礎,包括多模態理解、推理以及編程能力,這些能力也為后續的強化學習和測試時計算提供支撐。

在過去九個月中,團隊對預訓練體系進行了全面重構,涵蓋模型架構、優化方法以及數據構建等多個方面。這些改進共同提升了單位算力所能釋放的模型能力。

為了更嚴格地評估這一新體系,團隊通過一系列小模型擬合了擴展定律(scaling law),并對比了在達到同等性能水平時所需的訓練 FLOPs。結果顯示:與此前的 Llama 4 Maverick 相比,現在可以用超過一個數量級更少的算力,達到相同能力水平。這一提升也使 Muse Spark 在效率上顯著領先于當前可對比的主流基礎模型。


強化學習

在完成預訓練之后,強化學習(RL)通過進一步投入算力,持續放大模型能力。盡管大規模 RL 一直以來都容易出現不穩定問題,但在新的技術體系下,模型表現出平穩且可預測的提升。

相關結果顯示,隨著 RL 計算量(以訓練步數衡量)的增加,Muse Spark 的能力持續增強。左圖中可以看到,在訓練數據上,pass@1 和 pass@16(即 16 次嘗試中至少成功一次)的指標呈現對數線性增長,這表明 RL 在提升模型可靠性的同時,并沒有削弱其推理多樣性。

右圖則顯示,在獨立的測試集上,準確率同樣穩步提升,這說明 RL 帶來的能力提升具備良好的泛化性:即使是訓練中未見過的任務,Muse Spark 的表現也在持續改善。


測試時推理(Test-Time Reasoning)

強化學習(RL)讓模型在給出答案之前先思考,這一過程被稱為測試時推理。要將這種能力服務于數十億用戶,關鍵在于高效使用推理 tokens。為此,Meta 主要依賴兩個核心手段:一是通過思考時間懲罰來優化 token 使用效率,二是通過多智能體協同,在不顯著增加響應時間的情況下提升性能。

為了實現每個 token 帶來更多智能,其 RL 訓練目標是在引入思考時間懲罰的前提下最大化正確率。在 AIME 等部分評測中,這一機制會引發一種相變現象:模型最初通過延長思考時間來提升表現,但隨著長度懲罰的引入,開始壓縮推理過程,Muse Spark 能用更少的 tokens 完成同樣的問題求解。

在完成壓縮之后,模型又會適度延展推理過程,以進一步提升整體表現,實現效率與性能之間的動態平衡。


為了在不顯著增加延遲的情況下投入更多測試時推理計算,可以通過增加并行協作的 agent 數量來解決復雜問題。下圖展示了這一方法的優勢:相比傳統測試時擴展(讓單個 agent 思考更久),通過多 agent 協同推理來擴展 Muse Spark,可以在保持相近響應速度的同時,實現更優的性能表現。


https://ai.meta.com/blog/introducing-muse-spark-msl/

https://venturebeat.com/technology/goodbye-llama-meta-launches-new-proprietary-ai-model-muse-spark-first-since

閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”


未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

(加入未來知識庫,全部資料免費閱讀和下載)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
5月,遇到這菜別手軟,一次囤20斤,隨手一泡,從夏吃到冬,好吃

5月,遇到這菜別手軟,一次囤20斤,隨手一泡,從夏吃到冬,好吃

阿龍美食記
2026-05-16 16:38:28
專家:廣西柳州5.2級地震系逆沖型破裂

專家:廣西柳州5.2級地震系逆沖型破裂

中國青年報
2026-05-18 21:09:10
當年拳打蘋果腳踢三星的HTC,為何一夜消失了?

當年拳打蘋果腳踢三星的HTC,為何一夜消失了?

強大氣場的注視
2026-05-14 17:04:54
貝森特想擺譜,進大會堂時,不戴胸標,結果被攔下,現場略顯窘迫

貝森特想擺譜,進大會堂時,不戴胸標,結果被攔下,現場略顯窘迫

魔都姐姐雜談
2026-05-18 12:34:03
4年1.8億美元!里弗斯被哄搶,湖人面臨重組,東契奇或成最大贏家

4年1.8億美元!里弗斯被哄搶,湖人面臨重組,東契奇或成最大贏家

兵哥籃球故事
2026-05-18 20:13:17
巴西足壇內馬爾丑聞!安切洛蒂名單公布前夕因失誤被換下,遭遇羞辱

巴西足壇內馬爾丑聞!安切洛蒂名單公布前夕因失誤被換下,遭遇羞辱

綠茵情報局
2026-05-18 02:00:55
自廢武功!盧偉出現了3個錯誤,坑慘了上海隊

自廢武功!盧偉出現了3個錯誤,坑慘了上海隊

體育哲人
2026-05-18 10:42:03
高管集體降薪! 江淮汽車被大眾“拖垮”:季度又虧6億,全靠華為200萬“救命車”?

高管集體降薪! 江淮汽車被大眾“拖垮”:季度又虧6億,全靠華為200萬“救命車”?

新浪財經
2026-05-18 17:36:36
暴漲17倍,上市14個交易日登頂A股一哥位置,這只新股為何這么狂

暴漲17倍,上市14個交易日登頂A股一哥位置,這只新股為何這么狂

丁丁鯉史紀
2026-05-18 14:56:17
全職爸爸靠帥臉火了,全網卻為他的“豪門婚姻”吵翻了

全職爸爸靠帥臉火了,全網卻為他的“豪門婚姻”吵翻了

媽咪OK
2026-05-08 19:54:01
他接受紀律審查和監察調查

他接受紀律審查和監察調查

錫望
2026-05-18 11:57:24
廣西柳州5.2級地震已致3人失聯,房屋倒塌13棟,市民回憶驚險瞬間:轟隆一下就塌了

廣西柳州5.2級地震已致3人失聯,房屋倒塌13棟,市民回憶驚險瞬間:轟隆一下就塌了

大風新聞
2026-05-18 08:35:02
柳州為何會發生5.2級地震?未來會不會發生5級以上地震?專家:當地具備中等地震構造背景,但不具備巨大地震構造條件

柳州為何會發生5.2級地震?未來會不會發生5級以上地震?專家:當地具備中等地震構造背景,但不具備巨大地震構造條件

極目新聞
2026-05-18 11:04:26
后臺最硬女神探,遇到破不了的案,直接冤枉路人死刑!

后臺最硬女神探,遇到破不了的案,直接冤枉路人死刑!

莫地方
2026-05-16 01:40:03
主角劉浩存登場,卻再看不到小白鞋、八一和黑娃,秦海璐也掛機了

主角劉浩存登場,卻再看不到小白鞋、八一和黑娃,秦海璐也掛機了

我來我看見
2026-05-17 20:05:14
特朗普連發15張圖分享“中國記憶”,“不可思議的中國”依然刷屏

特朗普連發15張圖分享“中國記憶”,“不可思議的中國”依然刷屏

軍武咖
2026-05-18 19:01:46
這才是頂薪球員應有的水準!騎士后場到了核心能否繼續保持效率?

這才是頂薪球員應有的水準!騎士后場到了核心能否繼續保持效率?

稻谷與小麥
2026-05-18 22:42:35
為什么歐美人不炒菜,只有中國有?美國教授:中國活在原始時代

為什么歐美人不炒菜,只有中國有?美國教授:中國活在原始時代

抽象派大師
2026-05-17 02:08:19
孩子展廳誤踩電視賠五百,家長堅稱無責是小米故意埋雷

孩子展廳誤踩電視賠五百,家長堅稱無責是小米故意埋雷

映射生活的身影
2026-05-17 21:17:42
雪上加霜!深圳隊2米19主力中鋒意外重傷

雪上加霜!深圳隊2米19主力中鋒意外重傷

體育哲人
2026-05-18 20:46:17
2026-05-18 22:55:00
人工智能學家 incentive-icons
人工智能學家
人工智能領域權威媒體
4744文章數 37464關注度
往期回顧 全部

科技要聞

同一公司,有人獎金是6年工資,我卻只有半年

頭條要聞

伊朗披露穆杰塔巴受傷細節:未導致面容損毀或肢體傷殘

頭條要聞

伊朗披露穆杰塔巴受傷細節:未導致面容損毀或肢體傷殘

體育要聞

58順位的保羅,最強第三中鋒

娛樂要聞

票房會破14億!口碑第一電影出現了

財經要聞

中國芯片,怎么突然不便宜了?

汽車要聞

歸元S平臺首款車型 魏牌V9X上市 34.98萬元起

態度原創

教育
健康
時尚
房產
軍事航空

教育要聞

一所京城學校,能提供的“天花板資源”,是什么樣的?

專家揭秘干細胞回輸的安全風險

戛納電影節|61歲鞏俐驚艷世界,她活出了所有女人都想成為的樣子

房產要聞

突發!??谥匕跽{規!碧桂園要解套;新埠島要起飛了!

軍事要聞

莫斯科遭一年多來最大規模無人機襲擊 3死18傷

無障礙瀏覽 進入關懷版