網易首頁 > 網易號 > 正文 申請入駐

“參數王者、開源期貨”,Meta這波Llama 4贏了嗎?

0
分享至

1000萬上下文?2萬億參數?MoE混合架構,原生多模態。清明假期,你是否也被Meta這波Llama 4系列模型發布后,各種酷炫數據和名詞炸醒?

曾經的開源領袖,實際已經被DeepSeek搶了各種風頭。萬眾期待的Llama 4模型,原本使命是超越GPT和Claude等閉源模型,吊打一切的存在,然后呢?實現了嗎?

Llama 4系列模型發布:

Llama 4 Scout(?。?/strong>

單張H100 GPU可運行,適合本地部署,支持1000萬token上下文,這是行業最牛成績。

Llama 4 Maverick(中)

總參數高達4000億,但推理時僅激活部分專家,效率更高

多模態性能超越GPT-4o,在ChartQA、DocVQA等基準測試中領先,編程能力媲美DeepSeek v3,但參數僅一半。

Llama 4 Behemoth(大,預覽版)

Meta 2萬億參數巨獸,仍在訓練中。

超大參數,據說STEM任務超越GPT-4.5、Claude3.7等。

將作為“教師模型”,用于蒸餾優化更小的Llama 4模型。

測評分數高居全球第二

Llama 4 Maverick 目前在 LM Arena 排行榜 上排名第二,僅次于 Gemini 2.5 Pro。

而且具備原生多模態能力:Llama 4采用了早期融合(Early Fusion)技術,可以用海量的無標簽文本、圖片和視頻數據一起來預訓練模型。

超長上下文

Scout 版本支持1000萬 tokens(約15000頁文本!),醫學、科研、代碼分析等超長文檔處理能力直接拉滿。

在其他大模型僅有200萬 tokens上下長度時,小扎掏出了大炸雷,不想和大家閑聊。

幾個核心技術

MoE架構效率炸裂:

Llama 4開始轉向采用混合專家模型(MoE),推理時僅激活部分參數,成本更低——Maverick 推理成本僅$0.19/百萬token,比GPT-4o便宜90%。

iRoPE實現超長上下文:

iRoPE(交錯旋轉位置編碼)是Meta為Llama 4設計的升級版位置編碼技術。

  • 局部注意力層:用旋轉位置編碼(RoPE)處理短上下文(如8K token),保留位置關系。

  • 全局注意力層:直接去掉位置編碼(NoPE),通過動態調整注意力權重處理超長內容,類似“模糊匹配”長距離關聯。

  • 就像讀書時用書簽(RoPE)標記重點段落,同時靠記憶(NoPE)串聯全書脈絡。

埋葬RAG技術?

相比RAG技術,iRoPE無需依賴外部知識庫檢索,直接通過模型內部自身處理完整信息,減少信息丟失風險,預計未來會成為大模型技術標配,以后大模型容易忘記前文的事情,基本就不會出現了。

開源但有限制:商用需遵守 Meta 政策,月活超7億的公司需額外授權,且產品名必須帶“Llama”。

鯨哥在Together AI上體驗 了Llama 4 Scout,并沒有什么特別的強悍之處,DeepSeek對比之下體感還是強很多。Llama 4有點像Google,“參數沒輸過,實戰沒贏過”。

一句話總結:Meta 這次把開源AI卷到新高度,多模態+長上下文+超低成本,Llama 4 可能是目前最香的開源大模型之一。

但下周OpenAI o3和Claude等新模型發布, Llama 4估計又會被奪走注意力。只能說模型競爭,太卷了,Llama 4要成千年追趕者了。

視頻內容推薦:

主理人交流:

加入AI鯨英社群,和上千CEO、投資人和行業大牛一起共話未來!

前百度大佬“放下”AI搜索,轉做Agent瀏覽器,評分超越Manus

這些職業正在被摧毀:實測10個GPT-4o繪圖最火的案例

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
7499元,新機官宣:4月24日,全渠道首銷!

7499元,新機官宣:4月24日,全渠道首銷!

科技堡壘
2026-04-24 09:54:10
亨德利:艾倫這種打法拿不了冠軍!艾倫回懟:他的固執付出了代價

亨德利:艾倫這種打法拿不了冠軍!艾倫回懟:他的固執付出了代價

求球不落諦
2026-04-26 11:10:51
擴散周知!5月1日嚴查煙草,家里有人抽煙的快看看!

擴散周知!5月1日嚴查煙草,家里有人抽煙的快看看!

王姐懶人家常菜
2026-04-26 15:32:03
廣東隊將會賺得盆滿缽滿!

廣東隊將會賺得盆滿缽滿!

體育哲人
2026-04-26 08:30:08
19歲小伙連吃幾天小龍蝦,劇烈頭痛、行走困難!確診為“橫紋肌溶解癥”

19歲小伙連吃幾天小龍蝦,劇烈頭痛、行走困難!確診為“橫紋肌溶解癥”

環球網資訊
2026-04-26 07:43:11
八部門重磅新規落地!禁止支付與信貸捆綁,白條、月付等面臨重大調整,用戶終于不用擔心“被動開通貸款”

八部門重磅新規落地!禁止支付與信貸捆綁,白條、月付等面臨重大調整,用戶終于不用擔心“被動開通貸款”

每日經濟新聞
2026-04-26 16:29:02
中甲大洗牌!廣州豹閃電雙殺亞泰,南通支云不敗金身火得發燙!

中甲大洗牌!廣州豹閃電雙殺亞泰,南通支云不敗金身火得發燙!

阿晞體育
2026-04-26 22:37:15
浪姐二公淘汰爆了熱搜!齊思昀表情被審判!謝娜手肘硬撞示意

浪姐二公淘汰爆了熱搜!齊思昀表情被審判!謝娜手肘硬撞示意

一盅情懷
2026-04-26 19:31:01
“把孩子當力工培養呢?”一份中學生高碳水午餐,讓家長被群嘲

“把孩子當力工培養呢?”一份中學生高碳水午餐,讓家長被群嘲

妍妍教育日記
2026-04-21 09:05:03
1995年,在香港高檔餐廳里,34歲的洪晃與63歲的父親洪君彥的合影

1995年,在香港高檔餐廳里,34歲的洪晃與63歲的父親洪君彥的合影

娛樂洞察點點
2026-04-25 21:55:38
此論調不可?。赫麄€北約打不過俄羅斯?把德國逼下場會讓俄軍絕望

此論調不可?。赫麄€北約打不過俄羅斯?把德國逼下場會讓俄軍絕望

寰球經緯所
2026-04-24 15:00:27
睡遍好萊塢的種馬影帝:性欲成癮每天與情人交歡,私生子多達25人

睡遍好萊塢的種馬影帝:性欲成癮每天與情人交歡,私生子多達25人

錢小刀娛樂
2026-04-15 21:30:57
為啥納指創新高了,納指基金卻沒新高?

為啥納指創新高了,納指基金卻沒新高?

平點金基
2026-04-26 18:19:26
“明天下雨,面試能改天嗎”:角色定位不清,是成年人最大的災難

“明天下雨,面試能改天嗎”:角色定位不清,是成年人最大的災難

精讀君
2026-04-24 09:00:18
0-1!李金羽太難了!鐵人3連敗+4輪不勝,新鵬城贏球緊咬申花泰山

0-1!李金羽太難了!鐵人3連敗+4輪不勝,新鵬城贏球緊咬申花泰山

阿晞體育
2026-04-26 22:42:18
CBA官宣最具進步球員獎:徐昕換隊爆發當選 5數據創生涯新高

CBA官宣最具進步球員獎:徐昕換隊爆發當選 5數據創生涯新高

醉臥浮生
2026-04-26 19:06:40
僅播4集就口碑大爆,評分高達9.5,這才是黑馬古裝劇該有的樣子

僅播4集就口碑大爆,評分高達9.5,這才是黑馬古裝劇該有的樣子

糊咖娛樂
2026-04-25 16:58:09
挪威人午餐只吃一片三明治?跟拍同事飯盒一個月,我驚了!

挪威人午餐只吃一片三明治?跟拍同事飯盒一個月,我驚了!

老好人的憤怒
2026-03-24 23:24:57
大便要排隊,強奸卻隨時:一名日本女戰俘的1944年日記

大便要排隊,強奸卻隨時:一名日本女戰俘的1944年日記

英子談
2026-04-26 15:56:57
中超大黑馬8場不?。号琶?,鄭智又搞砸了:5場不勝太差勁

中超大黑馬8場不敗:排名第2,鄭智又搞砸了:5場不勝太差勁

足球狗說
2026-04-26 20:56:31
2026-04-26 23:11:00
鯨選AI incentive-icons
鯨選AI
最新AI產品化與商業化案例速遞
152文章數 38關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

以色列政壇重大變局 內塔尼亞胡迎來勁敵

頭條要聞

以色列政壇重大變局 內塔尼亞胡迎來勁敵

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

事關新就業群體,中辦、國辦發文

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

本地
家居
手機
房產
公開課

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

家居要聞

自然肌理 溫潤美學

手機要聞

鴻蒙6,玻璃,光,和我

房產要聞

新一輪教育大爆發來了!???,開始瘋狂建學校!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版