網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Gemma 4發(fā)布：31B模型干翻400B，本地AI時(shí)代來(lái)了

2026-05-25 02:21:21　來(lái)源: 硬核玩家2哈

北京舉報(bào)

分享至

Google DeepMind剛?cè)酉乱幻墩◤棥emma 4全家桶開(kāi)源，Apache 2.0協(xié)議，最狠的是那個(gè)31B的密集模型——跑分直接碾壓比自己大20倍的對(duì)手。

這事的核心矛盾很尖銳：云端的AI越來(lái)越強(qiáng)，但本地部署一直是個(gè)笑話。現(xiàn)在Google說(shuō)，不用選了，筆記本和手機(jī)就能跑前沿模型。這不是技術(shù)迭代，是游戲規(guī)則重寫(xiě)。

先看清牌面。Gemma 4不是單卡出牌，是四張牌覆蓋全場(chǎng)景：

E2B（20億有效參數(shù)）：總參數(shù)量5.1B，壓縮后內(nèi)存不到1.5GB，128K上下文，帶音頻編碼器。手機(jī)、IoT設(shè)備塞進(jìn)去無(wú)壓力。

E4B（45億有效參數(shù)）：總參數(shù)量8B，同樣128K上下文。旗艦手機(jī)和MacBook的甜點(diǎn)區(qū)，開(kāi)發(fā)者首選。

26B A4B（混合專家架構(gòu)）：總參數(shù)量25.2B，但每次只激活約4B。128個(gè)小專家里選8個(gè)路由專家加1個(gè)共享專家，用12%的算力干出密集31B模型97%的質(zhì)量。256K上下文，企業(yè)級(jí)成本敏感場(chǎng)景的王牌。

31B Dense（密集模型）：純血31B參數(shù)，256K上下文，需要18-24GB內(nèi)存。推理能力的極限選項(xiàng)。

數(shù)字說(shuō)話最硬。Gemma 4 31B在Artificial Analysis Intelligence Index拿39分，比Gemma 3 27B的10分暴漲29分。具體拆解：

數(shù)學(xué)推理（AIME 2026）：20.8% → 89.2%，4倍提升。
代碼能力（LiveCodeBench）：29.1% → 80.0%，接近3倍。
研究生級(jí)科學(xué)（GPQA Diamond）：直接翻倍到84.3%。
智能體工作流（T2-Bench）：6.6% → 86.4%，13倍躍遷。

最刺耳的對(duì)比：31B模型在多項(xiàng)基準(zhǔn)上擊敗Qwen3.5-397B和DeepSeek v3.2-671B。參數(shù)差一個(gè)數(shù)量級(jí)，結(jié)果倒過(guò)來(lái)。本地部署的算力賬，從此要重新算。

Google押注的是一條清晰的路徑——把前沿AI從服務(wù)器機(jī)房搬到邊緣設(shè)備，不閹割能力。Apache 2.0協(xié)議意味著沒(méi)有商用限制，沒(méi)有API按token計(jì)費(fèi)的黑箱。私有、可控、主權(quán)化的AI，從口號(hào)變成可執(zhí)行方案。

問(wèn)題已經(jīng)變了。不再是"本地能不能跑大模型"，而是"你要造什么"。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.