Google DeepMind剛?cè)酉乱幻墩◤棥emma 4全家桶開(kāi)源,Apache 2.0協(xié)議,最狠的是那個(gè)31B的密集模型——跑分直接碾壓比自己大20倍的對(duì)手。
這事的核心矛盾很尖銳:云端的AI越來(lái)越強(qiáng),但本地部署一直是個(gè)笑話。現(xiàn)在Google說(shuō),不用選了,筆記本和手機(jī)就能跑前沿模型。這不是技術(shù)迭代,是游戲規(guī)則重寫(xiě)。
![]()
先看清牌面。Gemma 4不是單卡出牌,是四張牌覆蓋全場(chǎng)景:
E2B(20億有效參數(shù)):總參數(shù)量5.1B,壓縮后內(nèi)存不到1.5GB,128K上下文,帶音頻編碼器。手機(jī)、IoT設(shè)備塞進(jìn)去無(wú)壓力。
E4B(45億有效參數(shù)):總參數(shù)量8B,同樣128K上下文。旗艦手機(jī)和MacBook的甜點(diǎn)區(qū),開(kāi)發(fā)者首選。
26B A4B(混合專家架構(gòu)):總參數(shù)量25.2B,但每次只激活約4B。128個(gè)小專家里選8個(gè)路由專家加1個(gè)共享專家,用12%的算力干出密集31B模型97%的質(zhì)量。256K上下文,企業(yè)級(jí)成本敏感場(chǎng)景的王牌。
31B Dense(密集模型):純血31B參數(shù),256K上下文,需要18-24GB內(nèi)存。推理能力的極限選項(xiàng)。
數(shù)字說(shuō)話最硬。Gemma 4 31B在Artificial Analysis Intelligence Index拿39分,比Gemma 3 27B的10分暴漲29分。具體拆解:
數(shù)學(xué)推理(AIME 2026):20.8% → 89.2%,4倍提升。
代碼能力(LiveCodeBench):29.1% → 80.0%,接近3倍。
研究生級(jí)科學(xué)(GPQA Diamond):直接翻倍到84.3%。
智能體工作流(T2-Bench):6.6% → 86.4%,13倍躍遷。
最刺耳的對(duì)比:31B模型在多項(xiàng)基準(zhǔn)上擊敗Qwen3.5-397B和DeepSeek v3.2-671B。參數(shù)差一個(gè)數(shù)量級(jí),結(jié)果倒過(guò)來(lái)。本地部署的算力賬,從此要重新算。
Google押注的是一條清晰的路徑——把前沿AI從服務(wù)器機(jī)房搬到邊緣設(shè)備,不閹割能力。Apache 2.0協(xié)議意味著沒(méi)有商用限制,沒(méi)有API按token計(jì)費(fèi)的黑箱。私有、可控、主權(quán)化的AI,從口號(hào)變成可執(zhí)行方案。
問(wèn)題已經(jīng)變了。不再是"本地能不能跑大模型",而是"你要造什么"。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.