網易首頁 > 網易號 > 正文 申請入駐

阿里開源"小鋼炮":30億參數干翻270億

0
分享至

「用3B激活參數,做出別人27B的活。」這是阿里千問團隊給Qwen3.6-35B-A3B的定調。4月16日,這款混合專家(MoE,Mixture-of-Experts)模型開源,總參數量350億,但每次只叫醒30億干活——稀疏架構的精髓就在這兒。

IT之家注意到,官方把"智能體編程能力"放在C位宣傳。這不是隨便找個賣點,而是精準戳中了開發者痛點:本地跑不動大模型,API調用又燒錢,中間地帶長期空白。


一張圖看懂:為什么3B能頂27B

MoE架構的核心 trick(技巧)是"按需喚醒"。350億參數像一支龐大的專家庫,面對具體任務時,路由網絡只挑選最相關的30億參數參與計算。這相當于讓一位全科大夫坐診,背后站著各科室專家團——病人描述癥狀,系統自動搖來對應科室。

對比傳統稠密模型(Dense Model),后者每次推理必須調動全部參數,就像不管感冒還是骨折,全院醫生集體出診。Qwen3.5-27B就是這種"全家桶"模式,27億參數一個不落。

結果很打臉:Qwen3.6-35B-A3B在多項編程基準上反超了這位"全家桶"前輩。更騷的是,它還大幅超越了自家前代Qwen3.5-35B-A3B——同樣是MoE,同樣是35B總參/3B激活,代際提升肉眼可見。

具體能干什么?官方列了三個集成場景:

? OpenClaw(原Moltbot/Clawdbot):可自托管的開源AI編碼智能體,接上百煉API就能在終端跑完整工作流

? Qwen Code:阿里自家終端智能體,對千問系列深度優化

? Claude Code:通過兼容Anthropic API協議,蹭上Claude的生態

一個模型同時打通三條鏈路,野心不小。

多模態這塊,Claude Sonnet 4.5成了背景板

Qwen3.6系列原生支持多模態,35B-A3B版本把這項能力完整繼承。官方benchmark顯示,在大多數視覺語言任務上,它已經和Claude Sonnet 4.5打平,部分任務反超。

空間智能是亮點:RefCOCO得分92.0,ODInW13得分50.8。這兩個指標測的是"看圖指物"的精準度——給張室內照片,模型能準確標出"沙發左邊第三個靠墊"那種。

這對機器人、AR導航、智能倉儲是剛需。以前這類能力集中在閉源大模型里,現在30億激活參數就能開箱即用,成本曲線陡然下壓。

更隱蔽的升級是preserve_thinking功能:在多輪對話中保留完整思維鏈。做智能體任務時,這相當于給模型配了個"工作備忘錄",前后文不丟失,推理連貫性大幅提升。

開源策略:把"輕量化"做成護城河

阿里這次 release(發布)的路徑很清晰:Hugging Face和ModelScope同步放權重,Qwen Studio即時可玩,阿里云百煉API以qwen3.6-flash名稱上線。三條通道覆蓋本地部署、云端調用、快速體驗全場景。

API層面同時兼容OpenAI和Anthropic協議,這是老練的生態卡位。開發者不用改代碼,直接平替——降低遷移成本,就是提高 adoption(采用率)。

但真正的棋眼在"規模"二字。35B總參/3B激活這個檔位,恰好踩在本地部署的甜蜜點上:

? 消費級顯卡能跑(顯存壓力可控)

? 性能又不至于太寒酸(編程、多模態都能打)

? 企業私有化部署成本可接受

對比一下:Qwen3.5-27B稠密模型,本地跑起來費勁;更大的閉源模型,API賬單嚇人。35B-A3B卡在中間,像一把精準的手術刀。

阿里官方說,這是"該規模下模型能力的新標桿"。翻譯一下:在這個參數檔位,暫時沒人能打得過。

開發者現在能做什么

如果你屬于這幾類人,建議直接上手:

第一,在找本地編程助手的個人開發者。OpenClaw+Qwen3.6-35B-A3B的組合,終端體驗已經逼近云端大模型,且數據不出本機。

第二,做多模態應用的產品團隊。空間智能能力開源可用,AR導航、視覺客服、工業質檢等場景值得重新評估技術棧。

第三,受限于API預算的初創公司。百煉的qwen3.6-flash定價策略尚未公布,但參考MoE架構的推理成本優勢,大概率比同能力稠密模型便宜一個數量級。

具體入口:Qwen Studio(chat.qwen.ai)即時體驗,Hugging Face/ModelScope下載權重,百煉API文檔查集成細節。技術博客有OpenClaw、Qwen Code、Claude Code的詳細對接腳本。

一個值得關注的細節:官方把"智能體編程"而非"通用對話"作為首要賣點。這說明千問團隊的產品判斷是——大模型競爭已從"誰能聊天"轉向"誰能干活"。代碼生成、工具調用、多步任務執行,這些硬核能力才是下一階段的差異化戰場。

30億激活參數做到這個程度,MoE架構的工程優化空間可能還遠未觸頂。阿里預告Qwen3.6開源家族將持續擴展,下一個 release 會不會把激活參數壓到1B級別、同時保持同等能力?這不是沒有可能。

對開發者來說,現在最務實的動作是:把Qwen3.6-35B-A3B接進你的工作流,測測它在你具體場景下的表現。benchmark是別人的,latency(延遲)和準確率是自己的。開源模型的價值,終究要在代碼里兌現。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
主場崩盤!國安2-4完敗津門虎,賽后蒙哥馬利怒批球員無心應戰!

主場崩盤!國安2-4完敗津門虎,賽后蒙哥馬利怒批球員無心應戰!

田先生籃球
2026-04-25 22:47:44
體育局正式宣布,陳夢走馬上任

體育局正式宣布,陳夢走馬上任

最愛乒乓球
2026-04-26 00:04:52
世界羽聯會員大會投票通過“15分制”改革,將于2027年實行

世界羽聯會員大會投票通過“15分制”改革,將于2027年實行

懂球帝
2026-04-25 22:23:26
悲催!37歲名牌大學畢業、年薪30萬女醫生被技術男嫌棄,當場崩潰

悲催!37歲名牌大學畢業、年薪30萬女醫生被技術男嫌棄,當場崩潰

火山詩話
2026-04-24 06:14:58
怒了!國安球迷:蒙哥馬利下課,知道大廠為何35歲以上的不要了吧

怒了!國安球迷:蒙哥馬利下課,知道大廠為何35歲以上的不要了吧

足球大腕
2026-04-25 23:21:55
記者:賽后于根偉臉上沒有任何高興表情,因為比賽太慘烈了

記者:賽后于根偉臉上沒有任何高興表情,因為比賽太慘烈了

懂球帝
2026-04-25 23:05:02
別再為華晨宇的眼淚買單!一個舞臺搞得像祭壇,不但要拆還要深挖

別再為華晨宇的眼淚買單!一個舞臺搞得像祭壇,不但要拆還要深挖

小娛樂悠悠
2026-04-25 11:46:19
伊朗用血淚給中國換來了教訓:最大的敵人,并不是美國和以色列

伊朗用血淚給中國換來了教訓:最大的敵人,并不是美國和以色列

墨印齋
2026-04-23 15:42:00
世界冠軍1球不進!80后名將12-9奪賽點,羅伯遜3-1逆轉韋克林!

世界冠軍1球不進!80后名將12-9奪賽點,羅伯遜3-1逆轉韋克林!

劉姚堯的文字城堡
2026-04-25 19:23:27
國安球迷意難平!不止因為2-4完敗津門虎,更多在于以下這五點!

國安球迷意難平!不止因為2-4完敗津門虎,更多在于以下這五點!

田先生籃球
2026-04-25 21:59:33
上海樓市,開始變得離譜了

上海樓市,開始變得離譜了

暮色史觀
2026-04-26 01:43:49
楊威雙胞胎女兒太爭氣,9歲同臺拿下全國冠軍+季軍,體操最強二代

楊威雙胞胎女兒太爭氣,9歲同臺拿下全國冠軍+季軍,體操最強二代

觀魚聽雨
2026-04-25 23:23:30
泡泡瑪特:4月30日發售兩款Labubu冰箱,售價5999元,每款全球限量發售999臺

泡泡瑪特:4月30日發售兩款Labubu冰箱,售價5999元,每款全球限量發售999臺

魯中晨報
2026-04-24 20:08:07
WWE性感女星“3P”錄像泄露 最新回應:非常崩潰!

WWE性感女星“3P”錄像泄露 最新回應:非常崩潰!

手工制作阿殲
2026-04-25 17:56:15
CBA冰火兩重天:廣東獨享5000萬盈利,19隊深陷虧損泥潭!

CBA冰火兩重天:廣東獨享5000萬盈利,19隊深陷虧損泥潭!

去山野間追風
2026-04-26 02:45:20
四川省第一大鎮,沒有爭議

四川省第一大鎮,沒有爭議

石辰搞笑日常
2026-04-24 13:27:13
爆冷!東部第一再輸一局,魔術醞釀黑八,康寧漢姆9失誤無緣逆轉

爆冷!東部第一再輸一局,魔術醞釀黑八,康寧漢姆9失誤無緣逆轉

老梁體育漫談
2026-04-26 04:05:16
美國一查中國家底才發現不得了,難怪中國人的底氣這么足

美國一查中國家底才發現不得了,難怪中國人的底氣這么足

混沌錄
2026-04-25 15:28:07
遼、吉兩省發布聯合通告

遼、吉兩省發布聯合通告

吉刻新聞
2026-04-25 10:43:19
日方強闖臺海不到48小時,日本民眾包圍國會,要求高市下臺

日方強闖臺海不到48小時,日本民眾包圍國會,要求高市下臺

兵說
2026-04-24 08:30:07
2026-04-26 07:03:00
我是一個粉刷匠2
我是一個粉刷匠2
有態度網友ytd
1723文章數 27關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

頭條要聞

媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

時尚
藝術
家居
數碼
旅游

這些穿搭適合春天!外套彩色內搭白色、褲子穿基礎款,舒適大方

藝術要聞

毛澤東寫小字,太瀟灑了

家居要聞

自然肌理 溫潤美學

數碼要聞

聯發科亮相2026北京車展:主動式智能體座艙解決方案

旅游要聞

美猴王VS水蜜桃,連云港、無錫文旅“雙向奔赴”

無障礙瀏覽 進入關懷版