網易首頁 > 網易號 > 正文 申請入駐

馬云押寶成功,阿里新模型驚動馬斯克

0
分享至

阿里又發模型了。

昨晚,通義千問團隊在X上公布了Qwen3.5小模型系列,一共四個尺寸:0.8B、2B、4B、9B。

發完沒多久,馬斯克突然出現在評論區,毫不吝嗇地留下一句“Impressive intelligence density(令人印象深刻的智能密度)”



圖源:X

消息傳回國內,很快就有了“馬斯克點贊中國AI”的話題。

可以理解。畢竟馬斯克這個名字,自帶流量。但說實話,如果把注意力全放在“馬斯克點贊”這件事上,反而可能錯過真正有意思的東西。



阿里掀桌,終結參數內卷游戲

先看一個數字。

Qwen3.5-9B,參數量90億,它在GPQA Diamond上的得分是81.7。作為對比,ChatGPT有一個開源模型,參數量1200億,得分差不多。



圖源:X

也就是說,90億參數的模型,和1200億參數的模型,在同一個測試里打成了平手。

十三分之一的體積,差不多的本事。這背后是這兩年AI圈一直在琢磨的一件事:參數規模,到底是不是越大越好?

過去兩年的邏輯很簡單粗暴——誰參數多誰厲害。萬億參數的模型一個接一個往外冒,像重型卡車,馬力確實足,但油耗也驚人。

訓練一次的成本動輒上千萬美元,推理一次的電費都能讓中小公司肉疼。最后變成只有巨頭玩得起的游戲,但這顯然違背了科技發展的初衷。

因此,Qwen3.5走了另一條路。

它在架構上做了個改動:把“門控增量網絡”和“稀疏混合專家”結合起來,前向傳播的時候只激活當前任務需要的部分,不是所有神經元都撲上去。

聽起來有點繞,那我們換一種說法:假設你有一個4000萬冊的圖書館,以前每次查資料,得把整個館翻一遍。但現在有個聰明的檢索系統,只需要調那170萬冊核心藏書,就能答出差不多的答案。

這就是馬斯克說的“智能密度”——不在參數規模上堆料,在有限資源里壓榨出盡可能多的智能。

而這還不是全部。多模態能力的整合方式,藏著另一層門道。

Qwen3.5用的是“早期融合”——文本、圖像、視頻在底層就一起處理了,不像很多模型那樣,先有個文本模型,再在外面掛個視覺編碼器當附件。

這種差別,直接讓0.8B這種迷你模型的表現同樣征服了一眾開發者——它在語言基準MMLU-Pro上只拿到了29.7分,但在視覺任務MathVista上沖到了62.2,OCRBench拿了74.5。

有開發者甚至已經想到了該模型的應用價值,直言:“本地人工智能終于開始變得實用了。”



圖源:X



跑分是起點,場景才是終局

跑分歸跑分。真正讓開發者興奮的,是另一件事。

有人算了一筆賬:現在3萬美元的硬件,就能跑出去年需要20萬美元GPU才有的推理能力。



圖源:X

還有人直接上手演示——在iPhone 17 Pro上,用針對Apple Silicon優化的MLX框架,本地跑Qwen3.5-2B的6-bit版本,實時視覺理解、實時問答,全都跑得動。



圖源:X

這意味著什么?意味著普通人終于能用得起AI了!

意味著你可以不用聯網,不用把需求上傳到誰的云端,就能在自己手機里,有一個能看、能聽、能琢磨事兒的AI。

這背后其實是一個正在發生的轉變。

智能手機時代本質上是“單向輸入”的范式——你對著屏幕戳戳點點,手機給你反饋。

但即將到來的AI硬件浪潮,路子不一樣了。AI廠商們想干的事,是用更碎、更粘的方式,滲透進你的記憶和生活。

比如你戴著一副AI眼鏡走在路上,隨口問一句前面有沒有障礙物。這時候如果AI延遲了五秒才回答,那這功能幾乎就廢了。

而這恰恰是云端大模型繞不過去的物理瓶頸——上傳、計算、返回,再快的網絡也有那點延遲。

端側小模型的價值就在這兒。遇到真需要深度推理的復雜問題,可以扔給云端;但日常的、實時的、隱私敏感的,本地搞定。

阿里已經把Qwen小模型塞進了AI眼鏡這類可穿戴設備里,能做到毫秒級的端側視覺解析。

聽說蘋果那邊也在搗鼓帶攝像頭的AirPods和新一代VR智能眼鏡——這些玩意兒,將來可能就是你的“第二雙眼睛和耳朵”。

工業方面,IoT設備、工廠傳感器、醫療監測終端,這些場景里數據隱私更敏感,本地推理同樣是硬需求。



阿里野心勃勃,模型與硬件并發

事實上,阿里的這一步,邁得比大多數人想象的要大。

3月2日,千問AI眼鏡開啟“0元預約”,G1系列疊加補貼后最低1997元,3月8日現貨發售。

同一天,巴塞羅那MWC展臺上,五米高的“Qwen”標志下,海外觀眾排著隊等試戴。



圖源:巴塞羅那MWC現場

據媒體爆料,有美國用戶試完后給出高度評價——換電設計“太妙了”,續航焦慮明顯降低,“基本可以全天開機使用智能服務”。

而這只是開始。內部人士透露,今年年內,AI指環、AI耳機也會陸續落地,面向全球發售。

你可能想問:阿里做硬件,圖什么?

表面看是跟風——Meta的Ray-Ban眼鏡吃掉了七成市場份額,OpenAI組了兩千人的硬件團隊,字節的眼鏡耳機也在路上。巨頭們都在搶同一個東西:下一個AI入口。

但阿里的打法,跟別人不太一樣。

1月底,平頭哥官網上線了一款叫“真武810E”的AI芯片。

參數上看,性能對標英偉達H20,已經在阿里云部署了多個萬卡集群,服務了國家電網、中科院、小鵬汽車等400多家客戶。更重要的是,它被大規模用于千問大模型的訓練和推理。

芯片亮相的同時,一個叫“通云哥”的黃金三角浮出水面——通義實驗室做模型,阿里云做算力,平頭哥做芯片。

三個東西捏在一起,意味著什么?意味著阿里可以在芯片架構、云平臺架構、模型架構三個層面協同優化,而不是像大多數玩家那樣,拿著英偉達的卡、跑別人的框架、調第三方的模型。

業內有一種說法:全球能做到“大模型+云+芯片”全棧自研的公司,目前只有兩家,一家是谷歌,另一家是阿里。

這個說法含金量高不高另說,但邏輯是通的——端側硬件對成本和功耗極其敏感,如果芯片、模型、云不能深度耦合,體驗上就永遠差一口氣。

千問3.5能把部署顯存占用降低60%、推理吞吐量提升19倍,靠的不只是算法,還有底層硬件的配合。

所以硬件本身,從來不是阿里的目的。

春節期間,用戶在千問APP上“一句話下單”接近2億次,Questmobile數據顯示,千問在春節期間日活沖到7352萬,以940%增幅居國內AI應用首位。

這說明:千問已經從一個聊天機器人,變成了一個能點外賣、訂酒店、打車的國民級AI助手。

現在的問題是,這個助手能不能走出手機屏幕?

當你戴著AI眼鏡路過一家餐廳,掃一眼招牌,說一句“這家評價怎么樣,幫我訂個位”,隨即眼鏡開始識別畫面,調高德的數據,用支付寶完成支付——全程不用掏手機;你在異國街頭看不懂菜單,眼鏡直接在你視野里疊上翻譯;你騎車想記錄路線,對著指環說句話就搞定。

這就是阿里想要的“所見即所得”。它依賴的不只是模型聰明,更是背后那個能觸達數百萬商家、打通支付和出行、覆蓋生活服務全場景的生態。

阿里集團CEO吳泳銘有句話說的很好:AI最大的想象力,不在手機屏幕,而在于如何接管數字世界。

從這個角度看,千問做硬件的邏輯就清晰了——它想做的,是用硬件把阿里的服務網絡,編織到現實世界的每一個節點上。

而讓這一切能夠成為可能的,正是Qwen3.5這批被馬斯克大贊的、幾十億參數的“小東西”。

作者 | 劉峰

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
建國后外逃級別最高的貪官!至今未落網,23年來逃跑方式仍是謎

建國后外逃級別最高的貪官!至今未落網,23年來逃跑方式仍是謎

鐵血江湖人
2026-04-23 22:21:26
嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

阿訊說天下
2026-04-25 11:15:04
阿森納贊助商TCL稱自家電視銷量全球前二,球迷:這很搭呀

阿森納贊助商TCL稱自家電視銷量全球前二,球迷:這很搭呀

懂球帝
2026-04-26 12:03:09
臺媒:毛里求斯表態戳破臺當局謊言

臺媒:毛里求斯表態戳破臺當局謊言

參考消息
2026-04-25 19:55:46
楊威雙胞胎女兒太爭氣,9歲同臺拿下全國冠軍+季軍,體操最強二代

楊威雙胞胎女兒太爭氣,9歲同臺拿下全國冠軍+季軍,體操最強二代

觀魚聽雨
2026-04-25 23:23:30
華誼:靠周星馳狂賺12.48億!卻耍賴8600萬,換來十一年因果報應

華誼:靠周星馳狂賺12.48億!卻耍賴8600萬,換來十一年因果報應

一盅情懷
2026-04-25 16:23:35
止步7強!車手昏迷張雪離場,網友質疑有黑幕,官方回應盡顯格局

止步7強!車手昏迷張雪離場,網友質疑有黑幕,官方回應盡顯格局

南宗歷史
2026-04-26 10:47:38
寶視達回應“鏡片裝反孩子近視暴漲到900度”:出廠交付時不存在鏡片裝反情況,愿退還配鏡費用贈送1000元眼鏡及感謝金

寶視達回應“鏡片裝反孩子近視暴漲到900度”:出廠交付時不存在鏡片裝反情況,愿退還配鏡費用贈送1000元眼鏡及感謝金

極目新聞
2026-04-26 09:13:09
接到陌生電話先問這3個字!騙子聽到馬上掛斷,記得轉告身邊人

接到陌生電話先問這3個字!騙子聽到馬上掛斷,記得轉告身邊人

小談食刻美食
2026-04-25 09:47:09
一張“初三女孩體測”照片,讓家長被數萬網友指責:太不用心了!

一張“初三女孩體測”照片,讓家長被數萬網友指責:太不用心了!

川渝視覺
2026-04-25 20:19:24
北京車展30臺車被搶光,老外排隊求中國造,一臺車蓋要工程師簽名

北京車展30臺車被搶光,老外排隊求中國造,一臺車蓋要工程師簽名

音樂時光的娛樂
2026-04-26 15:12:14
1973年江青私闖毛主席住處,毛主席怒斥:隨便闖,再闖,就抓起來

1973年江青私闖毛主席住處,毛主席怒斥:隨便闖,再闖,就抓起來

南鈦
2026-04-26 09:20:22
性感陰濕男,正在統治內娛

性感陰濕男,正在統治內娛

最人物
2026-04-25 14:56:19
曝克洛普同意入主皇馬!要求清洗 6 大主力,鎖定 3 大王牌

曝克洛普同意入主皇馬!要求清洗 6 大主力,鎖定 3 大王牌

奶蓋熊本熊
2026-04-26 01:07:27
恒大集團與特朗普合作往事

恒大集團與特朗普合作往事

地產微資訊
2026-04-24 18:09:33
猛降14℃!暴雨大暴雨、冰雹、雷暴大風馬上到湖北

猛降14℃!暴雨大暴雨、冰雹、雷暴大風馬上到湖北

極目新聞
2026-04-26 08:40:20
顏寧微博發文:我本人曾經至少兩篇CNS論文被審稿人偷信息搶發

顏寧微博發文:我本人曾經至少兩篇CNS論文被審稿人偷信息搶發

澎湃新聞
2026-04-26 11:18:27
荒唐的斯威士蘭:集中10萬少女貢獻國王選妃,國民平均壽命35歲

荒唐的斯威士蘭:集中10萬少女貢獻國王選妃,國民平均壽命35歲

春秋硯
2026-04-25 17:15:06
南京一通信公司高管組織40多名員工上班時間干私活,研發競品長達9年,被按法定上限判賠580萬元

南京一通信公司高管組織40多名員工上班時間干私活,研發競品長達9年,被按法定上限判賠580萬元

環球網資訊
2026-04-26 16:19:07
全市領導干部會議召開,宣布省委關于景德鎮市委主要負責同志調整的決定

全市領導干部會議召開,宣布省委關于景德鎮市委主要負責同志調整的決定

景德鎮瓷局
2026-04-26 09:16:19
2026-04-26 17:43:00
新行情 incentive-icons
新行情
做最具價值的商業信息分享平臺
3007文章數 1112關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

美國網民質疑:為什么先救萬斯

頭條要聞

美國網民質疑:為什么先救萬斯

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

中辦、國辦:加強新就業群體服務管理

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

本地
時尚
藝術
親子
家居

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

IU的臉,真的有自己的時間線

藝術要聞

東漢最美的一幅隸書!這才是中華筆法根源,當代99%的人沒有見過!

親子要聞

給寶寶的輔食太精細,危害不是一般大,家長們早了解早安心

家居要聞

自然肌理 溫潤美學

無障礙瀏覽 進入關懷版