網易首頁 > 網易號 > 正文 申請入駐

阿里發布全球最強開源模型Qwen3,驚喜與現實并存

0
分享至

作為2025年,國內巨頭中第一家發布下一代大模型的玩家,阿里 Qwen3吊足了AI圈的眼球。

現在大模型更新基本集中在二代半,GPT-4.5和GPT-4o為代表,Claude 3.7 sonnet、近期剛更新的文心4.5 Turbo ,都具有非常顯著的AI 特性,但并不足以稱之為換代。

阿里 Qwen3則呈現了下一代模型的一些標準,具有以下四種特性:混合推理模型,實現自動快慢思考;模型內置Agent+MCP,垂直場景 開發更易用;8款尺寸全覆蓋,旗艦還是移動端都可適配;更多語言支持,真正支持全球化開源。

鯨哥詳細了解下這次發布的模型,一共有8款不同尺寸,分別是6款Dense模型以及2款MoE模型,Qwen3 模型以更小的規模實現了對更大體量上一代模型的超越,性價比強無敵。

值得關注的是,旗艦模型Qwen3-235B-A22B在代碼、數學、通用能力等基準測試中,超越了DeepSeek R1、OpenAI o1 o3mini、Grok 3等國內外頂尖大模型,和Gemini 2.5 Pro略有差距。

然后Qwen采用 Apache 2.0 許可 ,模型能力已經超越 Meta Llama 和Mistral,而且Qwen系列衍生模型全球已經超過10萬個,現在可以說是全球最好的開源模型。

不過最強開源并非無敵,在強堆預訓練數據下,Qwen3 使用的數據量是Qwen2.5兩倍,達到了約 36 萬億個 token,實現了一些雄心壯志,但也有一些現實需要面對。

畢竟在訓練數據量同樣是30T以上的級別中,Llama 4坊間評價已經撲街。Qwen3在很多方面,對最強閉源模型也沒有優勢。通過更多場景測評,我們能更了解這款“強大的模型”。

首先是一個在DeepSeek中,很受大家喜歡的能力,就是制定學習計劃表格并導出,通義也實現了相應的功能,從Html代碼到預覽呈現,以及Excel下載。

在寫作能力上,先點了深度思考模式,文章內容深度并沒有體現,點擊聯網模式后,文章內容提到了很好的升級。這個主題下寫作,Qwen也認為餓了么有邊緣化的危機,就沒截全。

從結尾看總結寫的也不錯,在國產AI助手中寫的算頂尖行列。

在生成報告方面,要求 Qwen3生成兼具美觀的報告,它選擇生成了Markdown格式,最終的效果如下圖。從生成內容質量看,距離現在的Deepresearch產品也有距離。

在可視化網頁方面,此前鯨哥經常用一套優化的提示詞做秀圖。

上面是DeepSeek V3生成的效果,下圖是Qwen 3生成的效果,對文章結構處理和審美理解都差一點意思。

在代碼生成方面,也有很多的進步空間,這里是給了提示詞: 生成一個星級旅游網頁,賽博朋克風格,背景是無垠宇宙,一艘飛船中間有輸入旅行地址框。

做高考數學題也不在話下,利用 Qwen2.5-Math 和 Qwen2.5-Coder 這兩個數學和代碼領域的專家模型合成數據,合成了包括教科書、問答對以及代碼片段等多種形式的數據。

Qwen3這次傳說中的多模態沒上,超長上下文還要補課。

整體來看,Qwen更多的驚喜試是相較過去自己,能力差不多實現30%的升級,而且是全家桶便宜且開源,以及支持Agent和MCP,企業落地更多場景更方便,對于大模型再企業端落地有很大促進作用。

但是在很多用戶應用場景下,能力升級但沒達到預期驚喜。尤其代碼等場景下,舉例DeepSeek V3和Claude 3.7還有不少的距離。

沒能全方位超越閉源模型,并不意味著通義App不好用。長短思考自動切換,內置APP生成,以及視頻和圖片生成能力,在一眾國產AI助手中還, 通義App還是那個更絲滑和更全能的助手。

視頻內容推薦:

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1.9秒一單狂破世界紀錄!安徽小縣城憑三樣小吃,火遍整個長三角

1.9秒一單狂破世界紀錄!安徽小縣城憑三樣小吃,火遍整個長三角

青眼財經
2026-04-25 23:05:36
別人對你說“咱倆加個微信”,千萬別說 “您掃我還是我掃您?” 高情商的人這樣做

別人對你說“咱倆加個微信”,千萬別說 “您掃我還是我掃您?” 高情商的人這樣做

德魯克博雅管理
2026-04-23 17:02:27
宇航員登月回歸后精神失常,死前坦言:人類不應踏足遠方

宇航員登月回歸后精神失常,死前坦言:人類不應踏足遠方

清茶淺談
2024-12-20 22:30:46
事態升級,中方軍艦越聚越多,四川艦和遼寧艦匯合,菲日休想鬧事

事態升級,中方軍艦越聚越多,四川艦和遼寧艦匯合,菲日休想鬧事

甜到你心坎
2026-04-25 09:50:11
外貿玩具工廠突發通知:即日起停業破產,上千人飯碗被砸!

外貿玩具工廠突發通知:即日起停業破產,上千人飯碗被砸!

燈錦年
2026-04-26 14:03:21
鄭州一村吃席只有3個菜!煙酒不超40,每桌140,網友:請全國推廣

鄭州一村吃席只有3個菜!煙酒不超40,每桌140,網友:請全國推廣

小秋情感說
2026-04-26 09:35:44
葛斯齊再爆猛料,大S身后事細節太出人意料

葛斯齊再爆猛料,大S身后事細節太出人意料

小椰的奶奶
2026-04-26 20:42:18
港媒:中國正從伊朗的廢墟中汲取關于“持久戰”的冷酷經驗

港媒:中國正從伊朗的廢墟中汲取關于“持久戰”的冷酷經驗

矚望云霄
2026-04-24 23:33:38
4月28日正式開播!中央八套黃金檔好劇來襲!全員演技在線

4月28日正式開播!中央八套黃金檔好劇來襲!全員演技在線

琴琴有氧運動
2026-04-26 14:30:35
上港隊長王燊超:娶了申花球迷,37歲仍征戰中超,恩師盼他回崇明

上港隊長王燊超:娶了申花球迷,37歲仍征戰中超,恩師盼他回崇明

林子說事
2026-04-26 08:49:40
王近山不經請示干掉日本戰地觀戰團,毛主席:早就聽說有個王瘋子

王近山不經請示干掉日本戰地觀戰團,毛主席:早就聽說有個王瘋子

鶴羽說個事
2026-04-20 22:56:36
300965,重大資產重組!明天停牌!

300965,重大資產重組!明天停牌!

證券時報e公司
2026-04-26 17:29:23
商務部新聞發言人就美眾議院外交事務委員會通過MATCH等法案答記者問

商務部新聞發言人就美眾議院外交事務委員會通過MATCH等法案答記者問

新京報
2026-04-25 10:28:06
25-26賽季CBA常規賽最佳陣容出爐

25-26賽季CBA常規賽最佳陣容出爐

刺猬籃球
2026-04-26 18:42:26
首個石油儲備完全枯竭國家出現,比菲律賓慘,還有三個國家很危險

首個石油儲備完全枯竭國家出現,比菲律賓慘,還有三個國家很危險

混沌錄
2026-04-24 21:02:11
恭喜穆里尼奧!有望空降皇馬!權威記者力挺,姆巴佩危險了

恭喜穆里尼奧!有望空降皇馬!權威記者力挺,姆巴佩危險了

阿泰希特
2026-04-26 15:45:41
西媒:西班牙首相稱“不擔心”被逐出北約

西媒:西班牙首相稱“不擔心”被逐出北約

參考消息
2026-04-25 21:19:06
白宮記協晚宴安全事件細節披露

白宮記協晚宴安全事件細節披露

界面新聞
2026-04-26 10:11:44
俄方說破天都沒用,中方就認一個理,中俄天然氣走俄羅斯國內價

俄方說破天都沒用,中方就認一個理,中俄天然氣走俄羅斯國內價

聊歷史的阿稼
2026-04-26 10:25:44
22歲國乒勁敵做出大膽預判!世乒賽奪冠勝算大漲,王皓真得拼一把

22歲國乒勁敵做出大膽預判!世乒賽奪冠勝算大漲,王皓真得拼一把

體話我說
2026-04-26 13:48:21
2026-04-26 21:47:00
鯨選AI incentive-icons
鯨選AI
最新AI產品化與商業化案例速遞
152文章數 38關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

事關新就業群體,中辦、國辦發文

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

教育
時尚
游戲
親子
本地

教育要聞

廣州市一模數學試卷簡析

比闊腿褲還時髦?今年夏天一定要有“這條褲子”,減齡又松弛

《AC黑旗RE》夯爆了!碾壓同期登頂多地PS預購榜首

親子要聞

今天我們來吃整蠱海盜桶糖果食玩

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

無障礙瀏覽 進入關懷版