網易首頁 > 網易號 > 正文 申請入駐

國產大模型霸榜前10,誰是最強開源王者?

0
分享至

見證歷史性的一刻,中國模型包攬全球知名AI開源社區Hugging Face大模型趨勢榜前十

該榜單排名綜合了近期訪問、下載、點贊、API(應用程序接口)調用等數據。

近段時間以來,國產開源模型的發展態勢迎來了一波集中且迅猛的爆發期。騰訊混元、阿里Qwen、智譜GLM-4.5、月之暗面kimi-k2 一批國產開源大模型,如繁星般密集亮相。

在Hugging Face前10名的開源模型榜單中,全部都是中國的模型。智譜GLM-4.5登頂第一阿里Qwen一家獨霸5個席位,呈現霸榜形式。現在應該是扎克伯格最傷心的時刻,Meta開源的大旗被我們搶走了。

放在全球大模型領域看,現在已經形成中國開源領先,美國閉源大模型領先的分水嶺局面。盡管在最強大模型的排名中,GLM-4.5最高排名到第三,前二還是美國閉源模型保持,但我們已經形成包圍之勢。

而且國產大模型,也呈現了一些核心優勢:

1、模型采用統一MoE / 多任務稠密雙軌模式,不像國外稠密模型為主,混合專家模式往往能帶來靈活調用的優勢。

類似 GLM-4.5總參數 3550 億,激活參數僅為320 億,把“大而不貴”寫進代碼里——同規模 Claude-4-Sonnet 的激活量估算接近 600-800 億,GLM-4.5 直接砍到一半以下。

2、國產大模型還呈現多尺寸全覆蓋的特點,1B → 480B 全精度/量化雙軌布局,端-邊-云全適用。以Qwen3 系列為例,已經覆蓋30B-A3B, 110B, 235B-A22B, 480B-A35B等眾多尺寸,其中Qwen3-30B-A3B-int4 能在 RTX 4090 24G 單卡運行。

國外『不大不小』的模型基本是空白,大都是大力出奇跡的大模型,典型的就是Claude和Grok系列。

3、在DeepSeek率先打破的大模型價格市場中,國產大模型的API 與自建推理成本均低 50-90 %。智譜這次API 調用價格更低,輸入 0.8 元 / 百萬 tokens、輸出 2 元 / 百萬 tokens,直接把 Claude-4-Sonnet 的 21.5 元輸入、107.4 元輸出打到骨折——成本驟降 90% 以上。

換句話說,同樣 1000 萬字的長文本任務,用 GLM-4.5 只需要 160 元,Claude-4-Sonnet 得掏 12890 元,省下的預算足夠再跑 80 次同樣規模的活兒。

盡管霸榜,但市場反饋才是最終標準。我們挑選了近期開源的代表—— 階躍星辰 Step 3、智譜 GLM-4.5、阿里 Qwen3-235B-A22B-2507以及騰訊Hunyuan等,從交互設計、內容創作、邏輯推理、全棧開發、多模態生成五個維度進行測試。看看誰是真正的開源霸主。


1.交互設計:交互式日歷組件構建

首先測試大模型在前端技術實現、系統架構設計方面的深度。要求三種大模型生成一款功能全面的交互式日歷組件。

請設計并開發一個功能全面的交互式日歷組件,支持年月周日四種基礎視圖無縫切換;支持顯示 / 添加 / 編輯日程事件,不同類型事件可通過顏色區分。

階躍星辰 step 3

階躍星辰 step 3在交互設計上稍顯吃力,生成的功能完整性不足,距離實用有很大的進步空間。

Qwen3-235B-A22B-2507

Qwen3-235B-A22B-2507其次,完成基礎交互功能,但細節打磨有點粗糙。

智譜GLM-4.5

而最強的還是智譜GLM-4.5 ,不僅實現了全功能需求,更在色彩搭配的專業性、操作流暢度上都非常的好,而且還支持“實時預覽” ,為新手解決了 “寫了看不到效果” 的痛點。

三者對比之下,智譜 GLM-4.5 在交互設計的完整性、專業性與人性化細節上形成了明顯優勢,Qwen3 系列基本滿足基礎需求,而階躍星辰 Step 3 則需在核心能力上實現更大突破。


2.內容創作:專業求職簡歷生成

畢業季的大學生都需要投遞簡歷吧,簡歷的精美度和專業角度都非常能決定是否被錄用,鯨哥就讓三個大模型生成簡歷,看有沒有遵守STAR法則,以及評估模型對專業文檔內容組織與視覺設計的理解能力。

請制作一份專業規范、亮點突出的求職簡歷,需兼顧內容完整性與視覺專業性

階躍星辰 step 3

階躍星辰 Step 3 的輸出偏向基礎簡化,內容框架較為單薄,在專業深度與細節上不足。

Qwen3-235B-A22B-2507

Qwen3-235B-A22B-2507生成內容邏輯縝密、表述嚴謹,專業度足以支撐核心需求;不過預覽功能存在一處明顯短板 —— 雖然兼容 HTML、CSS、JavaScript 等格式,卻時常生成無法直接預覽的 JSX 文件,一定程度上影響了使用體驗的流暢性。

智譜GLM-4.5

而智譜GLM-4.5 設計上采用藍紫色漸變,信息層次清晰,不僅嚴格遵循 STAR 法則,還兼顧專業性與個性化。

綜合來看,智譜 GLM-4.5 和Qwen3-235B-A22B-2507 在內容專業性與呈現精致度上都非常的完美,階躍星辰 Step 3 還需在內容深度上實現突破。

3.邏輯推理:國際奧數難題求解

我們再拿出國際奧數題,考驗模型對抽象數學概念的理解與創新性應用能力,需大模型突破常規思維定式構造性證明、反證法。

一位魔術師有一百張卡片,分別寫有數字 1到 100 。他把這一百張卡片放入三個盒子里,一個盒子是紅色的,一個是白色的,一個是藍色的。 每個盒子里至少都放入了一張卡片。 一位觀眾從三個盒子中挑出兩個,再從這兩個盒子里各選取一張卡片, 然后宣布這兩張卡片上的數字之和。知道這個和之后,魔術師便能夠指出哪一個是沒有從中選取卡片的盒子。 問共有多少種放卡片的方法,使得魔術總能夠成功?(兩種方法被認為是不同的,如果至少有一張卡片被放入不同顏色的盒子)

階躍星辰 step 3

階躍星辰 step 3回答:6種。家人們可以拿起筆和紙算一下,這個答案對嗎

Qwen3-235B-A22B-2507

Qwen3-235B-A22B-2507回答:12種

智譜GLM-4.5

智譜GLM-4.5回答:6種

階躍星辰 step 3和智譜GLM-4.5 都回答的是6種方法,但是正確答案是12種方法,只有Qwen3-235B-A22B-2507模型回答正確了。Qwen3-235B-A22B-2507模型在邏輯推理、數學、科學和編碼等任務上性能提升是非常顯著的。


4.全棧開發:“賽博訂單可視化”應用構建

全棧開發的復雜度,主要在一次性需要完成多項要求,實現復雜的 前后端交互、CRUD操作、對應用狀態、以及 UI 樣式的精確控制。

幫我開發一個賽博朋克風格的訂單可視化網頁應用,需包含「可視化大屏」和「后臺管理系統」兩個模塊,支持界面切換與數據實時聯動,要有交互設計感。

階躍星辰 step 3

階躍星辰 Step 3 有鮮明的視覺風格,動感特效強烈,賽博氣息也很濃郁。不過,其特效數據目前尚無法實時動態修改。

Qwen3-235B-A22B-2507

相比之下,Qwen3-235B-A22B-2507 在呈現實時數據跳動方面表現卓越,效果極佳,科技感十足,并且支持一鍵部署,操作便捷。部署成功網站:https://chat.qwen.ai/s/deploy/ea703c46-1e76-422e-b2d9-08fdca9fc2b2

智譜GLM-4.5

而智譜 GLM-4.5 的設計初看簡潔干凈,似乎偏離了賽博主題。但鯨哥深入體驗后發現,它設計了三種可切換模式。當切換到“賽博模式”時,其呈現的視覺沖擊力堪比《生化危機》的氛圍。

其交互設計和核心功能完備,更關鍵的是,它構建了API接口,能夠高效完成訂單數據的增刪改查(CRUD)操作,同樣支持一鍵部署,真正實現了全棧式開發的便捷體驗。部署成功網站:https://c08fu6euyrd1-deploy.space.z.ai

5.多模態內容生成:“兔子打卡北京”視頻生成

多模態內容生成能力運用了自然語言理解、圖像生成、動畫渲染、音頻合成等技術,同時需要大模型具有深度理解文本指令的能力。多模態的內容生成,能降低創作者的視頻創作門檻。

生成兔子在北京各地打卡的vlog視頻,每個景點兔子會拍照打卡。需要打卡的景點北京天壇,故宮,長城,水立方,鳥巢,國家博物館,環球影城。每個景點的先生成打卡照片。視頻需有比較歡快中國化的配樂。

階躍星辰 step 3

階躍星辰 Step 3 生成的動畫里,一只呆呆的兔子靜立于故宮的雕花花壇之上,隨后是幾幀古建筑的動態剪影。

Qwen3-235B-A22B-2507

Qwen3-235B-A22B-2507生成的兔子手忙腳亂的拿著手機在打卡拍照,背景是一點都沒變,不過可以看出來背景上有故宮建筑和水立方等景點樣式。

騰訊Hunyuan

騰訊Hunyuan生成的視頻兔子在故宮里面,像擺件一樣在院子中間,不過這阿姨的回頭殺,嚇死鯨哥了。

這三款模型生成的短視頻均僅有 5 秒時長,動作設計也偏向簡單重復,鯨哥認為若用于日常娛樂尚可,但若論專業創作則仍顯力不從心。

如果非要給這次測試體感排序的話GLM-4.5 當之無愧是第一,其次就是Qwen3-235B-A22B-2507,最后就是階躍星辰 step 3。

本次測評不僅是一場技術能力的橫向對比,更是中國大模型生態蓬勃發展的縮影。

從智譜 GLM-4.5 的強勢登頂,到阿里 Qwen 等模型的多點開花,我們清晰地看到國產開源模型的強勁勢頭。

如果你也感興趣這些模型進化的實力,期待你的實測反應與反饋。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
華晨宇哭了損失大了,在云南投資上億拿下地皮,如今緊急叫停

華晨宇哭了損失大了,在云南投資上億拿下地皮,如今緊急叫停

以茶帶書
2026-04-25 16:22:06
中超超巨失誤!李昊黃油手,中超已丟50球,杜月徵半場壓哨破門

中超超巨失誤!李昊黃油手,中超已丟50球,杜月徵半場壓哨破門

奧拜爾
2026-04-26 19:52:32
斯諾克世錦賽太殘酷:隨著丁俊暉9-13,11名中國選手已被淘汰9人

斯諾克世錦賽太殘酷:隨著丁俊暉9-13,11名中國選手已被淘汰9人

俯身沖頂
2026-04-26 19:40:14
有一種痛苦叫買了“一梯一戶”,以為高大上,結果入住就后悔

有一種痛苦叫買了“一梯一戶”,以為高大上,結果入住就后悔

裝修秀
2026-04-26 10:55:03
世界首次五百強斷崖差距: 日149家,美151家,中國3家,現在呢

世界首次五百強斷崖差距: 日149家,美151家,中國3家,現在呢

杰絲聊古今
2026-04-26 08:48:46
中國需要這樣的老師!線性代數的神,全世界想學這一課程的人,都是他的學生

中國需要這樣的老師!線性代數的神,全世界想學這一課程的人,都是他的學生

爆角追蹤
2026-04-26 11:57:53
對美元的重大誤判,正在深度誤導我們

對美元的重大誤判,正在深度誤導我們

世界靈敏度趙靈敏
2026-04-26 18:36:10
鄧超在江西景德鎮游玩被偶遇,他現實中好瘦,穿衣打扮時尚有型

鄧超在江西景德鎮游玩被偶遇,他現實中好瘦,穿衣打扮時尚有型

草莓解說體育
2026-04-26 20:36:14
現在教師已經嚴重過剩了!

現在教師已經嚴重過剩了!

微微熱評
2026-04-26 18:19:14
浙江市值百億食品上市公司急聘董秘,年薪40萬起!一夜之間數千上市公司董秘崗位空缺,“錢不是問題,人要靠譜”

浙江市值百億食品上市公司急聘董秘,年薪40萬起!一夜之間數千上市公司董秘崗位空缺,“錢不是問題,人要靠譜”

大風新聞
2026-04-26 21:16:37
博主發帖稱遭電詐后赴深圳追討,被帶手銬關9小時,還裸體下蹲

博主發帖稱遭電詐后赴深圳追討,被帶手銬關9小時,還裸體下蹲

齊天候
2026-04-26 18:28:05
突發!南海055遵義艦實彈亮劍,疑似發射鷹擊-20震懾美日菲艦隊!

突發!南海055遵義艦實彈亮劍,疑似發射鷹擊-20震懾美日菲艦隊!

利刃號
2026-04-26 18:36:56
動真格了!最新5名上將被罷免了人大代表資格

動真格了!最新5名上將被罷免了人大代表資格

李昕言溫度空間
2026-04-26 20:21:10
歌手周蕙演唱會上自曝:重感冒后聲帶萎縮,“不知道是不是最后一次唱歌給大家聽”

歌手周蕙演唱會上自曝:重感冒后聲帶萎縮,“不知道是不是最后一次唱歌給大家聽”

魯中晨報
2026-04-26 18:52:19
從能耗世界紀錄到越野新品類,傳祺北京車展的炮火與底氣

從能耗世界紀錄到越野新品類,傳祺北京車展的炮火與底氣

汽車觀察AUTO
2026-04-25 18:08:20
南京一派出所副所長為完成查處任務,“設計”讓6名未成年人吸毒再查獲,犯欺騙他人吸毒罪一審被判5年

南京一派出所副所長為完成查處任務,“設計”讓6名未成年人吸毒再查獲,犯欺騙他人吸毒罪一審被判5年

大風新聞
2026-04-25 22:34:13
泡泡瑪特推出Labubu冰箱,售價5999元,上千人預約

泡泡瑪特推出Labubu冰箱,售價5999元,上千人預約

大象新聞
2026-04-26 13:01:02
槍擊案發生時,坐在特朗普旁邊的華裔女記者是誰?

槍擊案發生時,坐在特朗普旁邊的華裔女記者是誰?

紅星新聞
2026-04-26 20:19:27
這臺大眾很不大眾 解讀一汽-大眾ID. AURA T6

這臺大眾很不大眾 解讀一汽-大眾ID. AURA T6

新出行
2026-04-25 14:01:58
白宮開槍兇手是老師?網傳其剛在洛杉磯拿了“月度優秀教師”獎

白宮開槍兇手是老師?網傳其剛在洛杉磯拿了“月度優秀教師”獎

爆角追蹤
2026-04-26 12:16:15
2026-04-26 22:11:01
鯨選AI incentive-icons
鯨選AI
最新AI產品化與商業化案例速遞
152文章數 38關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

事關新就業群體,中辦、國辦發文

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

教育
游戲
時尚
數碼
本地

教育要聞

廣州市一模數學試卷簡析

《AC黑旗RE》夯爆了!碾壓同期登頂多地PS預購榜首

比闊腿褲還時髦?今年夏天一定要有“這條褲子”,減齡又松弛

數碼要聞

MOREFINE上架G2外置顯卡,內置RTX 5060 Ti

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

無障礙瀏覽 進入關懷版