網易首頁 > 網易號 > 正文 申請入駐

拐點出現,中國開源大模型下載量超越美國

0
分享至

最近,Interconnects.ai 的一份報告,像在科技圈丟下一枚炸彈:截至 2025 年 8 月,中國開源大模型在 HuggingFace 上的下載量正快速趕上美國,幾乎已經超越了。

美國這2年在開源模型上的領先地位,似乎正在被反超。在鯨哥看來,這不只是一個數據酷炫,下載量說明大家真的在用,證明我們在模型質量、生態建設等方面都實現了反超。

很多人不理解意義,簡答說在移動互聯網時代,很多人都用的是安卓手機,開源的安卓統治了移動操作系統的過半壁江山。AGI時代,Meta也高舉開源大模型的大旗,很多國外企業采用Llama作為AI 引擎,輸出AI的消費級服務。

Llama差點成為新時代的安卓,現在 DeepSeek、Qwen等模型,改變了這一現狀。

國產大模型的高光時刻

具體說,是Interconnects.ai 在《ATOM Project》這份報告里,統計了 Meta、Google、Mistral AI、Microsoft、Alibaba Qwen 和 DeepSeek 等幾家主要大模型開放者,從它們在 HuggingFace 上的下載量和派生(fine?tune/派生模型)的情況做了歸類。報告里幾個關鍵點:

到 2025 年 8 月,美國領先的開源模型(主要是 Llama / Meta 系列)與中國領先的開源模型下載總量都在約 3 億次(~300M 次下載)左右。兩邊差距已經非常小。

中國模型下載量的增長速度明顯快于美國模型。每個月新下載量/新增派生模型的比例,中國那邊漲得更陡。

在派生/fine?tune 模型數量上,美國的留存領頭優勢在減弱。以前美國模型(主要是 Llama 系列)派生模型占比非常高,但到現在,中國模型(比如 Qwen 系列)一個月的新派生模型中可能占到40% 以上。美國 Llama 系列的派生比例從巔峰時的近 50% 下滑到大約 15%。

再看國產模型的一些動靜:

DeepSeek 的 V3 與 R1 模型,自從發布后震動不小。DeepSeek?V3 發布在 2024 年底/2025 年初,其在數學、編碼任務上的表現被業界認為“性價比高 + 推理 +成本比驚人”。

緊接著,阿里在 2025 年春節發布了Qwen 2.5?Max。幾個月后,阿里又發布了 Qwen 3 系列,帶 hybrid reasoning(混合推理)能力。

Qwen3包含235B和30B兩種MoE架構及6個Dense模型,覆蓋6B-232B的多種尺寸的8款系列模型。阿里的Qwen系列更新速度和更新范圍在全球都無出其右。

不只是DeepSeek和Qwen在充當主力軍,混元開放從 0.5B 到7B 的小尺寸模型,支持終端與低功耗場景落地。

Kimi K2 是一個 1T 參數總量、32B 激活參數的 MoE 模型,對 Agent 與 coding 任務友好,支持 128K 上下文,開源且免費商用。

GLM-4.5 融合了推理、代碼與智能體能力,是國產開源模型中的新標桿,在多個 benchmark 上為開源模型中表現最優,參數效率與成本效益顯著提升。

所以「下載量幾乎趕上 + 新模型速度 +派生/fine?tune 模型數目增多」這些都指向了一個拐點:中國開源大模型生態不再是追隨者,而是正式進入高速對抗+超越可能的階段。

國外開源為何落后?

美國這邊落后的原因,不是因為人物不努力,而是結構 +生態 +方向 +部署門檻幾個地方被拉開了差距。Llama 4 是一個重要節點,可以重點說下。

Meta 在 2025 年發布了 Llama 4 家族(包括 Maverick、Scout 等版本),這個趕工版本出現了很多問題:

1.過載現象嚴重,應試的產物

有傳言Llama 4 在后訓練階段中,將多個benchmark測試集混入訓練數據。這讓模型的測試成績出眾,但在泛化任務中表現差強人意。實測很多任務的表現還不如GPT-4o。

2.派生 /開源自由度下降

雖然 Llama4 是開源權重模型(open?weight 模型家族),但在派生(fine?tune/第三方修改)社區里的活力相比之前有所下降。Interconnects 報告里提到,美國模型(Llama 系列)派生模型的比例從 2024 年底約 50% 高峰降到現在約 15%。意味著很多用戶/開發者在下載之后,不是“繼續改造/訓練/fine?tune”的機會變少了。

3.成本與部署門檻太高

DeepSeek 和 Qwen 在“低成本推理”“輕量版本 /蒸餾版/distill/量化支持”上動作快,用 GPU/硬件要求稍低的版本可用性更高。Llama4 在最強的版本可能需要更高算力/內存/成本,這在很多中小企業/開發者里是門檻。

而GPT和Grok開源速度又很慢,難以扛起國外的開源大旗。

OpenAI 在 2025 年 8 月 6 日推出自 GPT-2 以來的首批開源權重語言模型 gpt-oss-120b 與 gpt-oss-20b,性能堪比 o4-mini 和 o3-mini,可在高端筆記本和手機上運行。

不過,OpenAI 的主流模型如 GPT-4o、GPT-5 等仍然是閉源的。

8 月 24 日,xAI 開源了 Grok-2。Grok-2 在編碼、復雜問題和數學方面表現出色,還能生圖識圖,性能比肩當時的 GPT-4o。不過,Grok-2 的開源協議較為嚴苛,xAI 允許非商業與合規商業使用,但禁止用其訓練其他基礎模型,僅當關聯公司年收入低于一百萬美元時,才可用于商業用途,超過此門檻的商業用途需獲得 xAI 的單獨許可。

xAI 表示 Grok-3 將在 Grok-2 開源大概 6 個月內開源。

現在美國開源的大旗,已經看不到一個實力選手了。

開源未來之路探索

最核心的原因,是Meta的Llama4 發布的口碑,確實影響了其行業認可度。

尤其Llama4 雖然支持多模態,但在OCR/圖像 + 文本混合應用等細節優化,以及成本/延遲/部署資源要求上,用戶反饋并不是每個場景都能“拿來就用”。

最新消息傳言,新版本的Llama4X可能轉向閉源。

中國的 DeepSeek + Qwen 則多頻次推出新版本/升級,以及強勁的中國本土需求 +語言 +多模態場景,讓中國模型在下載量+派生+部署效率上增長非常快。

國產開源大模型每隔一段時間就有新版本/新變體/容量/多模態/OCR/混合模態之類的更新。這些頻率+迭代讓用戶/社區“跟得上看到實際進步”的那種信心很強。

比如,最新的 Qwen?3 系列/Qwen?Next(有的媒體稱之為 下一代 Qwen,或者 Qwen3)被報道擁有混合推理能力(hybrid reasoning),更強的推理 + 對多模態 /實際應用場景的支持。

總結:這不是某一個模型的“反超”,而是生態拐點。
甚至a16z的合伙人Martin Casado說,預計80%的灣區初創公司,都在基于中國開源模型進行開發。

未來幾個月/一年里,我們可以重點看三件事:

  1. Qwen?Next / Qwen3 等下一代模型的正式 benchmark +開源程度如何;

  2. DeepSeek 后續版本將帶來多大程度的升級,R2或者V4帶來驚喜可期;

  3. HugginFace/ModelScope 等開源模型托管/派生生態是不是繼續給中國模型更大的空間增長。

總結來說,中國開源模型的優勢不僅是“便宜”或“中文好”,而是“速度 +迭代 +社區生態 +部署門檻低”,這些組合在一起,構成了現在這個拐點。

參考資料:

https://www.interconnects.ai/p/on-chinas-open-source-ai-trajectory

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
就在剛剛!廣東德比賽前傳來3大壞消息,杜鋒這回真笑不出來了

就在剛剛!廣東德比賽前傳來3大壞消息,杜鋒這回真笑不出來了

林子說事
2026-04-26 11:16:05
內娛第一刀,批量斬頂流

內娛第一刀,批量斬頂流

最人物
2026-04-25 14:39:41
姚安娜喜提華為Pura X Max 網友:又美又颯

姚安娜喜提華為Pura X Max 網友:又美又颯

快科技
2026-04-25 23:16:13
河北偷狗女子社會性死亡:人被拘了,名聲臭了,更惡心的還在后面

河北偷狗女子社會性死亡:人被拘了,名聲臭了,更惡心的還在后面

社會日日鮮
2026-04-25 19:02:51
山姆“爆雷”,3億中產炸了!

山姆“爆雷”,3億中產炸了!

新零售參考Pro
2026-04-23 16:31:50
誰給的勇氣?廣州隊季后賽門票,遠超其他球隊 CBA最貴

誰給的勇氣?廣州隊季后賽門票,遠超其他球隊 CBA最貴

體育哲人
2026-04-26 09:44:15
自制“飯卡手機”涌入閑魚!二手最低148塊,運行iOS系統

自制“飯卡手機”涌入閑魚!二手最低148塊,運行iOS系統

閑搞機
2026-04-26 11:00:09
千年難遇的美人,太漂亮了,沒有一點毛病,太完美了

千年難遇的美人,太漂亮了,沒有一點毛病,太完美了

情感大頭說說
2026-04-24 12:46:24
皇室獨苗悠仁19歲選妃,4大條件層層篩選,第4條直接勸退所有人

皇室獨苗悠仁19歲選妃,4大條件層層篩選,第4條直接勸退所有人

z千年歷史老號
2026-04-24 11:37:07
利好!29歲趙心童有望沖到世界第1:特魯姆普被扣50萬鎊 都怪沙特

利好!29歲趙心童有望沖到世界第1:特魯姆普被扣50萬鎊 都怪沙特

風過鄉
2026-04-26 08:18:40
葉新萍被查實!科室1.3億收入賬上只剩5964萬,舉報人懸賞一套房

葉新萍被查實!科室1.3億收入賬上只剩5964萬,舉報人懸賞一套房

阿萊美食匯
2026-04-26 13:54:12
史上最大規模化債,已經開始!堅持了30年的信仰,進入倒計時

史上最大規模化債,已經開始!堅持了30年的信仰,進入倒計時

律法刑道
2026-04-26 08:44:05
陳奕迅女兒陳康堤承認與香港網球一哥黃澤林戀愛:是家人介紹的

陳奕迅女兒陳康堤承認與香港網球一哥黃澤林戀愛:是家人介紹的

懂球帝
2026-04-25 16:34:10
廣州7歲男童無法走路說話,被當腦癱治療多年,父母翻病歷發現其出生時顱骨骨折疑在醫院摔傷,醫院否認,一文梳理關鍵時間線

廣州7歲男童無法走路說話,被當腦癱治療多年,父母翻病歷發現其出生時顱骨骨折疑在醫院摔傷,醫院否認,一文梳理關鍵時間線

大象新聞
2026-04-25 16:49:18
白宮新聞秘書萊維特承認脫離特朗普“團隊”后,二人互動中已顯現出關系緊張跡象

白宮新聞秘書萊維特承認脫離特朗普“團隊”后,二人互動中已顯現出關系緊張跡象

熱心市民小黃
2026-04-26 14:50:51
俞敏洪回應東方甄選主播集體離職:是平臺的損失

俞敏洪回應東方甄選主播集體離職:是平臺的損失

澎湃新聞
2026-04-26 09:40:29
慘勝背后暗流涌動!阿森納1-0紐卡重回榜首,球迷為何集體憤怒?

慘勝背后暗流涌動!阿森納1-0紐卡重回榜首,球迷為何集體憤怒?

落夜足球
2026-04-26 14:04:10
黃一鳴回應:孩子100%是王思聰的,不排斥和老頭交往,八十歲也行

黃一鳴回應:孩子100%是王思聰的,不排斥和老頭交往,八十歲也行

奇思妙想草葉君
2026-04-24 19:44:03
蔣萬安發出強硬警告,"中國臺灣省"走向國際,10國選擇明智應對

蔣萬安發出強硬警告,"中國臺灣省"走向國際,10國選擇明智應對

流史歲月
2026-04-25 10:19:34
替補43分!多森姆季后賽大爆發,火箭沒交易輸麻?

替補43分!多森姆季后賽大爆發,火箭沒交易輸麻?

籃球實錄
2026-04-26 14:57:26
2026-04-26 15:20:49
鯨選AI incentive-icons
鯨選AI
最新AI產品化與商業化案例速遞
152文章數 38關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

特朗普2年內遭遇4次刺殺威脅 第一個任期也曾險遭襲擊

頭條要聞

特朗普2年內遭遇4次刺殺威脅 第一個任期也曾險遭襲擊

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《八千里路云和月》大結局意難平

財經要聞

DeepSeek V4背后,梁文鋒的轉身

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

本地
健康
房產
游戲
軍事航空

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

干細胞如何讓燒燙傷皮膚"再生"?

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

Pearl Abyss 正式發布《紅色沙漠》首張官方原聲音樂專輯

軍事要聞

伊朗總統:不會在壓力、威脅下進行談判

無障礙瀏覽 進入關懷版