網易首頁 > 網易號 > 正文 申請入駐

開源與閉源,有限與無限的游戲

0
分享至

技術的偉大不在于它被誰擁有,而在于它如何被使用。

——Linux之父Linus Torvalds

01

把開源和閉源對立,很幼稚

隨著百度在6月30日正式開源文心4.5系列的模型,一場關于大模型開源和閉源的討論再次開始。

值得一提的是,百度這次的開源是“真開源”,體現在開源模型數量多、技術水平高。

從數量上來說,百度正式開源的文心大模型4.5系列模型,涵蓋了47B、3B激活參數的混合專家(MoE)模型,與0.3B參數的稠密型模型等10款模型。

非常值得關注的是,這次開源實現了預訓練權重和推理代碼的完全開源,也就是說,開發者不但會知道百度在做什么,還知道怎么做。

這是諸多開源形式中最徹底、最充分的一種形式,足見百度對這個版本開源的決心之大、期望之高。

同樣需要提及的是,文心大模型4.5開源系列均使用飛槳深度學習框架進行高效訓練、推理和部署。在大語言模型的預訓練中,模型FLOPs利用率(MFU)達到47%。

圖:文心大模型4.5系列開源模型

有飛槳和無飛槳,效果兩個樣,這個話題我們日后再談。

有趣的是,圍繞百度開源,業內開始再次辯論開源和閉源的優越性。

事實上,把開源和閉源看作是完全對立的,很幼稚。

而之所以會產生這種幼稚的看法,是因為一個長期以來的刻板印象——開源就是免費,閉源就是收費;開源就是做奉獻,閉源就是為了牟取暴利。

事實上,開源和閉源只是一種階段性的戰略選擇,這個我們稍后細講。

先說的絕對一點,這世界上從來沒有只有開源模式或只有閉源模式的頭部AI公司。

例如,Meta 開源的 Llama 2 在社區貢獻下,推理速度提升了 47%,這是一個世界級的標志性現象,也是很多開源支持者津津樂道的一個案例。因為,很多開源支持者認為,能夠取得這樣的成績,核心原因是開源開發者通過社區協作,集合全球開發者的智慧,從而顯著提升了模型迭代速度。

但是,Meta所謂的開源并不是無保留的。事實上,開源的Llama系列依然保留了核心算法。同時,其一方面以開源姿態,通過生態合作(如Hugging Face)擴大影響力;同時,仍有部分閉源模型針對用于商業化,如Meta AI企業服務。

再看一個例子,今年2月,Grok3正式發布,這款被馬斯克宣稱為“地球上最聰明的AI”,引起了廣泛關注。

然而,馬斯克并未如外界所猜測那樣,當場宣布開源。

眾所周知,AI大模型業界,馬斯克被認為是開源的最核心支持者之一,尤其是在openAI轉向閉源之后,馬斯克甚至發起過訴訟。

但從馬斯克及其xAI的真實產品布局看,馬斯克并未如外界所設想的一樣,走“全開源”路線。實際上,準確的描述是,馬斯克只是宣布將在后續對上一代大模型即Grok2進行開源,最新的Grok3 則仍然走了閉源路線。

某種程度上,模型開源+保留核心算法,或模型開源但綁定收費云服務,才是業內通行的做法。

客觀來講,這種做法有助于在維護市場普及率,保持技術領先性和加強商業競爭力等三個需要兼顧的要素之間取得平衡——也就是通過對非最新一代(或即將迭代)的模型進行開源,以實現擴大用戶基礎、收集多樣化數據,從而推動AI模型的持續迭代的目的;另一方面,對于最新的或高端的模型,通過直接或間接的方式來收費或與收費服務綁定,來平衡成本。

畢竟,大模型是一種非常昂貴的造物,其訓練過程中需要的海量算力和數據集客觀上需要大量的集中式投入,如果沒有一種相對平衡的成本回收機制,任何一家財雄勢大的AI公司都無法持續的提供開源,這是一個典型的“雞生蛋還是蛋生雞”的悖論。

所以,你說這種主流做法,到底算是開源,還是閉源?

所以我造了一個詞,叫“混合開閉源”模式,這其實才是真正的主流AI公司的常態。

如果把眼界再開闊一點,我們還可以進一步得出一個結論——成熟的軟件企業,很大程度上是開源和閉源雙軌制的。

微軟可以是說歷史上最堅持閉源,甚至是對開源深惡痛絕的企業,其來自Windows和Office的滾滾財富,正是基于閉源的基礎之上。其前首席執行官鮑爾默甚至抱怨稱開源的Linux“就像是癌癥病毒”。

但曾經抵觸,不表示永久抵觸。事實上,意識到軟件行業的結構發生深層次變化后,微軟于2018年以75億美元的巨資收購GitHub,后者作為全球最大的開源代碼托管平臺,擁有超過2800萬開發者用戶和1.2億代碼倉庫,是開發者社區的核心樞紐,也可以說是微軟“死對頭”的聚集地。

微軟買下了曾經被它稱為“癌癥病毒”的開源社區,是因為后者能夠有效的服務于微軟的長期策略。

在鮑爾默執掌微軟的后期,這家企業其實已經意識到,售賣操作系統和辦公軟件已經是上一個時代的核心商業模式,微軟正在云計算時代掉隊。

而購買GitHub后,則意味著其最突出的優勢——代碼托管功能,可以與微軟的Azure云服務深度整合。說的更具體一點,無論開發者通過GitHub上要部署什么應用,也無論其開源或閉源屬性,微軟的Azure都將是默認的首選。

從此,微軟成為GitHub的最大開源貢獻者之一,并通過GitHub支持了大量開源項目(如.NET框架、VS Code等),進而重塑了上個世紀以來積累深重的“創新破壞者”的負面企業形象,進而吸引了大量開發者群體,客觀上成為了開源時代最重要的“賣水人”之一。

這個例子有力的說明了,單純的用支持開源或不支持開源來判斷一個企業的戰略是不準確的,成功的企業必然會將兩者的優勢集中起來,在不同的場景和商業模型下使用。

02

有限與無限

如果上一章我們是在一個非常宏觀的層面論述了在一個企業體系內必然會兼容開源和閉源這兩種形態,那么接下來要討論的則是,大模型企業會在什么樣的具體情況下選擇開源或閉源?

基本的答案是,企業會根據具體的賽道場景和競爭需求來加以靈活的選擇。

紐約大學宗教歷史學教授詹姆斯·卡斯在著名的哲學思維著作《有限與無限的游戲》提供了一個認知世界的新觀點,他將世界比作“游戲”,并區分為有限游戲和無限游戲。有限游戲以取勝為目的,無限游戲以延續游戲為目的。

或許我們可以打一個這樣的比喻——有限游戲就好比短跑,需要在有限的時間內釋放出最大的爆發力;而無限游戲就好比馬拉松,比拼的是如何在一個漫長的競爭過程中熬過重重難關并最終取勝。

所以,聰明的公司在面對需要短期內制勝(效率導向)的時候,會選擇有限游戲模式;在面對長期性的目標或長尾型的目標(終局模式)時,則采取無限游戲模式。

閉源是典型的有限模式,它通常在目標明確的時候被采用。例如,文心 4.0推出后,面臨的緊迫任務是盡快的降低推理成本,這時候集中優質資源打硬仗的“有限游戲”就成為了好的戰略選擇。事實也是如此,通過集中優化和連續壓強式的工作,百度快速把這一版本的推理成本降到最初的1%,并明顯提升了性能。這種情況下,顯然必須依靠閉源模式來集中兵力打硬仗。

然而,這次開源文心4.5的歷史背景已經發生了很大的變化,這一版本被寄托的任務是加強滲透率和下載量,提高整個文心模型的普及率。這是一個非常長周期、長尾型的任務,在這種背景下,百度就自然會傾向于無限模式,這也是這次開源的深層次原因。

事實上,這樣根據任務的不同屬性來靈活決定某一個版本的開源屬性的方式,已經成為AI特別是大模型領域的主流。

以開源著稱的通義千問系列為例,其中7B、14B、72B等中小規模模型已開源,魔搭社區里更是提供了成百上千的版本供開發者自由下載和二次開發。

但與此同時,300B等大規模模型(如通義千問Max、Qwen3-235B-A22B等)則作為企業級云服務產品,因為其特性是通過API或私有化部署提供給企業客戶,而且能夠用到這種強大模型的機構,對私有化部署中的安全性、定制化和高性能都非常敏感,所以一定會選擇閉源模式。

圖:文心多模態后訓練模型(支持思考、關閉思考)

在多個多模態基準測試中達到SOTA水平

與之類似的還有如谷歌開源了Gemini 2B/7B模型以對抗Meta,這是一場長期競爭,所以選擇了開源模式;但對于數據、安全訴求都處于高敏感區間的如醫療、自動駕駛等領域,谷歌則提供了最高層次的閉源Gemini Ultra模型。

當然,商業訴求僅僅是企業選擇開閉源的決策要素之一而非全部,更長久影響某個模型開閉源的主要因素,來自于其要完成的利益使命。

從對模型充分發展的意義上來講,開源的優勢非常明顯,它可以集中智慧,顯著降低參與門檻,吸引大量開發者、嘗試者,從某種程度上提高某一系列模型整體上的“市場占有率”,DeepSeek R1就是最好的例子;但開源也有重要缺點,就是其貢獻沒有強制機制,導致其穩定性欠佳。

例如,有研究者就指出,開源代碼的貢獻者并不都是想象中那么“無私”——仍以GitHub為例,其社區中幾乎每天都有開源項目因缺乏持續維護而被淘汰,而被淘汰的原因并非技術上的難以為繼,而是因為開發者憑借已經開發的版本拿到了巨頭的收購offer,進而停止了對開源項目的維護。

這個例子非常生動的告訴我們,不用也沒有必要把開源或閉源的選擇過于理想化,甚至提升到情懷層面。在真實世界里,無論是大企業還是個人開發者,其選擇開閉源的主要理由都是由現實的利益和競爭的需求所決定的。

03

百度4.5開源,打開了一個新時代

百度斷然決定把4.5版本在6月30日開源,是一個重要且敏捷的決定。

幾個月前,DeepSeek的發布,的確讓國內的AI領域有一種瞬間“萬馬齊喑”的感覺,特別是多年重度投入AI的大廠們更是受到了重重追問。

帶著文心4.5 Turbo和文心X1 Turbo這兩個具有很強競爭優勢的新模型回歸,百度用這種方式表達了自己的生存哲學——不但要跟進,還要打到終局模式。

客觀來講,DeepSeek的開源(盡管其也有閉源版本),對公眾而言,是在開源和閉源的天秤上,在“開源”這一側放下了一顆重重的砝碼。

可以說,從這一刻開始,大模型競爭從單純的對比參數、打榜、發論文,變成了真刀真槍的PK自家模型的行業滲透率和普及率。

我曾經寫過,百度AI的生存哲學,核心就是競爭與創新。你也可以理解為,百度視AI核心業務的發展為一個非常長期的競爭過程,而技術創新是其生存競爭優勢得以存在的重要保證。

既需要拉升滲透率,又需要持續的投入一場創新和競爭的馬拉松,顯而易見,這是一場“無限游戲”,所以百度毅然選擇了開源模式。而且筆者甚至還猜測,在未來,對若干具有市場競爭力的大版本持續開源,或將成為百度的一種新的模式。

之所以產生這樣的結果,最大的時代背景是——大模型已經從“嘗新期”進入成熟期,已經從“炫技”變成“應用為王”,目前各大勢力的核心目標都已經不再是飆指標,而是希望迅速進入千行百業的實際應用場景中,通過占據場景來“分蛋糕”。這種情況下,開源部分具有明顯優勢的核心版本,是最有效、最及時的辦法。

百度本身就是國內罕有的四層架構俱全的全棧型AI公司,加之其擁有被成為“大模型的操作系統”的深度學習框架飛槳,這都讓百度有了維持一場長期的,同時既比拼模型性能也比拼生態厚度的競爭的前提條件,這也是4.5版本開源的另一個宏觀戰略背景。

更具體的說,一方面,文心4.5的開源,以其優異的性能,顯然能夠吸引更多開發者參與到這一版模型的優化與創新中來,從而匯聚各方智慧,加速模型性能的提升。

而另一方面,大模型的應用普及期已經開啟,通過開源,百度可以與上下游企業、科研機構以及廣大開發者建立更緊密的合作關系,共同探索大模型在更多領域的應用,推動整個行業的發展,從而切下更大的一塊“蛋糕”。

而除了以上的宏觀意義之外,從微觀層面來看,百度此次開源,也將帶來更強的商業化效率。例如,一方面堅持開源基礎模型(文心4.5)吸引用戶,另一方面,通過千帆平臺企業版(MaaS服務),以及重點行業的私有化部署、定制化需求等實現高端盈利。

結語

百戰歸來,仍是少年

作為一個長期跟蹤百度AI戰略的行業研究者,我當然難以忘卻百度在前幾年對閉源模式的偏愛,以及其背后的原因,如認為閉源模式更有效率等等。

所以,我也一度認為,百度雖然必然會在某個時刻、某個版本上轉向開源,但“偶像包袱”和“面子問題”,都會引發爭議和困惑。

但是沒想到,說轉就轉了,可謂快速決策,靈活轉身。

我為百度的干脆感到高興,從更深層次來說,這不僅說明了百度求真務實、洞察時代潮流變化的戰略洞察力,也說明百度及其領導者身上仍然具有創業企業的靈活性和活力,對于一家創立了25年的公司來說,能保留這種初心和活力,本身就是一種競爭力。

或許,此前百度的追求中,除了發展AI技術創新以外,也有對自己是行業領頭羊的內心驕傲。但現在看來,百度的追求變得更加務實和接地氣——在認定“應用”是目前的頭等大事后,百度可以說方方面面的努力都是服務于“應用”。但這種“服務”的本質,是苦心經營自己的底層核心競爭力、提升自家基礎大模型的核心能力和成本優勢后,對行業能夠更好、更便宜的去應用AI資源的一種最好的支持。

而這種努力的具象,就是眼前的這次開源;我認為這次開源是百度的一道關口,過了這道關,百度會放下很多歷史包袱,會以更加靈活和充滿活力的姿態,參與AI賽道的長跑,去爭取無盡游戲的終局勝利。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
單依純演唱會票價大跳水!原價1880打五折都賣不出去,路人緣崩了

單依純演唱會票價大跳水!原價1880打五折都賣不出去,路人緣崩了

萌神木木
2026-04-25 17:37:06
判刑1萬年!全紅嬋幕后黑手被抓,2個黑幕被首次曝光

判刑1萬年!全紅嬋幕后黑手被抓,2個黑幕被首次曝光

酷侃體壇
2026-04-24 23:12:03
湖人隊布朗尼詹姆斯在季后賽接父親的空中接力傳球后,激動不已

湖人隊布朗尼詹姆斯在季后賽接父親的空中接力傳球后,激動不已

好火子
2026-04-26 04:18:08
爆料瘋傳!中南醫院“王護士長”被扒,她到底有沒有問題?

爆料瘋傳!中南醫院“王護士長”被扒,她到底有沒有問題?

千言娛樂記
2026-04-22 13:31:23
一夜3大消息!騎士迎利好,杜蘭特又缺戰,最快進步球員獎公布

一夜3大消息!騎士迎利好,杜蘭特又缺戰,最快進步球員獎公布

體壇小李
2026-04-25 08:00:58
64歲俞敏洪獨居北京,妻兒定居加拿大原因曝光,原來他是身不由己

64歲俞敏洪獨居北京,妻兒定居加拿大原因曝光,原來他是身不由己

閱微札記
2026-04-24 14:49:10
湖人隊選中布朗尼后,JJ·雷迪克對勒布朗·詹姆斯說了什么

湖人隊選中布朗尼后,JJ·雷迪克對勒布朗·詹姆斯說了什么

好火子
2026-04-26 04:12:12
浙江東海驚現215斤巨型魚王, 老漁民: 活了半輩子第一次見

浙江東海驚現215斤巨型魚王, 老漁民: 活了半輩子第一次見

萬象硬核本尊
2026-04-25 19:23:02
瘋狂漲價!AI風口下的“黃金材料”

瘋狂漲價!AI風口下的“黃金材料”

格隆匯
2026-04-25 17:52:51
別再尬演情婦了!一臉疲態、五大三粗,這是迷倒男人該有的皮囊?

別再尬演情婦了!一臉疲態、五大三粗,這是迷倒男人該有的皮囊?

白面書誏
2026-04-14 14:09:53
1983年,陳云親自批示:立即槍斃廣東縣委書記王仲,原因為何?

1983年,陳云親自批示:立即槍斃廣東縣委書記王仲,原因為何?

莫地方
2026-04-20 09:30:18
46號令落地執行:在職正常、退休嚴查到底,這6類人誰也跑不掉

46號令落地執行:在職正常、退休嚴查到底,這6類人誰也跑不掉

芳姐侃社會
2026-04-24 22:35:47
山姆二店項目開工在即,濟南將成為山東首個“雙山姆”城市

山姆二店項目開工在即,濟南將成為山東首個“雙山姆”城市

天下泉城
2026-04-24 10:43:12
詹俊:阿森納運動戰創造力有限,榜首王座不穩啊

詹俊:阿森納運動戰創造力有限,榜首王座不穩啊

懂球帝
2026-04-26 03:52:21
足壇兩大狠人!阿什拉夫與旺達傳緋聞,伊卡爾迪再成笑柄?

足壇兩大狠人!阿什拉夫與旺達傳緋聞,伊卡爾迪再成笑柄?

羅氏八卦
2026-04-25 18:00:03
駐日武官王慶簡:為日本潛伏20年出賣軍事機密,卻因一動作暴露身份

駐日武官王慶簡:為日本潛伏20年出賣軍事機密,卻因一動作暴露身份

睡前講故事
2026-02-03 20:55:43
學歷貶值到什么程度了:超5900名中小學老師擁有博士學歷!

學歷貶值到什么程度了:超5900名中小學老師擁有博士學歷!

燈錦年
2026-04-25 12:03:48
廣東民警當街抓捕在逃人員:路人大哥一伸腳,嫌疑人頓時摔趴在民警跟前

廣東民警當街抓捕在逃人員:路人大哥一伸腳,嫌疑人頓時摔趴在民警跟前

環球網資訊
2026-04-25 18:20:16
廣東3消息!胡明軒正式發聲,徐昕回應直面杜鋒,徐杰獲MVP候選

廣東3消息!胡明軒正式發聲,徐昕回應直面杜鋒,徐杰獲MVP候選

多特體育說
2026-04-25 11:24:28
狂得沒譜!以色列大使在聯合國發飆,當眾逼問中國給了伊朗多少錢

狂得沒譜!以色列大使在聯合國發飆,當眾逼問中國給了伊朗多少錢

健身狂人
2026-04-26 03:06:19
2026-04-26 07:16:49
胡說成理 incentive-icons
胡說成理
一個記錄胡喆和他的朋友們,關于智能時代和智能時代的生意邏輯的小天地。
212文章數 28關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

頭條要聞

媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

數碼
本地
時尚
藝術
公開課

數碼要聞

聯發科亮相2026北京車展:主動式智能體座艙解決方案

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

這些穿搭適合春天!外套彩色內搭白色、褲子穿基礎款,舒適大方

藝術要聞

毛澤東寫小字,太瀟灑了

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版