網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

開(kāi)源與閉源，有限與無(wú)限的游戲

2025-06-30 22:14:09　來(lái)源: 胡說(shuō)成理

河南舉報(bào)

分享至

技術(shù)的偉大不在于它被誰(shuí)擁有，而在于它如何被使用。

——Linux之父Linus Torvalds

把開(kāi)源和閉源對(duì)立，很幼稚

隨著百度在6月30日正式開(kāi)源文心4.5系列的模型，一場(chǎng)關(guān)于大模型開(kāi)源和閉源的討論再次開(kāi)始。

值得一提的是，百度這次的開(kāi)源是“真開(kāi)源”，體現(xiàn)在開(kāi)源模型數(shù)量多、技術(shù)水平高。

從數(shù)量上來(lái)說(shuō)，百度正式開(kāi)源的文心大模型4.5系列模型，涵蓋了47B、3B激活參數(shù)的混合專(zhuān)家（MoE）模型，與0.3B參數(shù)的稠密型模型等10款模型。

非常值得關(guān)注的是，這次開(kāi)源實(shí)現(xiàn)了預(yù)訓(xùn)練權(quán)重和推理代碼的完全開(kāi)源，也就是說(shuō)，開(kāi)發(fā)者不但會(huì)知道百度在做什么，還知道怎么做。

這是諸多開(kāi)源形式中最徹底、最充分的一種形式，足見(jiàn)百度對(duì)這個(gè)版本開(kāi)源的決心之大、期望之高。

同樣需要提及的是，文心大模型4.5開(kāi)源系列均使用飛槳深度學(xué)習(xí)框架進(jìn)行高效訓(xùn)練、推理和部署。在大語(yǔ)言模型的預(yù)訓(xùn)練中，模型FLOPs利用率（MFU）達(dá)到47%。

圖：文心大模型4.5系列開(kāi)源模型

有飛槳和無(wú)飛槳，效果兩個(gè)樣，這個(gè)話(huà)題我們?nèi)蘸笤僬劇?/p>

有趣的是，圍繞百度開(kāi)源，業(yè)內(nèi)開(kāi)始再次辯論開(kāi)源和閉源的優(yōu)越性。

事實(shí)上，把開(kāi)源和閉源看作是完全對(duì)立的，很幼稚。

而之所以會(huì)產(chǎn)生這種幼稚的看法，是因?yàn)橐粋€(gè)長(zhǎng)期以來(lái)的刻板印象——開(kāi)源就是免費(fèi)，閉源就是收費(fèi)；開(kāi)源就是做奉獻(xiàn)，閉源就是為了牟取暴利。

事實(shí)上，開(kāi)源和閉源只是一種階段性的戰(zhàn)略選擇，這個(gè)我們稍后細(xì)講。

先說(shuō)的絕對(duì)一點(diǎn)，這世界上從來(lái)沒(méi)有只有開(kāi)源模式或只有閉源模式的頭部AI公司。

例如，Meta 開(kāi)源的 Llama 2 在社區(qū)貢獻(xiàn)下，推理速度提升了 47%，這是一個(gè)世界級(jí)的標(biāo)志性現(xiàn)象，也是很多開(kāi)源支持者津津樂(lè)道的一個(gè)案例。因?yàn)椋芏嚅_(kāi)源支持者認(rèn)為，能夠取得這樣的成績(jī)，核心原因是開(kāi)源開(kāi)發(fā)者通過(guò)社區(qū)協(xié)作，集合全球開(kāi)發(fā)者的智慧，從而顯著提升了模型迭代速度。

但是，Meta所謂的開(kāi)源并不是無(wú)保留的。事實(shí)上，開(kāi)源的Llama系列依然保留了核心算法。同時(shí)，其一方面以開(kāi)源姿態(tài)，通過(guò)生態(tài)合作（如Hugging Face）擴(kuò)大影響力；同時(shí)，仍有部分閉源模型針對(duì)用于商業(yè)化，如Meta AI企業(yè)服務(wù)。

再看一個(gè)例子，今年2月，Grok3正式發(fā)布，這款被馬斯克宣稱(chēng)為“地球上最聰明的AI”，引起了廣泛關(guān)注。

然而，馬斯克并未如外界所猜測(cè)那樣，當(dāng)場(chǎng)宣布開(kāi)源。

眾所周知，AI大模型業(yè)界，馬斯克被認(rèn)為是開(kāi)源的最核心支持者之一，尤其是在openAI轉(zhuǎn)向閉源之后，馬斯克甚至發(fā)起過(guò)訴訟。

但從馬斯克及其xAI的真實(shí)產(chǎn)品布局看，馬斯克并未如外界所設(shè)想的一樣，走“全開(kāi)源”路線(xiàn)。實(shí)際上，準(zhǔn)確的描述是，馬斯克只是宣布將在后續(xù)對(duì)上一代大模型即Grok2進(jìn)行開(kāi)源，最新的Grok3 則仍然走了閉源路線(xiàn)。

某種程度上，模型開(kāi)源+保留核心算法，或模型開(kāi)源但綁定收費(fèi)云服務(wù)，才是業(yè)內(nèi)通行的做法。

客觀(guān)來(lái)講，這種做法有助于在維護(hù)市場(chǎng)普及率，保持技術(shù)領(lǐng)先性和加強(qiáng)商業(yè)競(jìng)爭(zhēng)力等三個(gè)需要兼顧的要素之間取得平衡——也就是通過(guò)對(duì)非最新一代（或即將迭代）的模型進(jìn)行開(kāi)源，以實(shí)現(xiàn)擴(kuò)大用戶(hù)基礎(chǔ)、收集多樣化數(shù)據(jù)，從而推動(dòng)AI模型的持續(xù)迭代的目的；另一方面，對(duì)于最新的或高端的模型，通過(guò)直接或間接的方式來(lái)收費(fèi)或與收費(fèi)服務(wù)綁定，來(lái)平衡成本。

畢竟，大模型是一種非常昂貴的造物，其訓(xùn)練過(guò)程中需要的海量算力和數(shù)據(jù)集客觀(guān)上需要大量的集中式投入，如果沒(méi)有一種相對(duì)平衡的成本回收機(jī)制，任何一家財(cái)雄勢(shì)大的AI公司都無(wú)法持續(xù)的提供開(kāi)源，這是一個(gè)典型的“雞生蛋還是蛋生雞”的悖論。

所以，你說(shuō)這種主流做法，到底算是開(kāi)源，還是閉源？

所以我造了一個(gè)詞，叫“混合開(kāi)閉源”模式，這其實(shí)才是真正的主流AI公司的常態(tài)。

如果把眼界再開(kāi)闊一點(diǎn)，我們還可以進(jìn)一步得出一個(gè)結(jié)論——成熟的軟件企業(yè)，很大程度上是開(kāi)源和閉源雙軌制的。

微軟可以是說(shuō)歷史上最堅(jiān)持閉源，甚至是對(duì)開(kāi)源深?lèi)和唇^的企業(yè)，其來(lái)自Windows和Office的滾滾財(cái)富，正是基于閉源的基礎(chǔ)之上。其前首席執(zhí)行官鮑爾默甚至抱怨稱(chēng)開(kāi)源的Linux“就像是癌癥病毒”。

但曾經(jīng)抵觸，不表示永久抵觸。事實(shí)上，意識(shí)到軟件行業(yè)的結(jié)構(gòu)發(fā)生深層次變化后，微軟于2018年以75億美元的巨資收購(gòu)GitHub，后者作為全球最大的開(kāi)源代碼托管平臺(tái)，擁有超過(guò)2800萬(wàn)開(kāi)發(fā)者用戶(hù)和1.2億代碼倉(cāng)庫(kù)，是開(kāi)發(fā)者社區(qū)的核心樞紐，也可以說(shuō)是微軟“死對(duì)頭”的聚集地。

微軟買(mǎi)下了曾經(jīng)被它稱(chēng)為“癌癥病毒”的開(kāi)源社區(qū)，是因?yàn)楹笳吣軌蛴行У姆?wù)于微軟的長(zhǎng)期策略。

在鮑爾默執(zhí)掌微軟的后期，這家企業(yè)其實(shí)已經(jīng)意識(shí)到，售賣(mài)操作系統(tǒng)和辦公軟件已經(jīng)是上一個(gè)時(shí)代的核心商業(yè)模式，微軟正在云計(jì)算時(shí)代掉隊(duì)。

而購(gòu)買(mǎi)GitHub后，則意味著其最突出的優(yōu)勢(shì)——代碼托管功能，可以與微軟的Azure云服務(wù)深度整合。說(shuō)的更具體一點(diǎn)，無(wú)論開(kāi)發(fā)者通過(guò)GitHub上要部署什么應(yīng)用，也無(wú)論其開(kāi)源或閉源屬性，微軟的Azure都將是默認(rèn)的首選。

從此，微軟成為GitHub的最大開(kāi)源貢獻(xiàn)者之一，并通過(guò)GitHub支持了大量開(kāi)源項(xiàng)目（如.NET框架、VS Code等），進(jìn)而重塑了上個(gè)世紀(jì)以來(lái)積累深重的“創(chuàng)新破壞者”的負(fù)面企業(yè)形象，進(jìn)而吸引了大量開(kāi)發(fā)者群體，客觀(guān)上成為了開(kāi)源時(shí)代最重要的“賣(mài)水人”之一。

這個(gè)例子有力的說(shuō)明了，單純的用支持開(kāi)源或不支持開(kāi)源來(lái)判斷一個(gè)企業(yè)的戰(zhàn)略是不準(zhǔn)確的，成功的企業(yè)必然會(huì)將兩者的優(yōu)勢(shì)集中起來(lái)，在不同的場(chǎng)景和商業(yè)模型下使用。

有限與無(wú)限

如果上一章我們是在一個(gè)非常宏觀(guān)的層面論述了在一個(gè)企業(yè)體系內(nèi)必然會(huì)兼容開(kāi)源和閉源這兩種形態(tài)，那么接下來(lái)要討論的則是，大模型企業(yè)會(huì)在什么樣的具體情況下選擇開(kāi)源或閉源？

基本的答案是，企業(yè)會(huì)根據(jù)具體的賽道場(chǎng)景和競(jìng)爭(zhēng)需求來(lái)加以靈活的選擇。

紐約大學(xué)宗教歷史學(xué)教授詹姆斯·卡斯在著名的哲學(xué)思維著作《有限與無(wú)限的游戲》提供了一個(gè)認(rèn)知世界的新觀(guān)點(diǎn)，他將世界比作“游戲”，并區(qū)分為有限游戲和無(wú)限游戲。有限游戲以取勝為目的，無(wú)限游戲以延續(xù)游戲?yàn)槟康摹?/p>

或許我們可以打一個(gè)這樣的比喻——有限游戲就好比短跑，需要在有限的時(shí)間內(nèi)釋放出最大的爆發(fā)力；而無(wú)限游戲就好比馬拉松，比拼的是如何在一個(gè)漫長(zhǎng)的競(jìng)爭(zhēng)過(guò)程中熬過(guò)重重難關(guān)并最終取勝。

所以，聰明的公司在面對(duì)需要短期內(nèi)制勝（效率導(dǎo)向）的時(shí)候，會(huì)選擇有限游戲模式；在面對(duì)長(zhǎng)期性的目標(biāo)或長(zhǎng)尾型的目標(biāo)（終局模式）時(shí)，則采取無(wú)限游戲模式。

閉源是典型的有限模式，它通常在目標(biāo)明確的時(shí)候被采用。例如，文心 4.0推出后，面臨的緊迫任務(wù)是盡快的降低推理成本，這時(shí)候集中優(yōu)質(zhì)資源打硬仗的“有限游戲”就成為了好的戰(zhàn)略選擇。事實(shí)也是如此，通過(guò)集中優(yōu)化和連續(xù)壓強(qiáng)式的工作，百度快速把這一版本的推理成本降到最初的1%，并明顯提升了性能。這種情況下，顯然必須依靠閉源模式來(lái)集中兵力打硬仗。

然而，這次開(kāi)源文心4.5的歷史背景已經(jīng)發(fā)生了很大的變化，這一版本被寄托的任務(wù)是加強(qiáng)滲透率和下載量，提高整個(gè)文心模型的普及率。這是一個(gè)非常長(zhǎng)周期、長(zhǎng)尾型的任務(wù)，在這種背景下，百度就自然會(huì)傾向于無(wú)限模式，這也是這次開(kāi)源的深層次原因。

事實(shí)上，這樣根據(jù)任務(wù)的不同屬性來(lái)靈活決定某一個(gè)版本的開(kāi)源屬性的方式，已經(jīng)成為AI特別是大模型領(lǐng)域的主流。

以開(kāi)源著稱(chēng)的通義千問(wèn)系列為例，其中7B、14B、72B等中小規(guī)模模型已開(kāi)源，魔搭社區(qū)里更是提供了成百上千的版本供開(kāi)發(fā)者自由下載和二次開(kāi)發(fā)。

但與此同時(shí)，300B等大規(guī)模模型（如通義千問(wèn)Max、Qwen3-235B-A22B等）則作為企業(yè)級(jí)云服務(wù)產(chǎn)品，因?yàn)槠涮匦允峭ㄟ^(guò)API或私有化部署提供給企業(yè)客戶(hù)，而且能夠用到這種強(qiáng)大模型的機(jī)構(gòu)，對(duì)私有化部署中的安全性、定制化和高性能都非常敏感，所以一定會(huì)選擇閉源模式。

圖：文心多模態(tài)后訓(xùn)練模型（支持思考、關(guān)閉思考）

在多個(gè)多模態(tài)基準(zhǔn)測(cè)試中達(dá)到SOTA水平

與之類(lèi)似的還有如谷歌開(kāi)源了Gemini 2B/7B模型以對(duì)抗Meta，這是一場(chǎng)長(zhǎng)期競(jìng)爭(zhēng)，所以選擇了開(kāi)源模式；但對(duì)于數(shù)據(jù)、安全訴求都處于高敏感區(qū)間的如醫(yī)療、自動(dòng)駕駛等領(lǐng)域，谷歌則提供了最高層次的閉源Gemini Ultra模型。

當(dāng)然，商業(yè)訴求僅僅是企業(yè)選擇開(kāi)閉源的決策要素之一而非全部，更長(zhǎng)久影響某個(gè)模型開(kāi)閉源的主要因素，來(lái)自于其要完成的利益使命。

從對(duì)模型充分發(fā)展的意義上來(lái)講，開(kāi)源的優(yōu)勢(shì)非常明顯，它可以集中智慧，顯著降低參與門(mén)檻，吸引大量開(kāi)發(fā)者、嘗試者，從某種程度上提高某一系列模型整體上的“市場(chǎng)占有率”，DeepSeek R1就是最好的例子；但開(kāi)源也有重要缺點(diǎn)，就是其貢獻(xiàn)沒(méi)有強(qiáng)制機(jī)制，導(dǎo)致其穩(wěn)定性欠佳。

例如，有研究者就指出，開(kāi)源代碼的貢獻(xiàn)者并不都是想象中那么“無(wú)私”——仍以GitHub為例，其社區(qū)中幾乎每天都有開(kāi)源項(xiàng)目因缺乏持續(xù)維護(hù)而被淘汰，而被淘汰的原因并非技術(shù)上的難以為繼，而是因?yàn)殚_(kāi)發(fā)者憑借已經(jīng)開(kāi)發(fā)的版本拿到了巨頭的收購(gòu)offer，進(jìn)而停止了對(duì)開(kāi)源項(xiàng)目的維護(hù)。

這個(gè)例子非常生動(dòng)的告訴我們，不用也沒(méi)有必要把開(kāi)源或閉源的選擇過(guò)于理想化，甚至提升到情懷層面。在真實(shí)世界里，無(wú)論是大企業(yè)還是個(gè)人開(kāi)發(fā)者，其選擇開(kāi)閉源的主要理由都是由現(xiàn)實(shí)的利益和競(jìng)爭(zhēng)的需求所決定的。

百度4.5開(kāi)源，打開(kāi)了一個(gè)新時(shí)代

百度斷然決定把4.5版本在6月30日開(kāi)源，是一個(gè)重要且敏捷的決定。

幾個(gè)月前，DeepSeek的發(fā)布，的確讓國(guó)內(nèi)的AI領(lǐng)域有一種瞬間“萬(wàn)馬齊喑”的感覺(jué)，特別是多年重度投入AI的大廠(chǎng)們更是受到了重重追問(wèn)。

帶著文心4.5 Turbo和文心X1 Turbo這兩個(gè)具有很強(qiáng)競(jìng)爭(zhēng)優(yōu)勢(shì)的新模型回歸，百度用這種方式表達(dá)了自己的生存哲學(xué)——不但要跟進(jìn)，還要打到終局模式。

客觀(guān)來(lái)講，DeepSeek的開(kāi)源（盡管其也有閉源版本），對(duì)公眾而言，是在開(kāi)源和閉源的天秤上，在“開(kāi)源”這一側(cè)放下了一顆重重的砝碼。

可以說(shuō)，從這一刻開(kāi)始，大模型競(jìng)爭(zhēng)從單純的對(duì)比參數(shù)、打榜、發(fā)論文，變成了真刀真槍的PK自家模型的行業(yè)滲透率和普及率。

我曾經(jīng)寫(xiě)過(guò)，百度AI的生存哲學(xué)，核心就是競(jìng)爭(zhēng)與創(chuàng)新。你也可以理解為，百度視AI核心業(yè)務(wù)的發(fā)展為一個(gè)非常長(zhǎng)期的競(jìng)爭(zhēng)過(guò)程，而技術(shù)創(chuàng)新是其生存競(jìng)爭(zhēng)優(yōu)勢(shì)得以存在的重要保證。

既需要拉升滲透率，又需要持續(xù)的投入一場(chǎng)創(chuàng)新和競(jìng)爭(zhēng)的馬拉松，顯而易見(jiàn)，這是一場(chǎng)“無(wú)限游戲”，所以百度毅然選擇了開(kāi)源模式。而且筆者甚至還猜測(cè)，在未來(lái)，對(duì)若干具有市場(chǎng)競(jìng)爭(zhēng)力的大版本持續(xù)開(kāi)源，或?qū)⒊蔀榘俣鹊囊环N新的模式。

之所以產(chǎn)生這樣的結(jié)果，最大的時(shí)代背景是——大模型已經(jīng)從“嘗新期”進(jìn)入成熟期，已經(jīng)從“炫技”變成“應(yīng)用為王”，目前各大勢(shì)力的核心目標(biāo)都已經(jīng)不再是飆指標(biāo)，而是希望迅速進(jìn)入千行百業(yè)的實(shí)際應(yīng)用場(chǎng)景中，通過(guò)占據(jù)場(chǎng)景來(lái)“分蛋糕”。這種情況下，開(kāi)源部分具有明顯優(yōu)勢(shì)的核心版本，是最有效、最及時(shí)的辦法。

百度本身就是國(guó)內(nèi)罕有的四層架構(gòu)俱全的全棧型AI公司，加之其擁有被成為“大模型的操作系統(tǒng)”的深度學(xué)習(xí)框架飛槳，這都讓百度有了維持一場(chǎng)長(zhǎng)期的，同時(shí)既比拼模型性能也比拼生態(tài)厚度的競(jìng)爭(zhēng)的前提條件，這也是4.5版本開(kāi)源的另一個(gè)宏觀(guān)戰(zhàn)略背景。

更具體的說(shuō)，一方面，文心4.5的開(kāi)源，以其優(yōu)異的性能，顯然能夠吸引更多開(kāi)發(fā)者參與到這一版模型的優(yōu)化與創(chuàng)新中來(lái)，從而匯聚各方智慧，加速模型性能的提升。

而另一方面，大模型的應(yīng)用普及期已經(jīng)開(kāi)啟，通過(guò)開(kāi)源，百度可以與上下游企業(yè)、科研機(jī)構(gòu)以及廣大開(kāi)發(fā)者建立更緊密的合作關(guān)系，共同探索大模型在更多領(lǐng)域的應(yīng)用，推動(dòng)整個(gè)行業(yè)的發(fā)展，從而切下更大的一塊“蛋糕”。

而除了以上的宏觀(guān)意義之外，從微觀(guān)層面來(lái)看，百度此次開(kāi)源，也將帶來(lái)更強(qiáng)的商業(yè)化效率。例如，一方面堅(jiān)持開(kāi)源基礎(chǔ)模型（文心4.5）吸引用戶(hù)，另一方面，通過(guò)千帆平臺(tái)企業(yè)版（MaaS服務(wù)），以及重點(diǎn)行業(yè)的私有化部署、定制化需求等實(shí)現(xiàn)高端盈利。

結(jié)語(yǔ)

百戰(zhàn)歸來(lái)，仍是少年

作為一個(gè)長(zhǎng)期跟蹤百度AI戰(zhàn)略的行業(yè)研究者，我當(dāng)然難以忘卻百度在前幾年對(duì)閉源模式的偏愛(ài)，以及其背后的原因，如認(rèn)為閉源模式更有效率等等。

所以，我也一度認(rèn)為，百度雖然必然會(huì)在某個(gè)時(shí)刻、某個(gè)版本上轉(zhuǎn)向開(kāi)源，但“偶像包袱”和“面子問(wèn)題”，都會(huì)引發(fā)爭(zhēng)議和困惑。

但是沒(méi)想到，說(shuō)轉(zhuǎn)就轉(zhuǎn)了，可謂快速?zèng)Q策，靈活轉(zhuǎn)身。

我為百度的干脆感到高興，從更深層次來(lái)說(shuō)，這不僅說(shuō)明了百度求真務(wù)實(shí)、洞察時(shí)代潮流變化的戰(zhàn)略洞察力，也說(shuō)明百度及其領(lǐng)導(dǎo)者身上仍然具有創(chuàng)業(yè)企業(yè)的靈活性和活力，對(duì)于一家創(chuàng)立了25年的公司來(lái)說(shuō)，能保留這種初心和活力，本身就是一種競(jìng)爭(zhēng)力。

或許，此前百度的追求中，除了發(fā)展AI技術(shù)創(chuàng)新以外，也有對(duì)自己是行業(yè)領(lǐng)頭羊的內(nèi)心驕傲。但現(xiàn)在看來(lái)，百度的追求變得更加務(wù)實(shí)和接地氣——在認(rèn)定“應(yīng)用”是目前的頭等大事后，百度可以說(shuō)方方面面的努力都是服務(wù)于“應(yīng)用”。但這種“服務(wù)”的本質(zhì)，是苦心經(jīng)營(yíng)自己的底層核心競(jìng)爭(zhēng)力、提升自家基礎(chǔ)大模型的核心能力和成本優(yōu)勢(shì)后，對(duì)行業(yè)能夠更好、更便宜的去應(yīng)用AI資源的一種最好的支持。

而這種努力的具象，就是眼前的這次開(kāi)源；我認(rèn)為這次開(kāi)源是百度的一道關(guān)口，過(guò)了這道關(guān)，百度會(huì)放下很多歷史包袱，會(huì)以更加靈活和充滿(mǎn)活力的姿態(tài)，參與AI賽道的長(zhǎng)跑，去爭(zhēng)取無(wú)盡游戲的終局勝利。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.