技術(shù)的偉大不在于它被誰(shuí)擁有,而在于它如何被使用。
——Linux之父Linus Torvalds
01
把開(kāi)源和閉源對(duì)立,很幼稚
隨著百度在6月30日正式開(kāi)源文心4.5系列的模型,一場(chǎng)關(guān)于大模型開(kāi)源和閉源的討論再次開(kāi)始。
值得一提的是,百度這次的開(kāi)源是“真開(kāi)源”,體現(xiàn)在開(kāi)源模型數(shù)量多、技術(shù)水平高。
從數(shù)量上來(lái)說(shuō),百度正式開(kāi)源的文心大模型4.5系列模型,涵蓋了47B、3B激活參數(shù)的混合專(zhuān)家(MoE)模型,與0.3B參數(shù)的稠密型模型等10款模型。
非常值得關(guān)注的是,這次開(kāi)源實(shí)現(xiàn)了預(yù)訓(xùn)練權(quán)重和推理代碼的完全開(kāi)源,也就是說(shuō),開(kāi)發(fā)者不但會(huì)知道百度在做什么,還知道怎么做。
這是諸多開(kāi)源形式中最徹底、最充分的一種形式,足見(jiàn)百度對(duì)這個(gè)版本開(kāi)源的決心之大、期望之高。
同樣需要提及的是,文心大模型4.5開(kāi)源系列均使用飛槳深度學(xué)習(xí)框架進(jìn)行高效訓(xùn)練、推理和部署。在大語(yǔ)言模型的預(yù)訓(xùn)練中,模型FLOPs利用率(MFU)達(dá)到47%。
圖:文心大模型4.5系列開(kāi)源模型
有飛槳和無(wú)飛槳,效果兩個(gè)樣,這個(gè)話(huà)題我們?nèi)蘸笤僬劇?/p>
有趣的是,圍繞百度開(kāi)源,業(yè)內(nèi)開(kāi)始再次辯論開(kāi)源和閉源的優(yōu)越性。
事實(shí)上,把開(kāi)源和閉源看作是完全對(duì)立的,很幼稚。
而之所以會(huì)產(chǎn)生這種幼稚的看法,是因?yàn)橐粋€(gè)長(zhǎng)期以來(lái)的刻板印象——開(kāi)源就是免費(fèi),閉源就是收費(fèi);開(kāi)源就是做奉獻(xiàn),閉源就是為了牟取暴利。
事實(shí)上,開(kāi)源和閉源只是一種階段性的戰(zhàn)略選擇,這個(gè)我們稍后細(xì)講。
先說(shuō)的絕對(duì)一點(diǎn),這世界上從來(lái)沒(méi)有只有開(kāi)源模式或只有閉源模式的頭部AI公司。
例如,Meta 開(kāi)源的 Llama 2 在社區(qū)貢獻(xiàn)下,推理速度提升了 47%,這是一個(gè)世界級(jí)的標(biāo)志性現(xiàn)象,也是很多開(kāi)源支持者津津樂(lè)道的一個(gè)案例。因?yàn)椋芏嚅_(kāi)源支持者認(rèn)為,能夠取得這樣的成績(jī),核心原因是開(kāi)源開(kāi)發(fā)者通過(guò)社區(qū)協(xié)作,集合全球開(kāi)發(fā)者的智慧,從而顯著提升了模型迭代速度。
但是,Meta所謂的開(kāi)源并不是無(wú)保留的。事實(shí)上,開(kāi)源的Llama系列依然保留了核心算法。同時(shí),其一方面以開(kāi)源姿態(tài),通過(guò)生態(tài)合作(如Hugging Face)擴(kuò)大影響力;同時(shí),仍有部分閉源模型針對(duì)用于商業(yè)化,如Meta AI企業(yè)服務(wù)。
再看一個(gè)例子,今年2月,Grok3正式發(fā)布,這款被馬斯克宣稱(chēng)為“地球上最聰明的AI”,引起了廣泛關(guān)注。
然而,馬斯克并未如外界所猜測(cè)那樣,當(dāng)場(chǎng)宣布開(kāi)源。
眾所周知,AI大模型業(yè)界,馬斯克被認(rèn)為是開(kāi)源的最核心支持者之一,尤其是在openAI轉(zhuǎn)向閉源之后,馬斯克甚至發(fā)起過(guò)訴訟。
但從馬斯克及其xAI的真實(shí)產(chǎn)品布局看,馬斯克并未如外界所設(shè)想的一樣,走“全開(kāi)源”路線(xiàn)。實(shí)際上,準(zhǔn)確的描述是,馬斯克只是宣布將在后續(xù)對(duì)上一代大模型即Grok2進(jìn)行開(kāi)源,最新的Grok3 則仍然走了閉源路線(xiàn)。
某種程度上,模型開(kāi)源+保留核心算法,或模型開(kāi)源但綁定收費(fèi)云服務(wù),才是業(yè)內(nèi)通行的做法。
客觀(guān)來(lái)講,這種做法有助于在維護(hù)市場(chǎng)普及率,保持技術(shù)領(lǐng)先性和加強(qiáng)商業(yè)競(jìng)爭(zhēng)力等三個(gè)需要兼顧的要素之間取得平衡——也就是通過(guò)對(duì)非最新一代(或即將迭代)的模型進(jìn)行開(kāi)源,以實(shí)現(xiàn)擴(kuò)大用戶(hù)基礎(chǔ)、收集多樣化數(shù)據(jù),從而推動(dòng)AI模型的持續(xù)迭代的目的;另一方面,對(duì)于最新的或高端的模型,通過(guò)直接或間接的方式來(lái)收費(fèi)或與收費(fèi)服務(wù)綁定,來(lái)平衡成本。
畢竟,大模型是一種非常昂貴的造物,其訓(xùn)練過(guò)程中需要的海量算力和數(shù)據(jù)集客觀(guān)上需要大量的集中式投入,如果沒(méi)有一種相對(duì)平衡的成本回收機(jī)制,任何一家財(cái)雄勢(shì)大的AI公司都無(wú)法持續(xù)的提供開(kāi)源,這是一個(gè)典型的“雞生蛋還是蛋生雞”的悖論。
所以,你說(shuō)這種主流做法,到底算是開(kāi)源,還是閉源?
所以我造了一個(gè)詞,叫“混合開(kāi)閉源”模式,這其實(shí)才是真正的主流AI公司的常態(tài)。
如果把眼界再開(kāi)闊一點(diǎn),我們還可以進(jìn)一步得出一個(gè)結(jié)論——成熟的軟件企業(yè),很大程度上是開(kāi)源和閉源雙軌制的。
微軟可以是說(shuō)歷史上最堅(jiān)持閉源,甚至是對(duì)開(kāi)源深?lèi)和唇^的企業(yè),其來(lái)自Windows和Office的滾滾財(cái)富,正是基于閉源的基礎(chǔ)之上。其前首席執(zhí)行官鮑爾默甚至抱怨稱(chēng)開(kāi)源的Linux“就像是癌癥病毒”。
但曾經(jīng)抵觸,不表示永久抵觸。事實(shí)上,意識(shí)到軟件行業(yè)的結(jié)構(gòu)發(fā)生深層次變化后,微軟于2018年以75億美元的巨資收購(gòu)GitHub,后者作為全球最大的開(kāi)源代碼托管平臺(tái),擁有超過(guò)2800萬(wàn)開(kāi)發(fā)者用戶(hù)和1.2億代碼倉(cāng)庫(kù),是開(kāi)發(fā)者社區(qū)的核心樞紐,也可以說(shuō)是微軟“死對(duì)頭”的聚集地。
微軟買(mǎi)下了曾經(jīng)被它稱(chēng)為“癌癥病毒”的開(kāi)源社區(qū),是因?yàn)楹笳吣軌蛴行У姆?wù)于微軟的長(zhǎng)期策略。
在鮑爾默執(zhí)掌微軟的后期,這家企業(yè)其實(shí)已經(jīng)意識(shí)到,售賣(mài)操作系統(tǒng)和辦公軟件已經(jīng)是上一個(gè)時(shí)代的核心商業(yè)模式,微軟正在云計(jì)算時(shí)代掉隊(duì)。
而購(gòu)買(mǎi)GitHub后,則意味著其最突出的優(yōu)勢(shì)——代碼托管功能,可以與微軟的Azure云服務(wù)深度整合。說(shuō)的更具體一點(diǎn),無(wú)論開(kāi)發(fā)者通過(guò)GitHub上要部署什么應(yīng)用,也無(wú)論其開(kāi)源或閉源屬性,微軟的Azure都將是默認(rèn)的首選。
從此,微軟成為GitHub的最大開(kāi)源貢獻(xiàn)者之一,并通過(guò)GitHub支持了大量開(kāi)源項(xiàng)目(如.NET框架、VS Code等),進(jìn)而重塑了上個(gè)世紀(jì)以來(lái)積累深重的“創(chuàng)新破壞者”的負(fù)面企業(yè)形象,進(jìn)而吸引了大量開(kāi)發(fā)者群體,客觀(guān)上成為了開(kāi)源時(shí)代最重要的“賣(mài)水人”之一。
這個(gè)例子有力的說(shuō)明了,單純的用支持開(kāi)源或不支持開(kāi)源來(lái)判斷一個(gè)企業(yè)的戰(zhàn)略是不準(zhǔn)確的,成功的企業(yè)必然會(huì)將兩者的優(yōu)勢(shì)集中起來(lái),在不同的場(chǎng)景和商業(yè)模型下使用。
02
有限與無(wú)限
如果上一章我們是在一個(gè)非常宏觀(guān)的層面論述了在一個(gè)企業(yè)體系內(nèi)必然會(huì)兼容開(kāi)源和閉源這兩種形態(tài),那么接下來(lái)要討論的則是,大模型企業(yè)會(huì)在什么樣的具體情況下選擇開(kāi)源或閉源?
基本的答案是,企業(yè)會(huì)根據(jù)具體的賽道場(chǎng)景和競(jìng)爭(zhēng)需求來(lái)加以靈活的選擇。
紐約大學(xué)宗教歷史學(xué)教授詹姆斯·卡斯在著名的哲學(xué)思維著作《有限與無(wú)限的游戲》提供了一個(gè)認(rèn)知世界的新觀(guān)點(diǎn),他將世界比作“游戲”,并區(qū)分為有限游戲和無(wú)限游戲。有限游戲以取勝為目的,無(wú)限游戲以延續(xù)游戲?yàn)槟康摹?/p>
或許我們可以打一個(gè)這樣的比喻——有限游戲就好比短跑,需要在有限的時(shí)間內(nèi)釋放出最大的爆發(fā)力;而無(wú)限游戲就好比馬拉松,比拼的是如何在一個(gè)漫長(zhǎng)的競(jìng)爭(zhēng)過(guò)程中熬過(guò)重重難關(guān)并最終取勝。
所以,聰明的公司在面對(duì)需要短期內(nèi)制勝(效率導(dǎo)向)的時(shí)候,會(huì)選擇有限游戲模式;在面對(duì)長(zhǎng)期性的目標(biāo)或長(zhǎng)尾型的目標(biāo)(終局模式)時(shí),則采取無(wú)限游戲模式。
閉源是典型的有限模式,它通常在目標(biāo)明確的時(shí)候被采用。例如,文心 4.0推出后,面臨的緊迫任務(wù)是盡快的降低推理成本,這時(shí)候集中優(yōu)質(zhì)資源打硬仗的“有限游戲”就成為了好的戰(zhàn)略選擇。事實(shí)也是如此,通過(guò)集中優(yōu)化和連續(xù)壓強(qiáng)式的工作,百度快速把這一版本的推理成本降到最初的1%,并明顯提升了性能。這種情況下,顯然必須依靠閉源模式來(lái)集中兵力打硬仗。
然而,這次開(kāi)源文心4.5的歷史背景已經(jīng)發(fā)生了很大的變化,這一版本被寄托的任務(wù)是加強(qiáng)滲透率和下載量,提高整個(gè)文心模型的普及率。這是一個(gè)非常長(zhǎng)周期、長(zhǎng)尾型的任務(wù),在這種背景下,百度就自然會(huì)傾向于無(wú)限模式,這也是這次開(kāi)源的深層次原因。
事實(shí)上,這樣根據(jù)任務(wù)的不同屬性來(lái)靈活決定某一個(gè)版本的開(kāi)源屬性的方式,已經(jīng)成為AI特別是大模型領(lǐng)域的主流。
以開(kāi)源著稱(chēng)的通義千問(wèn)系列為例,其中7B、14B、72B等中小規(guī)模模型已開(kāi)源,魔搭社區(qū)里更是提供了成百上千的版本供開(kāi)發(fā)者自由下載和二次開(kāi)發(fā)。
但與此同時(shí),300B等大規(guī)模模型(如通義千問(wèn)Max、Qwen3-235B-A22B等)則作為企業(yè)級(jí)云服務(wù)產(chǎn)品,因?yàn)槠涮匦允峭ㄟ^(guò)API或私有化部署提供給企業(yè)客戶(hù),而且能夠用到這種強(qiáng)大模型的機(jī)構(gòu),對(duì)私有化部署中的安全性、定制化和高性能都非常敏感,所以一定會(huì)選擇閉源模式。
圖:文心多模態(tài)后訓(xùn)練模型(支持思考、關(guān)閉思考)
在多個(gè)多模態(tài)基準(zhǔn)測(cè)試中達(dá)到SOTA水平
與之類(lèi)似的還有如谷歌開(kāi)源了Gemini 2B/7B模型以對(duì)抗Meta,這是一場(chǎng)長(zhǎng)期競(jìng)爭(zhēng),所以選擇了開(kāi)源模式;但對(duì)于數(shù)據(jù)、安全訴求都處于高敏感區(qū)間的如醫(yī)療、自動(dòng)駕駛等領(lǐng)域,谷歌則提供了最高層次的閉源Gemini Ultra模型。
當(dāng)然,商業(yè)訴求僅僅是企業(yè)選擇開(kāi)閉源的決策要素之一而非全部,更長(zhǎng)久影響某個(gè)模型開(kāi)閉源的主要因素,來(lái)自于其要完成的利益使命。
從對(duì)模型充分發(fā)展的意義上來(lái)講,開(kāi)源的優(yōu)勢(shì)非常明顯,它可以集中智慧,顯著降低參與門(mén)檻,吸引大量開(kāi)發(fā)者、嘗試者,從某種程度上提高某一系列模型整體上的“市場(chǎng)占有率”,DeepSeek R1就是最好的例子;但開(kāi)源也有重要缺點(diǎn),就是其貢獻(xiàn)沒(méi)有強(qiáng)制機(jī)制,導(dǎo)致其穩(wěn)定性欠佳。
例如,有研究者就指出,開(kāi)源代碼的貢獻(xiàn)者并不都是想象中那么“無(wú)私”——仍以GitHub為例,其社區(qū)中幾乎每天都有開(kāi)源項(xiàng)目因缺乏持續(xù)維護(hù)而被淘汰,而被淘汰的原因并非技術(shù)上的難以為繼,而是因?yàn)殚_(kāi)發(fā)者憑借已經(jīng)開(kāi)發(fā)的版本拿到了巨頭的收購(gòu)offer,進(jìn)而停止了對(duì)開(kāi)源項(xiàng)目的維護(hù)。
這個(gè)例子非常生動(dòng)的告訴我們,不用也沒(méi)有必要把開(kāi)源或閉源的選擇過(guò)于理想化,甚至提升到情懷層面。在真實(shí)世界里,無(wú)論是大企業(yè)還是個(gè)人開(kāi)發(fā)者,其選擇開(kāi)閉源的主要理由都是由現(xiàn)實(shí)的利益和競(jìng)爭(zhēng)的需求所決定的。
03
百度4.5開(kāi)源,打開(kāi)了一個(gè)新時(shí)代
百度斷然決定把4.5版本在6月30日開(kāi)源,是一個(gè)重要且敏捷的決定。
幾個(gè)月前,DeepSeek的發(fā)布,的確讓國(guó)內(nèi)的AI領(lǐng)域有一種瞬間“萬(wàn)馬齊喑”的感覺(jué),特別是多年重度投入AI的大廠(chǎng)們更是受到了重重追問(wèn)。
帶著文心4.5 Turbo和文心X1 Turbo這兩個(gè)具有很強(qiáng)競(jìng)爭(zhēng)優(yōu)勢(shì)的新模型回歸,百度用這種方式表達(dá)了自己的生存哲學(xué)——不但要跟進(jìn),還要打到終局模式。
客觀(guān)來(lái)講,DeepSeek的開(kāi)源(盡管其也有閉源版本),對(duì)公眾而言,是在開(kāi)源和閉源的天秤上,在“開(kāi)源”這一側(cè)放下了一顆重重的砝碼。
可以說(shuō),從這一刻開(kāi)始,大模型競(jìng)爭(zhēng)從單純的對(duì)比參數(shù)、打榜、發(fā)論文,變成了真刀真槍的PK自家模型的行業(yè)滲透率和普及率。
我曾經(jīng)寫(xiě)過(guò),百度AI的生存哲學(xué),核心就是競(jìng)爭(zhēng)與創(chuàng)新。你也可以理解為,百度視AI核心業(yè)務(wù)的發(fā)展為一個(gè)非常長(zhǎng)期的競(jìng)爭(zhēng)過(guò)程,而技術(shù)創(chuàng)新是其生存競(jìng)爭(zhēng)優(yōu)勢(shì)得以存在的重要保證。
既需要拉升滲透率,又需要持續(xù)的投入一場(chǎng)創(chuàng)新和競(jìng)爭(zhēng)的馬拉松,顯而易見(jiàn),這是一場(chǎng)“無(wú)限游戲”,所以百度毅然選擇了開(kāi)源模式。而且筆者甚至還猜測(cè),在未來(lái),對(duì)若干具有市場(chǎng)競(jìng)爭(zhēng)力的大版本持續(xù)開(kāi)源,或?qū)⒊蔀榘俣鹊囊环N新的模式。
之所以產(chǎn)生這樣的結(jié)果,最大的時(shí)代背景是——大模型已經(jīng)從“嘗新期”進(jìn)入成熟期,已經(jīng)從“炫技”變成“應(yīng)用為王”,目前各大勢(shì)力的核心目標(biāo)都已經(jīng)不再是飆指標(biāo),而是希望迅速進(jìn)入千行百業(yè)的實(shí)際應(yīng)用場(chǎng)景中,通過(guò)占據(jù)場(chǎng)景來(lái)“分蛋糕”。這種情況下,開(kāi)源部分具有明顯優(yōu)勢(shì)的核心版本,是最有效、最及時(shí)的辦法。
百度本身就是國(guó)內(nèi)罕有的四層架構(gòu)俱全的全棧型AI公司,加之其擁有被成為“大模型的操作系統(tǒng)”的深度學(xué)習(xí)框架飛槳,這都讓百度有了維持一場(chǎng)長(zhǎng)期的,同時(shí)既比拼模型性能也比拼生態(tài)厚度的競(jìng)爭(zhēng)的前提條件,這也是4.5版本開(kāi)源的另一個(gè)宏觀(guān)戰(zhàn)略背景。
更具體的說(shuō),一方面,文心4.5的開(kāi)源,以其優(yōu)異的性能,顯然能夠吸引更多開(kāi)發(fā)者參與到這一版模型的優(yōu)化與創(chuàng)新中來(lái),從而匯聚各方智慧,加速模型性能的提升。
而另一方面,大模型的應(yīng)用普及期已經(jīng)開(kāi)啟,通過(guò)開(kāi)源,百度可以與上下游企業(yè)、科研機(jī)構(gòu)以及廣大開(kāi)發(fā)者建立更緊密的合作關(guān)系,共同探索大模型在更多領(lǐng)域的應(yīng)用,推動(dòng)整個(gè)行業(yè)的發(fā)展,從而切下更大的一塊“蛋糕”。
而除了以上的宏觀(guān)意義之外,從微觀(guān)層面來(lái)看,百度此次開(kāi)源,也將帶來(lái)更強(qiáng)的商業(yè)化效率。例如,一方面堅(jiān)持開(kāi)源基礎(chǔ)模型(文心4.5)吸引用戶(hù),另一方面,通過(guò)千帆平臺(tái)企業(yè)版(MaaS服務(wù)),以及重點(diǎn)行業(yè)的私有化部署、定制化需求等實(shí)現(xiàn)高端盈利。
結(jié)語(yǔ)
百戰(zhàn)歸來(lái),仍是少年
作為一個(gè)長(zhǎng)期跟蹤百度AI戰(zhàn)略的行業(yè)研究者,我當(dāng)然難以忘卻百度在前幾年對(duì)閉源模式的偏愛(ài),以及其背后的原因,如認(rèn)為閉源模式更有效率等等。
所以,我也一度認(rèn)為,百度雖然必然會(huì)在某個(gè)時(shí)刻、某個(gè)版本上轉(zhuǎn)向開(kāi)源,但“偶像包袱”和“面子問(wèn)題”,都會(huì)引發(fā)爭(zhēng)議和困惑。
但是沒(méi)想到,說(shuō)轉(zhuǎn)就轉(zhuǎn)了,可謂快速?zèng)Q策,靈活轉(zhuǎn)身。
我為百度的干脆感到高興,從更深層次來(lái)說(shuō),這不僅說(shuō)明了百度求真務(wù)實(shí)、洞察時(shí)代潮流變化的戰(zhàn)略洞察力,也說(shuō)明百度及其領(lǐng)導(dǎo)者身上仍然具有創(chuàng)業(yè)企業(yè)的靈活性和活力,對(duì)于一家創(chuàng)立了25年的公司來(lái)說(shuō),能保留這種初心和活力,本身就是一種競(jìng)爭(zhēng)力。
或許,此前百度的追求中,除了發(fā)展AI技術(shù)創(chuàng)新以外,也有對(duì)自己是行業(yè)領(lǐng)頭羊的內(nèi)心驕傲。但現(xiàn)在看來(lái),百度的追求變得更加務(wù)實(shí)和接地氣——在認(rèn)定“應(yīng)用”是目前的頭等大事后,百度可以說(shuō)方方面面的努力都是服務(wù)于“應(yīng)用”。但這種“服務(wù)”的本質(zhì),是苦心經(jīng)營(yíng)自己的底層核心競(jìng)爭(zhēng)力、提升自家基礎(chǔ)大模型的核心能力和成本優(yōu)勢(shì)后,對(duì)行業(yè)能夠更好、更便宜的去應(yīng)用AI資源的一種最好的支持。
而這種努力的具象,就是眼前的這次開(kāi)源;我認(rèn)為這次開(kāi)源是百度的一道關(guān)口,過(guò)了這道關(guān),百度會(huì)放下很多歷史包袱,會(huì)以更加靈活和充滿(mǎn)活力的姿態(tài),參與AI賽道的長(zhǎng)跑,去爭(zhēng)取無(wú)盡游戲的終局勝利。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.