今天,百度正式發(fā)布文心大模型 5.1。
有兩件事我覺(jué)得值得嘮嘮,方向都挺有意思。
————
1、搜索能力
文心 5.1 以 1223 分登上 LMArena Search Arena 搜索榜,國(guó)內(nèi)第一、全球第四。圖三
更關(guān)鍵的是,它是這個(gè)榜單上目前唯一上榜的國(guó)產(chǎn)模型。
所謂「搜索能力」,早就不是我們以為的「上網(wǎng)搜答案」。
它考驗(yàn)的是模型能不能同時(shí)看多個(gè)信息源,再把結(jié)果整合成一個(gè)更靠譜、更一致的回答。
說(shuō)白了,AI 胡編亂造的老毛病,這次多少能松點(diǎn)氣了。
百度把自己最熟的老本行,重新打回了大模型時(shí)代的牌桌中央。
2、預(yù)訓(xùn)練成本
文心 5.1 用的是「多維彈性預(yù)訓(xùn)練」,文心 5.0 那會(huì)兒就放過(guò)風(fēng)的一套技術(shù)。
帶來(lái)的結(jié)果挺直接,總參數(shù)壓到約 1/3,激活參數(shù)壓到約 1/2。圖四
預(yù)訓(xùn)練成本,只有業(yè)界同規(guī)模模型的約 6%。(ps..從deepseek開(kāi)始,大家都在預(yù)訓(xùn)練成本上卷起來(lái)了- -)圖五
翻了下今天放出的技術(shù)報(bào)告,做法其實(shí)挺巧:文心 5.1 不是從零起訓(xùn),而是從文心 5.0 的「子模型族」里直接抽出一個(gè)最優(yōu)子網(wǎng),把 5.0 的知識(shí)完整繼承過(guò)來(lái)。圖六
再配合一套 Once-For-All 彈性訓(xùn)練框架,在深度、寬度、稀疏度三個(gè)維度上動(dòng)態(tài)調(diào)節(jié),一次訓(xùn)練就能產(chǎn)出多種規(guī)模的模型。
不重頭訓(xùn),成本自然就被壓下去了。而且搜索榜上的成績(jī)也說(shuō)明:能力并沒(méi)有被明顯犧牲。
報(bào)告見(jiàn):https://ernie.baidu.com/blog/posts/ernie-5.1-0508-release/
————
這次發(fā)布,正好在 5.13號(hào) 百度 Create 2026 大會(huì)前,很好奇現(xiàn)場(chǎng)還有什么大招。
百度在搜索這件事上的積累不是吹出來(lái)的,二十多年的老本行。
老本行碰上大模型這一波,還能整出哪些「花活」?
到時(shí)候我會(huì)和AI KOL們一起去現(xiàn)場(chǎng),給大家?guī)Щ氐谝皇钟^察。
#LMArena #AI #AI大模型 #文心 #文心大模型 #百度Create大會(huì)2026
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.