網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

剛剛，文心5.1 沖進(jìn) Search Arena 全球第四

2026-05-09 13:41:49　來(lái)源: 甲木未來(lái)派

北京舉報(bào)

分享至

今天，百度正式發(fā)布文心大模型 5.1。
有兩件事我覺(jué)得值得嘮嘮，方向都挺有意思。
————
1、搜索能力
文心 5.1 以 1223 分登上 LMArena Search Arena 搜索榜，國(guó)內(nèi)第一、全球第四。圖三
更關(guān)鍵的是，它是這個(gè)榜單上目前唯一上榜的國(guó)產(chǎn)模型。
所謂「搜索能力」，早就不是我們以為的「上網(wǎng)搜答案」。
它考驗(yàn)的是模型能不能同時(shí)看多個(gè)信息源，再把結(jié)果整合成一個(gè)更靠譜、更一致的回答。
說(shuō)白了，AI 胡編亂造的老毛病，這次多少能松點(diǎn)氣了。
百度把自己最熟的老本行，重新打回了大模型時(shí)代的牌桌中央。

2、預(yù)訓(xùn)練成本
文心 5.1 用的是「多維彈性預(yù)訓(xùn)練」，文心 5.0 那會(huì)兒就放過(guò)風(fēng)的一套技術(shù)。
帶來(lái)的結(jié)果挺直接，總參數(shù)壓到約 1/3，激活參數(shù)壓到約 1/2。圖四

預(yù)訓(xùn)練成本，只有業(yè)界同規(guī)模模型的約 6%。（ps..從deepseek開(kāi)始，大家都在預(yù)訓(xùn)練成本上卷起來(lái)了- -）圖五

翻了下今天放出的技術(shù)報(bào)告，做法其實(shí)挺巧：文心 5.1 不是從零起訓(xùn)，而是從文心 5.0 的「子模型族」里直接抽出一個(gè)最優(yōu)子網(wǎng)，把 5.0 的知識(shí)完整繼承過(guò)來(lái)。圖六

再配合一套 Once-For-All 彈性訓(xùn)練框架，在深度、寬度、稀疏度三個(gè)維度上動(dòng)態(tài)調(diào)節(jié)，一次訓(xùn)練就能產(chǎn)出多種規(guī)模的模型。

不重頭訓(xùn)，成本自然就被壓下去了。而且搜索榜上的成績(jī)也說(shuō)明：能力并沒(méi)有被明顯犧牲。

報(bào)告見(jiàn)：https://ernie.baidu.com/blog/posts/ernie-5.1-0508-release/
————
這次發(fā)布，正好在 5.13號(hào) 百度 Create 2026 大會(huì)前，很好奇現(xiàn)場(chǎng)還有什么大招。

百度在搜索這件事上的積累不是吹出來(lái)的，二十多年的老本行。
老本行碰上大模型這一波，還能整出哪些「花活」?

到時(shí)候我會(huì)和AI KOL們一起去現(xiàn)場(chǎng)，給大家?guī)Щ氐谝皇钟^察。

#LMArena #AI #AI大模型 #文心 #文心大模型 #百度Create大會(huì)2026

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.