3月31日,百度發(fā)布業(yè)界首個(gè)基于全新互相關(guān)注意力(Cross-Attention)的端到端語(yǔ)音語(yǔ)言大模型,實(shí)現(xiàn)超低時(shí)延與超低成本,在電話語(yǔ)音頻道的語(yǔ)音問(wèn)答場(chǎng)景中,調(diào)用成本較行業(yè)均值下降約50%-90%。文小言率先接入該模型,還帶來(lái)多模型融合調(diào)度、圖片問(wèn)答等功能升級(jí)。接入全新的端到端語(yǔ)音語(yǔ)言大模型后,文小言不僅能支持更擬真的語(yǔ)聊效果,而且支持重慶、廣西、河南、廣東、山東等特色方言。語(yǔ)音大模型具備極低的訓(xùn)練和使用成本,極快的推理響應(yīng)速度,語(yǔ)音交互時(shí),可將用戶等待時(shí)長(zhǎng)從行業(yè)常見(jiàn)的3-5秒降低至1秒左右。更新后的文小言還支持“多模型融合調(diào)度”,通過(guò)整合百度自研的文心X1、文心4.5等頂尖模型,并接入DeepSeek-R1等第三方優(yōu)質(zhì)模型,實(shí)現(xiàn)了多模型間的智能協(xié)同。同時(shí),文小言還加強(qiáng)了圖片問(wèn)答功能,用戶拍攝或上傳圖片,以文字或語(yǔ)音提問(wèn)即可直接獲取深度解析。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.