![]()
【產品發布】美國科技公司谷歌于2026年6月9日正式推出全新音頻AI模型Gemini 3.5 Live Translate,旨在為跨語言交流提供更接近真實對話節奏的實時翻譯體驗。據CNET報道,該工具目前已向開發者和合作伙伴開放,可被集成至會議系統、通訊平臺及移動應用中。
【核心功能】與傳統翻譯系統需等待一方講完后再翻譯不同,Gemini 3.5 Live Translate采用持續流式翻譯技術,能夠同時進行聽取、翻譯和發聲,僅有數秒延遲。該模型可自動識別口語語言,支持超過70種語言,并可在同一對話中實現數千種語言配對的切換。
【場景適配】谷歌方面表示,新模型針對日常交流的真實環境進行了優化,可在嘈雜背景下工作,能夠處理背景噪音、聲音重疊以及非正式口語表達,適用于客服通話、導覽講解、課堂教學、網約車服務以及現場直播等多種場景。
【語音質量】在語音合成方面,Gemini 3.5 Live Translate不再使用千篇一律的合成音,而是嘗試保留原說話者的語速、語調和情感色彩,使翻譯后的語音更貼近自然表達,便于聽者跟進對話內容。
【應用前景】谷歌表示,此次發布的目標是讓實時翻譯走出演示場景,融入日常溝通。通過實現近乎實時的多語言交流,且無需說話者改變表達習慣,該技術有望讓跨語言交流在企業、組織和個人層面變得更加便捷實用。
參考鏈接:
https://www.cnet.com/tech/services-and-software/gemini-3-5-live-translation-real-time-multilingual-conversation/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.