品玩5月8日訊,Krisp近日宣布,正式發布VIVA 2.0語音AI基礎設施層,旨在解決語音智能體在復雜環境下的交互難題。該更新引入了新一代實時模型,在語音轉文字(STT)前處理音頻信號,顯著降低錯誤率并提升對話自然度。
VIVA 2.0核心升級包括Turn Prediction v3,可僅憑音頻預測對話輪次結束,避免打斷用戶;以及首創的Interrupt Prediction v1,能區分用戶插話意圖與背景附和。此外,新增TTS、口音及性別檢測器,使AI能識別合成語音并適應不同說話特征。
目前,VIVA SDK年處理流量超120億分鐘,集成于Daily、Vapi等130多款產品。Telnyx CEO David Casem表示,該方案從源頭提升了信號質量。Krisp高管Robert Schoenfield強調,VIVA讓AI能適應真實世界的交互環境。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.