近日,豆包APP實時語音通話功能升級,上線全雙工語音大模型Seeduplex。據介紹,作為原生全雙工端到端語音大模型,Seeduplex能夠在復雜聲學場景下實現精準抗干擾與動態判停,提供更順暢、更自然的語音交互體驗。
此次更新后,豆包實時語音通話功能在對話自然度、響應速度和抗干擾能力等方面均有提升。
記者實測發現,升級后的豆包語音通話在復雜環境下表現出較強的抗干擾能力,即便周圍存在人聲和噪音干擾,也能較準確地識別用戶語音,不易被無關聲音帶偏。以餐廳、展覽等易出現多人交談的場景為例,過往AI產品容易因背景噪音或旁人說話聲出現誤打斷、誤回復等情況;此次升級后,豆包對無關聲音的過濾能力有所增強,對話過程也更不容易被人聲意外打斷。
除抗干擾能力外,升級后的語音對話節奏也更接近自然交流。人與人對話中,停頓并不總意味著發言結束。此次升級后,豆包可結合語音與語義信息判斷用戶是否仍在繼續表達,從而減少對話中的“搶話”現象。與此同時,對話響應時延也進一步降低,在接龍、飛花令等高頻互動場景中表現更為明顯。
目前,這一能力已在豆包APP上線。用戶可點擊“打電話”按鈕,開啟實時語音通話功能體驗。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.