5月22日,網易有道宣布,決定將“子曰”大模型4.0的核心雙引擎 ——“多模態模型”與“語音合成(TTS)模型”,正式面向全球全量開源。開發者可以免費下載、部署,并基于此進行二次開發。
![]()
其中一個較為引人矚目的點在于它的【語音克隆】功能。
簡單概括這個功能:錄一段你說話的聲音,AI 就能用你的音色,帶著你的情緒,說 14 種語言的任何語句,而且聽不出是外國人說的。
操作實例:
對此,一位有著過萬關注者的技術大V做出了如下評價:
網易有道這不聲不響就把子曰4給開源了,27B的參數量,數理能力直接沖到SOTA。
不過說實話,我最在意的倒不是這個——而是它的語音克隆能力。
![]()
Labs老早就能做。但有個老毛病一直沒人真正解決:跨語種的時候會自帶口音。你拿中文聲音去講日語,聽著就是個外國人在那兒硬凹,真是尬到腳趾摳地。
子曰4這次就是奔著這個痛點來的——你的聲音講日語,聽著就像地道的日本人在說話。3秒就能克隆,覆蓋14種語言,做口播配音數字人,省錢又好用。
更關鍵的是,這回是真開源——人家給的是真權重而不是只給API,整整54個G直接讓你下,還能本地跑。連有道那個龍蝦智能體也一并開源了。
第一,不妨親自去試試這個語音克隆:傳一段你自己的聲音,讓它說外語,親耳聽聽到底帶不帶口音。
在線試玩:confucius4-tts.youdao.com/gradio
第二,覺得這波開源確實夠意思,就去給它點個star支持一下。
多模態模型:https://huggingface.co/netease-youdao/Confucius4
語音模型:https://github.com/netease-youdao/Confucius4-TTShttps://github.com/netease-youdao/Confucius4-TTS
延伸閱讀:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.