剛從火山FORCE大會回來,心情真的比較激動啊,這次更新的內容非常多,我準時到的現場結果根本擠不進去,但是我還是從開始一直站到結束聽完了。
這次核心發布內容就是Doubao-Seed-2.1 Pro和Turbo模型,重點強化了Coding、Agent 長鏈路任務、多模態理解的幾個方向。另外還有面向企業的很多產品和服務。
然后多模態的方向,Seedream 5.0 Pro,Seedance 系列有更新。
圖片模型預告了Seedream 5.0 Pro,主打交互式的精準編輯、并且可以多圖層分離、也可以生成高密度信息圖了、并且可以原生生成多語種文字、還可以直出可編輯分層設計圖。
這些對設計方向的朋友會很實用,以后如果我們想基于 AI 生成的圖片,直接進行多圖層分離、進一步編輯和修改,都會非常方便。對于電商方向,直出多語種文字也相當方便。
我現場看演示的圖片效果,目前沒有測試,暫時沒有發言權。但我感覺至少比肩 Nano Banana 2 應該是沒問題的了。
Seedance 2.0系列的4K模式這個好像發布了,以及Seedance 2.5也已經在預熱了。2.0在1080P的時候已經是生產級模型了,現在4K指令更加精準、運動表現也有明顯提升,可以滿足更多商業向的需求,個人向玩的話真的會比較燒錢,但對于有創意和想法的創作者,這個能讓自己的作品達到更極致的效果。
Seedance 2.5系列視頻模型,預計也快和大家見面了,大概7月份。它主打最長30秒單段原生視頻、最多可以50個全模態素材聯合生成、一致性局部編輯。它有一個黑科技,會先生成3D白模再生成,它的重點已經從prompt視頻走向多素材導演工作流了。
除了這兩個以外,這次還發布了包括語音、音頻、3D等方向的模型。
音頻這個,音頻作品生成的模型單次可以做到兩分鐘的完整的音頻作品,并且支持完整的音軌生成。功能包括:可以通過文本加上參考音頻進行輸入,支持多角色對白,可以添加背景音樂、環境音效以及擬音。就這還只是1.0 ,真的太卷了。
另外還有音樂生成模型,已經可以在即夢體驗了。
目前看來整個視頻創作的鏈路都已經可以用它完全打通了。
接下來可能像即夢這樣的平臺就可以直接實現從生圖、視頻、配音,甚至后續的背景音樂,都通過一個平臺或一個品牌的模型去從頭到尾完成。他們真的下了好大一盤棋。
今天確實覺得很激動,我們也在見證國內的模型確實在一步步穩步前進,走得更好了。
期待能早早體驗到這些模型,感受一下它們的實際效果。后續等我體驗到我再繼續分享了,期待大家再去看我的測評[嘿哈]
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.