現象級AI視頻技術、字節Seedance 2.0在arXiv發論文了。
![]()
曬了26頁的Benchmark,和貢獻者名單。
170位團隊成員全公開,署名和尊重都拉滿了,不過嘛這就不怕……嘛?
![]()
論文公布的時間節點,正趕上Seedance 2.0通過Byteplus平臺鋪向全球。
100多個國家的企業客戶可以通過預付費API直接調用。支持文字、圖片、視頻、音頻多模態輸入,生成4到15秒MP4視頻,最高720p。
但這個“全球”列表里,唯獨沒有美國。
![]()
26頁只寫了兩個字:能打
首先看標題,說成大白話就是“讓AI視頻生成能搞定現實世界里的各種復雜場景”。
為了做到這一點,Seedance解決了過去生成式視頻工具的一個瓶頸:
通常依靠單文本輸入,在嘗試引用真實素材(品牌圖片、配音、先前的視頻片段)時難以保持一致性,并且需要大量的反復試驗才能制作出可用的作品。
對于創作者而言,這意味著迭代速度慢、輸出結果不一致,以及工作流程無法滿足實際制作需求。
突破方法在于Seedance是原生統一的模型,能夠同時生成視頻和音頻 ——并且可以在一個系統中接收文本、圖像、音頻和視頻作為輸入。
統一理解4種指令,支持文字 + 圖片 + 視頻 + 音頻一起輸入,能同時理解并融合
人物走路、跑步、打架、跳舞更自然、不扭曲、符合物理規律,多人互動也不亂。
音畫天生同步,自帶雙耳立體聲音頻,說話、唱歌、腳步聲、BGM和畫面嚴絲合縫,口型對得準。
會“當導演”,寫一段劇情,它自動分鏡頭、自動運鏡、自動剪輯節奏
可以改指定人物、動作、場景;也能在現有視頻后面無縫續拍
評測部分覆蓋VBench等多個主流基準,質量、運動、語義一致性等維度全面量化對比。
Seedance 2.0直接站上了第一梯隊,多項指標大幅領先同時期對手。
![]()
![]()
最后兩頁是完整作者列表,共170人
與Seedance 1.5 Pro時期的197人相比,有89人不在2.0作者列表中,62人加入。
![]()
其中穩定不變的核心人物可以找到吳永輝,現任字節跳動Seed團隊基礎研究負責人,是Seedance系列視頻生成模型的最高技術決策者,直接向公司CEO梁汝波匯報。
曾妍,現任Seedance 2.0預訓練負責人,是視頻生成模型核心技術路線的關鍵執行者。工作地點位于美國帕洛阿爾托(Palo Alto)。
![]()
One More Thing
有消息稱字節花近億元挖來了前DeepSeek研究員郭達雅。
抖音副總裁李亮親自下場辟謠:不實,Seed團隊薪資體系統一,近期沒有招聘到近億元年薪的員工。
![]()
辟謠歸辟謠,但這段話還披露了Seed的完整薪資結構:現金+字節期權+豆包期權,四年全部歸屬。
到這,本來可以結束了。
但李亮又加了一句話。
Seed員工的字節和豆包期權未來收益根據期權價格有波動,假如業務發展得很好,不排除有些Seed技術人員四年后收益會達到數億元。
這簡直是借辟謠在招人了。
“數億”兩個字比任何招聘廣告都有殺傷力。
論文地址:
https://arxiv.org/abs/2604.14148
參考鏈接:
[1]https://www.byteplus.com/en/activity/seedance2-0
[2]https://weibo.com/7965906915/QB6lMCaGo
文章來源:量子位。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.