大家好,我是冷逸。
昨天,火山引擎FORCE原動(dòng)力大會(huì),字節(jié)沒有擠牙膏——一口氣甩出五款模型:Seed 2.1 Pro、Seedance 2.5(7月中旬發(fā)布)、Seedance 2.0 4K版、Seedream 5.0 Pro、Seed Audio 1.0。
![]()
拍攝于大會(huì)現(xiàn)場 / 2026.5.23 / 北京
從基模到多模態(tài)生成,一條線全部拉滿。
一句話認(rèn)識(shí)這5款模型:
Seed 2.1 Pro:Coding、Agent、視覺理解全面升級(jí),對(duì)標(biāo)Opus-4.7和Gemini-3.1-Pro;
Seedance 2.5:原生直出30s視頻,最多支持50個(gè)參考素材,還能對(duì)視頻做二次編輯。一手獨(dú)家:預(yù)計(jì)7月中旬上線。
Seedance 2.0 4K版:支持10-bit高位深原生直出,從源頭就把視頻細(xì)節(jié)留住。
Seedream 5.0 Pro:精準(zhǔn)編輯、圖層分離、高密度信息表達(dá)、多語種生成全面進(jìn)步,明顯更實(shí)用了。身邊好友實(shí)測下來,能力卡在Banana Pro和Image2之間。
Seed Audio 1.0:不只是配個(gè)人聲,而是一句Prompt直接產(chǎn)出「對(duì)白 + BGM + 音效」一體的成品音頻,文生、參考生都支持。
![]()
把這五款擺在一起看,我的第一反應(yīng)是——它們可以「合體」了。
一部影視級(jí)作品,人物圖、場景圖、道具圖交給Seedream 5.0 Pro,視頻交給Seedance 2.5,音頻交給Seed Audio 1.0;要是你想搭一條自己的工作流,再用Seed 2.1 Pro做一個(gè)Agent把它們串起來。
是的,直接就loop model了。
這幾款模型我都想上手測一測,尤其是Seedance 2.5。等拿到內(nèi)測權(quán)限了,第一時(shí)間給大家安排測試。
今天,我先給大家看下Seed 2.1 Pro的實(shí)測效果。
![]()
一手實(shí)測
Coding篇
我直接接火山引擎的API,丟進(jìn)Claude Code里開測。API URL和model分別是:
doubao-seed-2-1-pro-2606281)Case 1:設(shè)計(jì)3D網(wǎng)頁
給一張金門大橋的實(shí)景照片,讓模型按橋體的外觀結(jié)構(gòu),寫一個(gè) 3D 交互網(wǎng)頁。
![]()
先看結(jié)果。
Seed 2.1準(zhǔn)確還原出了金門大橋的標(biāo)志性結(jié)構(gòu),大橋、水面、云朵和城市群的建模,也都還行。
這個(gè)Case我們測過一大票模型,老朋友應(yīng)該有印象:GPT-5.5和DeepSeek-V4-Pro連橋體外觀都還原不出來,吐出來的結(jié)構(gòu)五花八門。
當(dāng)然,建模細(xì)節(jié)和功能性這塊,離Opus 4.8還差一口氣。
2)Case2:設(shè)計(jì)財(cái)報(bào)網(wǎng)頁
給了一張英偉達(dá)2027財(cái)年Q1的財(cái)報(bào)桑基圖(靜態(tài)圖),讓它讀懂圖里的數(shù)據(jù)和結(jié)構(gòu)布局,做成一個(gè)能互動(dòng)的財(cái)報(bào)網(wǎng)頁。
![]()
這個(gè)Case特別考驗(yàn)?zāi)P偷囊曈X理解、空間理解以及基礎(chǔ)的財(cái)務(wù)知識(shí),然后用Canvas和js組件把網(wǎng)頁搭出來,且所有數(shù)據(jù)一個(gè)都不能錯(cuò)。
來看下它交出來的HTML。
所有卡片都能正常打開、縮放,收支數(shù)據(jù)也對(duì)得上賬。
3)Case3:開發(fā)民宿官網(wǎng)
網(wǎng)站開發(fā),還是我們的老case,給「冷同學(xué)的院子」設(shè)計(jì)一個(gè)官網(wǎng)。
和之前的測評(píng)一樣,提示詞一字未改。
![]()
One shot直出,看效果:
說句實(shí)在話:同樣是one shot,Seed 2.1 Pro的成品比我之前測的M3、K2.7和Opus 4.8都要差一點(diǎn)點(diǎn);但甩開GPT-5.5和DeepSeek-V4-Pro,依然毫無壓力。
Coding我主要測了這3個(gè)Case。整體下來我的判斷是:Seed 2.1 Pro在國內(nèi)能進(jìn)第一梯隊(duì),但跟Opus 4.8/4.7比,還有一段路要走。
Agent篇
測完Coding,我們換個(gè)戰(zhàn)場——測幾個(gè)真實(shí)的生產(chǎn)力場景。
這里,要用到豆包或TRAE。目前有3種方式能體驗(yàn)Seed 2.1 Pro:
①打開豆包電腦版或豆包App,選擇 “辦公任務(wù)” 模式; ②打開TRAE Work或TRAE IDE,內(nèi)置模型選擇Doubao-Seed-2.1-Pro; ③在火山引擎API接入,它分Pro和Turbo兩個(gè)版本。
4)Case4:自動(dòng)打開網(wǎng)頁并統(tǒng)計(jì)數(shù)據(jù)
第一個(gè),是我一直想干的事:讓豆包打開豆瓣,統(tǒng)計(jì)近三年的9分電影。
![]()
它的思考過程我給大家放出來了。
(可上下滑動(dòng),查看全圖)
中間有意思的是——單純browser use跑不通時(shí),它不會(huì)卡死,而是自己換思路、調(diào)新工具,直到任務(wù)的完成。
![]()
最后統(tǒng)計(jì)出來的結(jié)果,還挺準(zhǔn)。
![]()
5)Case5:做PPT
統(tǒng)計(jì)完9分電影,我順手讓它做了份PPT,風(fēng)格、審美什么的,我全都沒做要求,讓模型自己發(fā)揮。
![]()
最終的產(chǎn)物,摘幾頁給大家看,內(nèi)容質(zhì)量和排版審美相當(dāng)能打。
![]()
![]()
![]()
![]()
![]()
這是真PPT,連備注都有,可以自由修改,也可以隨時(shí)導(dǎo)pptx、pdf格式。
![]()
最近好幾個(gè)朋友問我用什么AI做PPT,我給的答案都是「豆包」。
6)Case6:復(fù)雜長程任務(wù)
最后一個(gè)case,我測了個(gè)復(fù)雜一點(diǎn)的長程任務(wù)。
給它一個(gè)「聯(lián)網(wǎng)搜索+office三件套生成+skill調(diào)用」的長程任務(wù),給蘋果公司做估值建模。
![]()
先看它搭的財(cái)務(wù)模型:預(yù)測蘋果未來三年?duì)I收分別為4480、4795、5096億美元,平均年增長率約7%。
![]()
背后是一整套數(shù)據(jù)分析撐著的。
![]()
還有它寫的研究報(bào)告。
(可上下滑動(dòng),查看全圖)
以及PPT。
![]()
三份產(chǎn)物,完成度都很能打。這個(gè)Case的難點(diǎn)在于:它不是「聯(lián)網(wǎng)搜一搜、再總結(jié)一下」就完事,而是要求模型有自己的預(yù)測、自己的推理和判斷。
這不只考驗(yàn)長程穩(wěn)定性和工具調(diào)用能力,更是對(duì)推理能力的硬核拷問。
而且u1s1,Seed 2.1 Pro交付的那份財(cái)務(wù)模型Excel,是我最近測過的模型里,做得最好看的一家——沒有之一。
Seed 2.1 Pro的長程能力,是真有點(diǎn)東西。
三個(gè)生產(chǎn)力Case跑完,我的結(jié)論是:Seed 2.1 Pro在General Agent(通用Agent)上的提升非常猛,執(zhí)行復(fù)雜任務(wù)明顯更靠譜了。
真實(shí)的工作流,從來不發(fā)生在一個(gè)固定界面、一條固定流程里,而是要在聊天、搜索、瀏覽器、代碼倉庫、文件和外部工具之間反復(fù)橫跳。
所以Seed 2.1 Pro進(jìn)一步朝通用型Computer-Use Agent(CUA)的方向打磨,讓模型能在跨環(huán)境、跨工具、跨交互方式的任務(wù)里,穩(wěn)穩(wěn)地一路推進(jìn)。
在生產(chǎn)力場景,Seed 2.1 Pro絕對(duì)算得上一款好用的底模。
![]()
FORCE大會(huì)上,火山引擎總裁譚待拋出一個(gè)觀點(diǎn):「模型只有跨越“質(zhì)變點(diǎn)”,才真正具備滿足企業(yè)和個(gè)人生產(chǎn)需求的能力。」
這話很實(shí)在。視頻領(lǐng)域,Seedance 2.0就是那個(gè)質(zhì)變點(diǎn),它讓AI視頻迅速在行業(yè)里鋪開、落地;Coding和Agent領(lǐng)域,代表模型是Claude Opus 4.6,從這之后大家都卷起了Agent和長程能力。
今天的Seed 2.1 Pro,走的也是這條路:死磕自己的Coding、Agent和VLM能力。
我自己實(shí)測下來,它在Coding上離頂尖、前沿還有差距;但在生產(chǎn)力場景里的Agent能力是真的可以,跨工具、跨環(huán)境的任務(wù)交付質(zhì)量都很高。
用一句話總結(jié)就是:它不前沿,但更實(shí)用了。
這也就不難理解,為什么這屆FORCE大會(huì)能爆滿到這個(gè)程度——我只是晚到了那么一丟丟,就只能在現(xiàn)場享受「站票」待遇。而且不止我一個(gè),很多朋友都是從頭站著看完整場發(fā)布會(huì)的。
人山人海,詞元跳動(dòng)。
![]()
拍攝于大會(huì)現(xiàn)場 / 2026.5.23 / 北京
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.