6月23日,在FORCE原動(dòng)力大會(huì)上,火山引擎一口氣發(fā)布了多款模型:豆包2.1系列、Seedance 2.5、Seedream 5.0 Pro、Seed-Audio 1.0等。
其中,豆包2.1系列一共包含2個(gè)模型,分別是Doubao-Seed-2.1-Pro和Doubao-Seed-2.1-Turbo,并且,API服務(wù)已全量上線火山方舟(文末附鏈接)。
![]()
豆包2.1作為本次大會(huì)的主力模型,其在Coding(編程)、Agent(智能體)、VLM(視覺(jué)語(yǔ)言模型)三類場(chǎng)景下都實(shí)現(xiàn)了性能提升,多項(xiàng)評(píng)測(cè)表現(xiàn)優(yōu)于Claude Opus 4.7。
火山引擎總裁譚待在會(huì)上提到:“只有當(dāng)模型能力跨越‘質(zhì)變點(diǎn)’,才能真正滿足企業(yè)與個(gè)人在生產(chǎn)場(chǎng)景中的使用需求。”
在他看來(lái),全球范圍內(nèi)第一個(gè)跨越質(zhì)變點(diǎn)的視頻生成模型是Seedance 2.0,Coding與Agent領(lǐng)域則是Claude Opus 4.6,而現(xiàn)在豆包2.1 Pro也加入了這個(gè)行列。
所謂跨越“質(zhì)變點(diǎn)”,在Coding維度意味著模型不再停留在代碼片段補(bǔ)全或單文件生成,而是需要理解整個(gè)代碼倉(cāng)庫(kù),能夠完成從需求分析到架構(gòu)設(shè)計(jì)、從代碼生成到測(cè)試驗(yàn)證的完整鏈路,并且具備自測(cè)閉環(huán)的能力。
在芯片設(shè)計(jì)RTL(寄存器傳輸級(jí))測(cè)試中,豆包2.1 Pro連續(xù)運(yùn)行近18小時(shí),經(jīng)歷9輪迭代,最終完成了6個(gè)核心模塊、1300多行RTL代碼,跑通了仿真、測(cè)試、綜合檢查等完整工程流程,代碼最終通過(guò)了手寫數(shù)字識(shí)別驗(yàn)證。
這類任務(wù)通常需要3到5名資深工程師花費(fèi)數(shù)周時(shí)間才能完成。
接下來(lái),我們?cè)賮?lái)看下榜單評(píng)分的表現(xiàn):
![]()
在業(yè)界公認(rèn)最貼近真實(shí)研發(fā)的終端編程評(píng)測(cè)Terminal Bench 2.1上,Doubao-Seed-2.1-Pro已經(jīng)做到了與Claude Opus 4.7 基本持平。
在SciCode科學(xué)計(jì)算評(píng)測(cè)中,Doubao-Seed-2.1-Pro拿到59.8分,超過(guò)Opus 4.7和GPT-5.5。
Agent能力同樣是此次升級(jí)的重點(diǎn)。
生產(chǎn)級(jí)的智能體不再局限于簡(jiǎn)單任務(wù)執(zhí)行,而是能夠在動(dòng)態(tài)環(huán)境中自主規(guī)劃路徑,在接口報(bào)錯(cuò)、數(shù)據(jù)缺失等復(fù)雜異常環(huán)境下依然能進(jìn)行異常自糾。
以下是一位開(kāi)發(fā)者將Doubao-Seed-2.1-Pro用于多模態(tài)3D 城市構(gòu)建。
此次,Doubao-Seed-2.1-Pro調(diào)度了500多個(gè)智能Agent同步協(xié)作,依次調(diào)用建模、渲染、貼圖等11種工具,累計(jì)觸發(fā)工具調(diào)用上千次,最終生成超過(guò)100棟造型、材質(zhì)、顏色各不相同的建筑。
過(guò)程中,不同Agent需要協(xié)調(diào)各自的任務(wù)、處理中途出錯(cuò)、動(dòng)態(tài)調(diào)整步驟,幾乎復(fù)現(xiàn)了一個(gè)小型數(shù)字施工隊(duì)的運(yùn)作方式。
從評(píng)測(cè)數(shù)據(jù)來(lái)看:
![]()
以O(shè)penAI發(fā)布的真實(shí)世界經(jīng)濟(jì)價(jià)值任務(wù)評(píng)測(cè)集GDPval為例,Doubao-Seed-2.1-Pro在該基準(zhǔn)上獲得最高87.9分。
在六月剛發(fā)布的Agents’ Last Exam(ALE,覆蓋13個(gè)行業(yè)集群、1000多項(xiàng)高經(jīng)濟(jì)價(jià)值真實(shí)任務(wù))基準(zhǔn)測(cè)試中,Doubao-Seed-2.1-Pro超越了Opus4.7。
在工具調(diào)用的MCP-Atlas 評(píng)測(cè)集上,Doubao-Seed-2.1-Pro全面超過(guò) Opus4.7與GPT 5.5,
同時(shí), 在檢驗(yàn)Agent與多模態(tài)能力的OSWorld和Mobile World等評(píng)測(cè)中,Doubao-Seed-2.1-Pro也位居全球前列。
![]()
價(jià)格方面,豆包2.1 Pro每百萬(wàn)Tokens輸入定價(jià)6元、輸出30元,緩存命中價(jià)格僅1.2元,綜合使用成本相比Claude Opus 4.6到4.8系列模型降低接近80%。
![]()
面向高頻調(diào)用場(chǎng)景的豆包2.1 Turbo同步上線,價(jià)格僅為2.1 Pro的一半,性價(jià)比更高。
與此同時(shí),火山引擎還推出了Doubao-Seed-Evolving版本,面向Coding與Agent的重度用戶,將以每月2至4次的頻率快速迭代。
除了豆包大模型2.1,小編再為大家簡(jiǎn)單介紹一下其他的幾款模型:
首先就是豆包視頻生成模型Seedance 2.5,它實(shí)現(xiàn)了30秒單段原生視頻直出、最多支持50個(gè)全模態(tài)素材聯(lián)合生成、保持畫面一致性的局部編輯三項(xiàng)核心能力提升,預(yù)計(jì)7月正式上線。
其次是Seedream 5.0 Pro,具備交互式精準(zhǔn)編輯、多圖層分離、高密度信息表達(dá)和原生多語(yǔ)種文字生成等能力,可直接生成可編輯分層設(shè)計(jì)圖和復(fù)雜信息圖。
最后是Seed-Audio 1.0,具備0樣本多模態(tài)參考能力,支持一次生成多角色對(duì)白、背景音樂(lè)和擬音特效。
6月24日,豆包還推出了豆包專業(yè)版,基于豆包2.1系列大模型,面向復(fù)雜辦公和生產(chǎn)力場(chǎng)景提供更高的使用額度,并上線了全新的辦公任務(wù)模式。
豆包方面表示,專業(yè)版是在現(xiàn)有免費(fèi)服務(wù)之外推出的訂閱服務(wù),免費(fèi)版用戶仍可持續(xù)獲得新模型、新能力和使用體驗(yàn)升級(jí)。此前功能,也仍保持免費(fèi)不變。
豆包2.1 API接入地址:
https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-1-pro
https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-1-turbo
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.