網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

質(zhì)變!豆包2.1 Pro上線,這下壓力給到了 Claude

2026-06-24 18:31:38　來(lái)源: AI先鋒官

北京舉報(bào)

分享至

6月23日，在FORCE原動(dòng)力大會(huì)上，火山引擎一口氣發(fā)布了多款模型：豆包2.1系列、Seedance 2.5、Seedream 5.0 Pro、Seed-Audio 1.0等。

其中，豆包2.1系列一共包含2個(gè)模型，分別是Doubao-Seed-2.1-Pro和Doubao-Seed-2.1-Turbo，并且，API服務(wù)已全量上線火山方舟（文末附鏈接）。

豆包2.1作為本次大會(huì)的主力模型，其在Coding（編程）、Agent（智能體）、VLM（視覺(jué)語(yǔ)言模型）三類場(chǎng)景下都實(shí)現(xiàn)了性能提升，多項(xiàng)評(píng)測(cè)表現(xiàn)優(yōu)于Claude Opus 4.7。

火山引擎總裁譚待在會(huì)上提到：“只有當(dāng)模型能力跨越‘質(zhì)變點(diǎn)’，才能真正滿足企業(yè)與個(gè)人在生產(chǎn)場(chǎng)景中的使用需求。”

在他看來(lái)，全球范圍內(nèi)第一個(gè)跨越質(zhì)變點(diǎn)的視頻生成模型是Seedance 2.0，Coding與Agent領(lǐng)域則是Claude Opus 4.6，而現(xiàn)在豆包2.1 Pro也加入了這個(gè)行列。

所謂跨越“質(zhì)變點(diǎn)”，在Coding維度意味著模型不再停留在代碼片段補(bǔ)全或單文件生成，而是需要理解整個(gè)代碼倉(cāng)庫(kù)，能夠完成從需求分析到架構(gòu)設(shè)計(jì)、從代碼生成到測(cè)試驗(yàn)證的完整鏈路，并且具備自測(cè)閉環(huán)的能力。

在芯片設(shè)計(jì)RTL（寄存器傳輸級(jí)）測(cè)試中，豆包2.1 Pro連續(xù)運(yùn)行近18小時(shí)，經(jīng)歷9輪迭代，最終完成了6個(gè)核心模塊、1300多行RTL代碼，跑通了仿真、測(cè)試、綜合檢查等完整工程流程，代碼最終通過(guò)了手寫數(shù)字識(shí)別驗(yàn)證。

這類任務(wù)通常需要3到5名資深工程師花費(fèi)數(shù)周時(shí)間才能完成。

接下來(lái)，我們?cè)賮?lái)看下榜單評(píng)分的表現(xiàn)：

在業(yè)界公認(rèn)最貼近真實(shí)研發(fā)的終端編程評(píng)測(cè)Terminal Bench 2.1上，Doubao-Seed-2.1-Pro已經(jīng)做到了與Claude Opus 4.7 基本持平。

在SciCode科學(xué)計(jì)算評(píng)測(cè)中，Doubao-Seed-2.1-Pro拿到59.8分，超過(guò)Opus 4.7和GPT-5.5。

Agent能力同樣是此次升級(jí)的重點(diǎn)。

生產(chǎn)級(jí)的智能體不再局限于簡(jiǎn)單任務(wù)執(zhí)行，而是能夠在動(dòng)態(tài)環(huán)境中自主規(guī)劃路徑，在接口報(bào)錯(cuò)、數(shù)據(jù)缺失等復(fù)雜異常環(huán)境下依然能進(jìn)行異常自糾。

以下是一位開(kāi)發(fā)者將Doubao-Seed-2.1-Pro用于多模態(tài)3D 城市構(gòu)建。

此次，Doubao-Seed-2.1-Pro調(diào)度了500多個(gè)智能Agent同步協(xié)作，依次調(diào)用建模、渲染、貼圖等11種工具，累計(jì)觸發(fā)工具調(diào)用上千次，最終生成超過(guò)100棟造型、材質(zhì)、顏色各不相同的建筑。

過(guò)程中，不同Agent需要協(xié)調(diào)各自的任務(wù)、處理中途出錯(cuò)、動(dòng)態(tài)調(diào)整步驟，幾乎復(fù)現(xiàn)了一個(gè)小型數(shù)字施工隊(duì)的運(yùn)作方式。

從評(píng)測(cè)數(shù)據(jù)來(lái)看：

以O(shè)penAI發(fā)布的真實(shí)世界經(jīng)濟(jì)價(jià)值任務(wù)評(píng)測(cè)集GDPval為例，Doubao-Seed-2.1-Pro在該基準(zhǔn)上獲得最高87.9分。

在六月剛發(fā)布的Agents’ Last Exam（ALE，覆蓋13個(gè)行業(yè)集群、1000多項(xiàng)高經(jīng)濟(jì)價(jià)值真實(shí)任務(wù)）基準(zhǔn)測(cè)試中，Doubao-Seed-2.1-Pro超越了Opus4.7。

在工具調(diào)用的MCP-Atlas 評(píng)測(cè)集上，Doubao-Seed-2.1-Pro全面超過(guò) Opus4.7與GPT 5.5，

同時(shí)，在檢驗(yàn)Agent與多模態(tài)能力的OSWorld和Mobile World等評(píng)測(cè)中，Doubao-Seed-2.1-Pro也位居全球前列。

價(jià)格方面，豆包2.1 Pro每百萬(wàn)Tokens輸入定價(jià)6元、輸出30元，緩存命中價(jià)格僅1.2元，綜合使用成本相比Claude Opus 4.6到4.8系列模型降低接近80%。

面向高頻調(diào)用場(chǎng)景的豆包2.1 Turbo同步上線，價(jià)格僅為2.1 Pro的一半，性價(jià)比更高。

與此同時(shí)，火山引擎還推出了Doubao-Seed-Evolving版本，面向Coding與Agent的重度用戶，將以每月2至4次的頻率快速迭代。

除了豆包大模型2.1，小編再為大家簡(jiǎn)單介紹一下其他的幾款模型：

首先就是豆包視頻生成模型Seedance 2.5，它實(shí)現(xiàn)了30秒單段原生視頻直出、最多支持50個(gè)全模態(tài)素材聯(lián)合生成、保持畫面一致性的局部編輯三項(xiàng)核心能力提升，預(yù)計(jì)7月正式上線。

其次是Seedream 5.0 Pro，具備交互式精準(zhǔn)編輯、多圖層分離、高密度信息表達(dá)和原生多語(yǔ)種文字生成等能力，可直接生成可編輯分層設(shè)計(jì)圖和復(fù)雜信息圖。

最后是Seed-Audio 1.0，具備0樣本多模態(tài)參考能力，支持一次生成多角色對(duì)白、背景音樂(lè)和擬音特效。

6月24日，豆包還推出了豆包專業(yè)版，基于豆包2.1系列大模型，面向復(fù)雜辦公和生產(chǎn)力場(chǎng)景提供更高的使用額度，并上線了全新的辦公任務(wù)模式。

豆包方面表示，專業(yè)版是在現(xiàn)有免費(fèi)服務(wù)之外推出的訂閱服務(wù)，免費(fèi)版用戶仍可持續(xù)獲得新模型、新能力和使用體驗(yàn)升級(jí)。此前功能，也仍保持免費(fèi)不變。

豆包2.1 API接入地址：

https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-1-pro
https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-1-turbo

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.