6月23日,在FORCE原動力大會上,火山引擎一口氣發(fā)布了多款模型:豆包2.1系列、Seedance 2.5、Seedream 5.0 Pro、Seed-Audio 1.0等。
其中,豆包2.1系列一共包含2個模型,分別是Doubao-Seed-2.1-Pro和Doubao-Seed-2.1-Turbo,并且,API服務已全量上線火山方舟(文末附鏈接)。
![]()
豆包2.1作為本次大會的主力模型,其在Coding(編程)、Agent(智能體)、VLM(視覺語言模型)三類場景下都實現(xiàn)了性能提升,多項評測表現(xiàn)優(yōu)于Claude Opus 4.7。
火山引擎總裁譚待在會上提到:“只有當模型能力跨越‘質變點’,才能真正滿足企業(yè)與個人在生產場景中的使用需求。”
在他看來,全球范圍內第一個跨越質變點的視頻生成模型是Seedance 2.0,Coding與Agent領域則是Claude Opus 4.6,而現(xiàn)在豆包2.1 Pro也加入了這個行列。
所謂跨越“質變點”,在Coding維度意味著模型不再停留在代碼片段補全或單文件生成,而是需要理解整個代碼倉庫,能夠完成從需求分析到架構設計、從代碼生成到測試驗證的完整鏈路,并且具備自測閉環(huán)的能力。
在芯片設計RTL(寄存器傳輸級)測試中,豆包2.1 Pro連續(xù)運行近18小時,經歷9輪迭代,最終完成了6個核心模塊、1300多行RTL代碼,跑通了仿真、測試、綜合檢查等完整工程流程,代碼最終通過了手寫數(shù)字識別驗證。
這類任務通常需要3到5名資深工程師花費數(shù)周時間才能完成。
接下來,我們再來看下榜單評分的表現(xiàn):
![]()
在業(yè)界公認最貼近真實研發(fā)的終端編程評測Terminal Bench 2.1上,Doubao-Seed-2.1-Pro已經做到了與Claude Opus 4.7 基本持平。
在SciCode科學計算評測中,Doubao-Seed-2.1-Pro拿到59.8分,超過Opus 4.7和GPT-5.5。
Agent能力同樣是此次升級的重點。
生產級的智能體不再局限于簡單任務執(zhí)行,而是能夠在動態(tài)環(huán)境中自主規(guī)劃路徑,在接口報錯、數(shù)據(jù)缺失等復雜異常環(huán)境下依然能進行異常自糾。
以下是一位開發(fā)者將Doubao-Seed-2.1-Pro用于多模態(tài)3D 城市構建。
此次,Doubao-Seed-2.1-Pro調度了500多個智能Agent同步協(xié)作,依次調用建模、渲染、貼圖等11種工具,累計觸發(fā)工具調用上千次,最終生成超過100棟造型、材質、顏色各不相同的建筑。
過程中,不同Agent需要協(xié)調各自的任務、處理中途出錯、動態(tài)調整步驟,幾乎復現(xiàn)了一個小型數(shù)字施工隊的運作方式。
從評測數(shù)據(jù)來看:
![]()
以OpenAI發(fā)布的真實世界經濟價值任務評測集GDPval為例,Doubao-Seed-2.1-Pro在該基準上獲得最高87.9分。
在六月剛發(fā)布的Agents’ Last Exam(ALE,覆蓋13個行業(yè)集群、1000多項高經濟價值真實任務)基準測試中,Doubao-Seed-2.1-Pro超越了Opus4.7。
在工具調用的MCP-Atlas 評測集上,Doubao-Seed-2.1-Pro全面超過 Opus4.7與GPT 5.5,
同時, 在檢驗Agent與多模態(tài)能力的OSWorld和Mobile World等評測中,Doubao-Seed-2.1-Pro也位居全球前列。
![]()
價格方面,豆包2.1 Pro每百萬Tokens輸入定價6元、輸出30元,緩存命中價格僅1.2元,綜合使用成本相比Claude Opus 4.6到4.8系列模型降低接近80%。
![]()
面向高頻調用場景的豆包2.1 Turbo同步上線,價格僅為2.1 Pro的一半,性價比更高。
與此同時,火山引擎還推出了Doubao-Seed-Evolving版本,面向Coding與Agent的重度用戶,將以每月2至4次的頻率快速迭代。
除了豆包大模型2.1,小編再為大家簡單介紹一下其他的幾款模型:
首先就是豆包視頻生成模型Seedance 2.5,它實現(xiàn)了30秒單段原生視頻直出、最多支持50個全模態(tài)素材聯(lián)合生成、保持畫面一致性的局部編輯三項核心能力提升,預計7月正式上線。
其次是Seedream 5.0 Pro,具備交互式精準編輯、多圖層分離、高密度信息表達和原生多語種文字生成等能力,可直接生成可編輯分層設計圖和復雜信息圖。
最后是Seed-Audio 1.0,具備0樣本多模態(tài)參考能力,支持一次生成多角色對白、背景音樂和擬音特效。
6月24日,豆包還推出了豆包專業(yè)版,基于豆包2.1系列大模型,面向復雜辦公和生產力場景提供更高的使用額度,并上線了全新的辦公任務模式。
豆包方面表示,專業(yè)版是在現(xiàn)有免費服務之外推出的訂閱服務,免費版用戶仍可持續(xù)獲得新模型、新能力和使用體驗升級。此前功能,也仍保持免費不變。
豆包2.1 API接入地址:
https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-1-pro
https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-1-turbo
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.