網易首頁 > 網易號 > 正文申請入駐

Token調用量增長超10倍！豆包大模型2.1上線，Seedance 2.5預計7月初正式上線

2026-06-23 14:56:31　來源: 華爾街見聞官方

上海舉報

分享至

火山引擎連發三款模型，以密集的產品節奏和激進的定價策略向生產級AI市場全面發力。

周二，火山引擎正式發布豆包大模型2.1系列，包括旗艦版Doubao-Seed-2.1-Pro與輕量版Doubao-Seed-2.1-Turbo，API即日在火山方舟全量上線。與此同時，視頻生成模型Seedance 2.5宣布將于7月初正式發布，音頻生成模型1.0同步開啟邀測，標志著豆包生態從語言理解向多模態內容生產全面延伸。

豆包大模型2.1 Pro定價為每百萬Tokens輸入6元、輸出30元，在Coding和Agent場景下綜合成本降至每百萬Tokens僅1.96元，直接瞄準企業級生產環境。火山引擎同步推出持續迭代版本Doubao-Seed-Evolving，以每月2至4次的頻率滾動更新，企業無需更換API接入節點即可獲得最新模型能力。

此次大會上，火山引擎總裁譚待對外披露了最新數據：截至今年6月，豆包大模型日均Token調用量已突破180萬億，較去年增長超10倍。與此同時，在中國公有云MaaS服務市場，火山引擎以49.5%的市場份額位居第一。

上述產品組合將直接影響國內企業AI采購格局。豆包大模型2.1已接入WPS、得到、Unity（團結引擎）等合作伙伴，并計劃覆蓋數億豆包用戶。在多項公認基準測試中，豆包大模型2.1 Pro在Coding與Agent任務上的表現已逼近甚至超越OpenAI GPT-5.5和Anthropic Claude Opus 4.7等國際頂尖模型。

Coding能力跨越生產級門檻

豆包大模型2.1 Pro在多項業界公認編程基準上展現出對標國際旗艦模型的能力。在Terminal Bench評測上，豆包大模型2.1 Pro與Claude Opus 4.7基本持平，能夠在命令行環境中端到端完成完整工程任務；在長程軟件開發基準SWE-Pro上，其表現接近GPT-5.5。

在自然語言到倉庫級代碼轉化的NL2Repo-Bench評測中，豆包大模型2.1 Pro超越GPT-5.5。在科學計算代碼評測SciCode上，豆包2.1 Pro以59.8分超過Claude Opus 4.7和GPT-5.5，該測試覆蓋數理化生材五大學科的真實科研問題，是AI for Science方向含金量最高的基準之一。

在開發者眾測環節，逾六成開發者認為豆包大模型2.1 Pro在真實Coding任務中的產物質量高于Claude Opus 4.6。火山引擎還披露了一個芯片設計RTL案例：豆包大模型2.1 Pro連續運行近18小時，經歷9輪迭代，完成6個核心模塊、1303行RTL代碼的生成，并通過仿真、測試、綜合檢查等完整工程流程，最終通過手寫數字識別驗證，完成生產級Coding交付。

Agent能力躍升，覆蓋高經濟價值任務

在通用Agent能力方面，豆包大模型2.1 Pro在OpenAI發布的GDPval基準上獲得最高分，該測試集覆蓋9大行業、44種職業的真實世界經濟價值任務。在2026年6月剛發布的Agents' Last Exam（ALE）評測上，豆包大模型2.1 Pro超越Claude Opus 4.7——該基準涵蓋13個行業集群、逾1000項高經濟價值真實任務，且發布不久難以被定向優化，更能真實衡量模型面對新場景時的泛化能力。

工具調用方面，豆包大模型2.1 Pro在MCP-Atlas評測集上全面超越Claude Opus 4.7與GPT-5.5，在使用真實MCP Server及多類工具時表現更為穩定。火山引擎展示了一個典型應用案例：一位開發者使用該模型調度超過500個Agent協同作業，累計觸發工具調用上千次，最終在單張大地圖上完成逾100棟造型各異建筑的3D城市構建。

多模態理解保持全球領先

圖像理解方面，豆包大模型2.1在MMMU-Pro等多項榜單上全面超越GPT-5.5、Claude Opus 4.7和Gemini 3.1 Pro，達到全球SOTA。視頻時序理解方面，豆包2.1 Pro在TOMATO與LVBench兩項業界權威基準上大幅領先Gemini 3.1 Pro。

GUI Agent方面，豆包大模型2.1 Pro桌面端能力接近Claude Opus 4.7，移動端大幅領先，并全面超過GPT-5.5，在全球取得SOTA。火山引擎展示了一個端到端視頻剪輯案例：豆包大模型2.1 Pro一次性處理逾兩小時長視頻，自動完成口語化解說稿生成、精準片段定位、音頻合成及字幕輸出，全程無需人工干預。

Seedance 2.5與音頻模型拓展版圖

據華爾街見聞獲悉，豆包視頻生成模型Seedance 2.5目前已處于內測尾聲，預計7月初正式發布。新模型支持單段視頻生成時長最高30秒，鏡頭連貫性大幅提升；并支持最多50個全模態素材聯合輸入，官方稱為全球最多；此外還具備更靈活可控的視頻編輯能力，旨在進一步提升創作者效率與成品品質。

同日，火山引擎正式發布豆包音頻生成模型1.0（Doubao-Seed-Audio 1.0），支持文本及參考音頻等多模態輸入，可端到端生成包含多角色對白、背景音樂和環境音效的完整音頻作品，免去傳統工作流中多軌剪輯、對齊、混音等后期環節。該模型單次支持2分鐘音頻創作，并可通過參考輸入延長音頻同時保持音色一致性。API即日起在火山方舟開啟邀測，并計劃接入剪映、即夢、番茄等產品。

定價策略與規模化商業布局

豆包大模型2.1的定價設計兼顧旗艦性能與規模化部署需求。Pro版每百萬Tokens輸入6元、輸出30元，緩存命中條件下輸入僅需1.2元；Turbo版能力與Pro版相近，價格降低一半，更適合高頻調用場景。在Coding和Agent場景綜合計算下，Pro版的實際成本壓縮至每百萬Tokens僅1.96元。

在產品集成方面，豆包大模型2.1已全面兼容Claude Code、Codex等主流Harness框架，并已上線TRAE、TRAE WORK、扣子等開發工具。合作伙伴方面，WPS表示該模型在PPT生成、表格交付等辦公核心任務上形成穩定可用鏈路；得到反映其在業務規則遵循和核心禁令執行上實現零違規；Unity（團結引擎）則認為該模型在腳本邏輯類任務上的單次能力上限高于頂尖模型。火山引擎表示，豆包產品即將接入豆包大模型2.1 Pro，服務數億用戶的辦公與生產力場景。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.