火山引擎連發三款模型,以密集的產品節奏和激進的定價策略向生產級AI市場全面發力。
周二,火山引擎正式發布豆包大模型2.1系列,包括旗艦版Doubao-Seed-2.1-Pro與輕量版Doubao-Seed-2.1-Turbo,API即日在火山方舟全量上線。與此同時,視頻生成模型Seedance 2.5宣布將于7月初正式發布,音頻生成模型1.0同步開啟邀測,標志著豆包生態從語言理解向多模態內容生產全面延伸。
豆包大模型2.1 Pro定價為每百萬Tokens輸入6元、輸出30元,在Coding和Agent場景下綜合成本降至每百萬Tokens僅1.96元,直接瞄準企業級生產環境。火山引擎同步推出持續迭代版本Doubao-Seed-Evolving,以每月2至4次的頻率滾動更新,企業無需更換API接入節點即可獲得最新模型能力。
![]()
此次大會上,火山引擎總裁譚待對外披露了最新數據:截至今年6月,豆包大模型日均Token調用量已突破180萬億,較去年增長超10倍。與此同時,在中國公有云MaaS服務市場,火山引擎以49.5%的市場份額位居第一。
上述產品組合將直接影響國內企業AI采購格局。豆包大模型2.1已接入WPS、得到、Unity(團結引擎)等合作伙伴,并計劃覆蓋數億豆包用戶。在多項公認基準測試中,豆包大模型2.1 Pro在Coding與Agent任務上的表現已逼近甚至超越OpenAI GPT-5.5和Anthropic Claude Opus 4.7等國際頂尖模型。
Coding能力跨越生產級門檻
豆包大模型2.1 Pro在多項業界公認編程基準上展現出對標國際旗艦模型的能力。在Terminal Bench評測上,豆包大模型2.1 Pro與Claude Opus 4.7基本持平,能夠在命令行環境中端到端完成完整工程任務;在長程軟件開發基準SWE-Pro上,其表現接近GPT-5.5。
在自然語言到倉庫級代碼轉化的NL2Repo-Bench評測中,豆包大模型2.1 Pro超越GPT-5.5。在科學計算代碼評測SciCode上,豆包2.1 Pro以59.8分超過Claude Opus 4.7和GPT-5.5,該測試覆蓋數理化生材五大學科的真實科研問題,是AI for Science方向含金量最高的基準之一。
![]()
在開發者眾測環節,逾六成開發者認為豆包大模型2.1 Pro在真實Coding任務中的產物質量高于Claude Opus 4.6。火山引擎還披露了一個芯片設計RTL案例:豆包大模型2.1 Pro連續運行近18小時,經歷9輪迭代,完成6個核心模塊、1303行RTL代碼的生成,并通過仿真、測試、綜合檢查等完整工程流程,最終通過手寫數字識別驗證,完成生產級Coding交付。
Agent能力躍升,覆蓋高經濟價值任務
在通用Agent能力方面,豆包大模型2.1 Pro在OpenAI發布的GDPval基準上獲得最高分,該測試集覆蓋9大行業、44種職業的真實世界經濟價值任務。在2026年6月剛發布的Agents' Last Exam(ALE)評測上,豆包大模型2.1 Pro超越Claude Opus 4.7——該基準涵蓋13個行業集群、逾1000項高經濟價值真實任務,且發布不久難以被定向優化,更能真實衡量模型面對新場景時的泛化能力。
工具調用方面,豆包大模型2.1 Pro在MCP-Atlas評測集上全面超越Claude Opus 4.7與GPT-5.5,在使用真實MCP Server及多類工具時表現更為穩定。火山引擎展示了一個典型應用案例:一位開發者使用該模型調度超過500個Agent協同作業,累計觸發工具調用上千次,最終在單張大地圖上完成逾100棟造型各異建筑的3D城市構建。
多模態理解保持全球領先
圖像理解方面,豆包大模型2.1在MMMU-Pro等多項榜單上全面超越GPT-5.5、Claude Opus 4.7和Gemini 3.1 Pro,達到全球SOTA。視頻時序理解方面,豆包2.1 Pro在TOMATO與LVBench兩項業界權威基準上大幅領先Gemini 3.1 Pro。
![]()
GUI Agent方面,豆包大模型2.1 Pro桌面端能力接近Claude Opus 4.7,移動端大幅領先,并全面超過GPT-5.5,在全球取得SOTA。火山引擎展示了一個端到端視頻剪輯案例:豆包大模型2.1 Pro一次性處理逾兩小時長視頻,自動完成口語化解說稿生成、精準片段定位、音頻合成及字幕輸出,全程無需人工干預。
Seedance 2.5與音頻模型拓展版圖
據華爾街見聞獲悉,豆包視頻生成模型Seedance 2.5目前已處于內測尾聲,預計7月初正式發布。新模型支持單段視頻生成時長最高30秒,鏡頭連貫性大幅提升;并支持最多50個全模態素材聯合輸入,官方稱為全球最多;此外還具備更靈活可控的視頻編輯能力,旨在進一步提升創作者效率與成品品質。
同日,火山引擎正式發布豆包音頻生成模型1.0(Doubao-Seed-Audio 1.0),支持文本及參考音頻等多模態輸入,可端到端生成包含多角色對白、背景音樂和環境音效的完整音頻作品,免去傳統工作流中多軌剪輯、對齊、混音等后期環節。該模型單次支持2分鐘音頻創作,并可通過參考輸入延長音頻同時保持音色一致性。API即日起在火山方舟開啟邀測,并計劃接入剪映、即夢、番茄等產品。
![]()
定價策略與規模化商業布局
豆包大模型2.1的定價設計兼顧旗艦性能與規模化部署需求。Pro版每百萬Tokens輸入6元、輸出30元,緩存命中條件下輸入僅需1.2元;Turbo版能力與Pro版相近,價格降低一半,更適合高頻調用場景。在Coding和Agent場景綜合計算下,Pro版的實際成本壓縮至每百萬Tokens僅1.96元。
在產品集成方面,豆包大模型2.1已全面兼容Claude Code、Codex等主流Harness框架,并已上線TRAE、TRAE WORK、扣子等開發工具。合作伙伴方面,WPS表示該模型在PPT生成、表格交付等辦公核心任務上形成穩定可用鏈路;得到反映其在業務規則遵循和核心禁令執行上實現零違規;Unity(團結引擎)則認為該模型在腳本邏輯類任務上的單次能力上限高于頂尖模型。火山引擎表示,豆包產品即將接入豆包大模型2.1 Pro,服務數億用戶的辦公與生產力場景。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.