網易首頁 > 網易號 > 正文申請入駐

剛剛，豆包大模型2.1發布，又一次跨越生產級質變點

2026-06-23 17:14:23　來源: 機器之心Pro

河北舉報

分享至

編輯｜澤南

想不到，真的想不到。

每一天，大家調用的豆包大模型 API Tokens 竟有 180 萬億。距離首次發布才不到兩年，Token 的數字就飆漲了超 1500 倍。因為 AI 能力的突破，火山引擎如今已占到中國公有云 MaaS 市場的 49.5%，成為當之無愧的第一，「萬億 Tokens 俱樂部」成員更是突破了 200 家。

剛剛，火山引擎 Force 原動力大會上，我們見證了一波大數字，與此同時還有字節的新一代通用大模型豆包大模型 2.1，以及一系列多模態新模型的發布。

幾個數字背后，是爆發性的技術突破。如今的大模型行業，正在從技術探索期全面邁入產業規模化，不論技術還是落地，豆包大模型已經跑在了前面

豆包大模型 2.1

直面生產力

AI 落地的過程中，Token 消耗是直觀的表象。

這次大會上，火山引擎拋出了一個關鍵的行業判斷：企業采納大模型，正在跨越「質變點」。

當模型能力跨越了閾值，生產力瓶頸被突破，Token 的用量就會呈指數級上升。就像此前圖像領域的 Nano Banana、文本和編程領域的 Claude Opus 4.6，以及視頻領域的 Seedance 2.0，它們很大程度上成為了 AI 進入真實生產環境的關鍵分水嶺。

很多人認為 Opus 4.6 是大模型真正進入生產力階段的節點，原因在于它解決了此前 AI 的幾個核心的痛點（不可靠、不持久、不深入），讓 AI 從回答問題進化到了處理工作的階段。

今天發布的豆包大模型 2.1 也要在代碼生成、Agent（智能體）與 VLM（視覺語言模型）三大核心能力上跨越這一質變點 —— 它在多項評測任務中甚至超越了 Opus 4.7。

其中，豆包 2.1 Pro 在 Terminal Bench 2.1、SWE-Pro、SciCode 等代碼評測中進入第一梯隊：

Coding 能力評測。

在 GDPVal、MCP-Atlas 等智能體、真實環境工具使用評測上，豆包 2.1 Pro 也位居全球前列：

Agent 能力評測。

在實際使用過程中，豆包 2.1 的 Coding 能力有了跨越式進化，比如在代碼生成的過程中，不再局限于片段補全或單文件生成，而是跑通了「倉庫級理解 + 端到端項目交付 + 自測閉環」的完整鏈路，能夠獨立完成真實工程任務。

大會上展示的是一項芯片設計 RTL（寄存器傳輸級）測試的效果，豆包 2.1 Pro 連續運行近 18 小時，經歷 9 輪迭代，跑通了仿真、測試、綜合檢查等完整工程流程，秀了一把真實工程場景里的生產級 Coding 交付能力。

智能體方面，豆包 2.1 驅動的智能體從能執行簡單任務，升級成了能在接口報錯、數據缺失等復雜異常環境下，依然進行「動態路徑規劃 + 異常自糾 + 交付產物」的成熟智能體。

我們對此進行了測試，發現現在豆包 App、桌面端的模式選擇上多出了一個「辦公任務」選項，專門來跑多智能體。

假如我是個計算機視覺（CV）的研究者，想讓豆包的智能體來幫我們分類一下 2 月份某天 arXiv 上全部該領域的論文，順便看看有沒有人引用了我以前的工作。把這個任務交給豆包 2.1 后，一群智能體開始了工作：

如果你點進去看細節，可以看到當天該領域有超過 100 個領域內論文 ID，一個人自己看肯定是看不過來的。我們給出任務后，智能體自行進行了搜索，自行計劃使用工具，寫 Python 腳本進行分類，中間出錯了會自行糾正，最后完成了還會通知你。

生成的結果看起來不錯：

除了文本與代碼能力的提升，豆包大模型原來的強項多模態能力（視頻理解、圖像推理與跨圖分析）在 2.1 版上也大幅強化，在大部分多模態基準成績上領先 Opus 4.7，正在指向更復雜的現實世界互動。

GUI、圖像理解等 VLM 能力評測成績。

例如在視頻理解方面，豆包 2.1 不僅能「看懂」畫面，還能處理長視頻的跨時序邏輯；在圖像推理上，針對復雜的圖表數據（如金融報表、工業設計圖），其空間理解能力和跨圖對比分析能力都有了肉眼可見的提升。這意味著，AI 模型不再是單純地處理文本，現在已能像專業人士一樣看懂復雜的視覺資料。

為滿足不同場景的算力與成本需求，豆包大模型 2.1 同步推出兩款主力型號：適配高性能場景的Doubao-Seed-2.1-pro，以及主打性價比的Doubao-Seed-2.1-turbo。除了通過火山引擎接入 API，我們也能在豆包、TRAE、扣子等應用中體驗到最新的模型。

從技術報告中我們能看到，豆包大模型 2.1 引入了一種專為前沿研究和高級工程任務設計的推理時（Inference-time）配置：Seed2.1 Deep Think。該模式不直接輸出最終響應，而是執行「推理 -> 驗證 -> 修正 -> 選擇」的自動化循環，期間可以調用網絡搜索和代碼沙盒進行假設驗證與迭代。

為了構建更強大的新版本模型，豆包大模型也祭出了 AI 的自我迭代，其訓練階段的Seed for Seed 機制，利用不斷變強的 Seed 模型本身來深度參與研發和迭代的全生命周期。AI 自我迭代的參與范圍涵蓋預訓練數據的處理、數據合成與訓練自舉、基礎設施建設與算子優化等。

豆包 2.1 Pro 每百萬 Token 輸入價格為 6 元、輸出價格 30 元，緩存命中價格 1.2 元。火山引擎表示，其綜合使用成本較 Claude Opus 4.6 降低近 80%。另外，Turbo 的價格進一步降至 2.1 Pro 的一半。

大模型「質變點」

字節都拿出了什么？

作為核心基座模型，豆包大模型 2.1 的提升為其眾多 AI 應用提供了支持。

這樣的質變點，在 Seedance 2.0 問世的時候，我們已經清晰地感受過。

作為當下公認的視頻生成領域 SOTA 模型，Seedance 2.0 今年 2 月推出后在極短時間內完成了現象級破圈。從刷屏短視頻平臺的爆款 AI 創作，到深度嵌入專業影視后期與高轉化率的電商營銷流，Seedance 2.0 已經用實打實的市場份額證明：當模型能力真正跨越視覺連貫性與物理邏輯的門檻，迎來的將是真實生產力環節的爆發。

Seedance 2.0 此次發布了原生 4K 10-bit 高位深直出能力，在細節、運動和色彩上全面優化。

AI 視頻生成除了娛樂、營銷等應用方向之外，還是通往世界模型的路徑之一，在實體產業中有巨大的應用潛力。字節表示，目前 Seedance 已經在具身智能、工業制造、智能駕駛等領域落地，為數據合成、場景仿真、流程演示等業務需求提供了新的工具能力。

與此同時還有它的商業化。之前大家都在演繹華強買瓜，火山引擎此次直接拿下了周星馳旗下比高集團三部經典影片《喜劇之王》、《長江七號》、《食神》的 AI 創作授權，推出的影視 AI 模板在抖音單日互動量就突破了 20 萬。你現在可以用 Seedance 2.0 來充分展示你自己的想象力。

大會同步推出了「火山 AI 版權商業化平臺」，試圖跑通從「模型生成」到「版權分發變現」的完整閉環。

字節還預告了下代視頻生成大模型 Seedance 2.5，它目前處于內測階段，將在 7 月初上線，其將支持全球第一的 30 秒單段原生直出，最多 50 個全模態多素材聯合輸入，并支持更精準的視頻二次編輯。

在這場大會上，還有一些值得關注的發布：

即將上線的圖像創作模型 Seedream 5.0 Pro 專為企業級設計工作打造，它最大的突破在于讓 AI 繪圖告別了開盲盒式的一次性出圖，實現了多圖層分離、交互式局部微調編輯，無縫對接專業設計軟件的日常工作流。Seedream 5.0 Pro 的單張圖像可以承載 PPT 級別的高密度信息，支持 14 種語言的圖內文字精準生成排版。

豆包音頻生成模型 1.0 可以幫助我們無需聲音樣本，僅靠文本、圖像或音頻輸入生成自然語音，大大降低定制門檻。其突破性的「長時一致性」解決了長音頻前后音色割裂的痛點，并支持影視級多軌混編，可直接產出多人對話級別的專業對白。

在 AI 領域，你可以永遠相信更好的還在后面。

結語

AI 能力質變帶來的不僅是數據的增長，更是對人們使用 AI 的方法，工作流程乃至生產力的顛覆。在大會上，火山表示，目前「萬億 Tokens 俱樂部」的成員已超 200 家，覆蓋互聯網、制造、金融、汽車等全行業。

不得不說，這種大規模應用和滲透率，是所有人始料未及的。當 AI 模型跨越了可用性的臨界點，底層算力、基座大模型與頂層的智能體應用正在加速形成閉環。180 萬億的日均 tokens 用量是一個清晰的信號。

AI 正在全面接管高價值生產任務，屬于大模型的時代，正在到來。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.