編輯|澤南
想不到,真的想不到。
每一天,大家調用的豆包大模型 API Tokens 竟有 180 萬億。距離首次發布才不到兩年,Token 的數字就飆漲了超 1500 倍。因為 AI 能力的突破,火山引擎如今已占到中國公有云 MaaS 市場的 49.5%,成為當之無愧的第一,「萬億 Tokens 俱樂部」成員更是突破了 200 家。
剛剛,火山引擎 Force 原動力大會上,我們見證了一波大數字,與此同時還有字節的新一代通用大模型豆包大模型 2.1,以及一系列多模態新模型的發布。
![]()
幾個數字背后,是爆發性的技術突破。如今的大模型行業,正在從技術探索期全面邁入產業規模化,不論技術還是落地,豆包大模型已經跑在了前面
豆包大模型 2.1
直面生產力
AI 落地的過程中,Token 消耗是直觀的表象。
這次大會上,火山引擎拋出了一個關鍵的行業判斷:企業采納大模型,正在跨越「質變點」。
當模型能力跨越了閾值,生產力瓶頸被突破,Token 的用量就會呈指數級上升。就像此前圖像領域的 Nano Banana、文本和編程領域的 Claude Opus 4.6,以及視頻領域的 Seedance 2.0,它們很大程度上成為了 AI 進入真實生產環境的關鍵分水嶺。
很多人認為 Opus 4.6 是大模型真正進入生產力階段的節點,原因在于它解決了此前 AI 的幾個核心的痛點(不可靠、不持久、不深入),讓 AI 從回答問題進化到了處理工作的階段。
今天發布的豆包大模型 2.1 也要在代碼生成、Agent(智能體)與 VLM(視覺語言模型)三大核心能力上跨越這一質變點 —— 它在多項評測任務中甚至超越了 Opus 4.7。
其中,豆包 2.1 Pro 在 Terminal Bench 2.1、SWE-Pro、SciCode 等代碼評測中進入第一梯隊:
![]()
Coding 能力評測。
在 GDPVal、MCP-Atlas 等智能體、真實環境工具使用評測上,豆包 2.1 Pro 也位居全球前列:
![]()
Agent 能力評測。
在實際使用過程中,豆包 2.1 的 Coding 能力有了跨越式進化,比如在代碼生成的過程中,不再局限于片段補全或單文件生成,而是跑通了「倉庫級理解 + 端到端項目交付 + 自測閉環」的完整鏈路,能夠獨立完成真實工程任務。
大會上展示的是一項芯片設計 RTL(寄存器傳輸級)測試的效果,豆包 2.1 Pro 連續運行近 18 小時,經歷 9 輪迭代,跑通了仿真、測試、綜合檢查等完整工程流程,秀了一把真實工程場景里的生產級 Coding 交付能力。
![]()
智能體方面,豆包 2.1 驅動的智能體從能執行簡單任務,升級成了能在接口報錯、數據缺失等復雜異常環境下,依然進行「動態路徑規劃 + 異常自糾 + 交付產物 」的成熟智能體。
我們對此進行了測試,發現現在豆包 App、桌面端的模式選擇上多出了一個「辦公任務」選項,專門來跑多智能體。
假如我是個計算機視覺(CV)的研究者,想讓豆包的智能體來幫我們分類一下 2 月份某天 arXiv 上全部該領域的論文,順便看看有沒有人引用了我以前的工作。把這個任務交給豆包 2.1 后,一群智能體開始了工作:
![]()
如果你點進去看細節,可以看到當天該領域有超過 100 個領域內論文 ID,一個人自己看肯定是看不過來的。我們給出任務后,智能體自行進行了搜索,自行計劃使用工具,寫 Python 腳本進行分類,中間出錯了會自行糾正,最后完成了還會通知你。
生成的結果看起來不錯:
![]()
除了文本與代碼能力的提升,豆包大模型原來的強項多模態能力(視頻理解、圖像推理與跨圖分析)在 2.1 版上也大幅強化,在大部分多模態基準成績上領先 Opus 4.7,正在指向更復雜的現實世界互動。
![]()
GUI、圖像理解等 VLM 能力評測成績。
例如在視頻理解方面,豆包 2.1 不僅能「看懂」畫面,還能處理長視頻的跨時序邏輯;在圖像推理上,針對復雜的圖表數據(如金融報表、工業設計圖),其空間理解能力和跨圖對比分析能力都有了肉眼可見的提升。這意味著,AI 模型不再是單純地處理文本,現在已能像專業人士一樣看懂復雜的視覺資料。
為滿足不同場景的算力與成本需求,豆包大模型 2.1 同步推出兩款主力型號:適配高性能場景的Doubao-Seed-2.1-pro,以及主打性價比的Doubao-Seed-2.1-turbo。除了通過火山引擎接入 API,我們也能在豆包、TRAE、扣子等應用中體驗到最新的模型。
從技術報告中我們能看到,豆包大模型 2.1 引入了一種專為前沿研究和高級工程任務設計的推理時(Inference-time)配置:Seed2.1 Deep Think。該模式不直接輸出最終響應,而是執行「推理 -> 驗證 -> 修正 -> 選擇」的自動化循環,期間可以調用網絡搜索和代碼沙盒進行假設驗證與迭代。
為了構建更強大的新版本模型,豆包大模型也祭出了 AI 的自我迭代,其訓練階段的Seed for Seed 機制,利用不斷變強的 Seed 模型本身來深度參與研發和迭代的全生命周期。AI 自我迭代的參與范圍涵蓋預訓練數據的處理、數據合成與訓練自舉、基礎設施建設與算子優化等。
![]()
豆包 2.1 Pro 每百萬 Token 輸入價格為 6 元、輸出價格 30 元,緩存命中價格 1.2 元。火山引擎表示,其綜合使用成本較 Claude Opus 4.6 降低近 80%。另外,Turbo 的價格進一步降至 2.1 Pro 的一半。
大模型「質變點」
字節都拿出了什么?
作為核心基座模型,豆包大模型 2.1 的提升為其眾多 AI 應用提供了支持。
這樣的質變點,在 Seedance 2.0 問世的時候,我們已經清晰地感受過。
作為當下公認的視頻生成領域 SOTA 模型,Seedance 2.0 今年 2 月推出后在極短時間內完成了現象級破圈。從刷屏短視頻平臺的爆款 AI 創作,到深度嵌入專業影視后期與高轉化率的電商營銷流,Seedance 2.0 已經用實打實的市場份額證明:當模型能力真正跨越視覺連貫性與物理邏輯的門檻,迎來的將是真實生產力環節的爆發。
Seedance 2.0 此次發布了原生 4K 10-bit 高位深直出能力,在細節、運動和色彩上全面優化。
![]()
AI 視頻生成除了娛樂、營銷等應用方向之外,還是通往世界模型的路徑之一,在實體產業中有巨大的應用潛力。字節表示,目前 Seedance 已經在具身智能、工業制造、智能駕駛等領域落地,為數據合成、場景仿真、流程演示等業務需求提供了新的工具能力。
與此同時還有它的商業化。之前大家都在演繹華強買瓜,火山引擎此次直接拿下了周星馳旗下比高集團三部經典影片《喜劇之王》、《長江七號》、《食神》的 AI 創作授權,推出的影視 AI 模板在抖音單日互動量就突破了 20 萬。你現在可以用 Seedance 2.0 來充分展示你自己的想象力。
大會同步推出了「火山 AI 版權商業化平臺」,試圖跑通從「模型生成」到「版權分發變現」的完整閉環。
字節還預告了下代視頻生成大模型 Seedance 2.5,它目前處于內測階段,將在 7 月初上線,其將支持全球第一的 30 秒單段原生直出,最多 50 個全模態多素材聯合輸入,并支持更精準的視頻二次編輯。
![]()
在這場大會上,還有一些值得關注的發布:
即將上線的圖像創作模型 Seedream 5.0 Pro 專為企業級設計工作打造,它最大的突破在于讓 AI 繪圖告別了開盲盒式的一次性出圖,實現了多圖層分離、交互式局部微調編輯,無縫對接專業設計軟件的日常工作流。Seedream 5.0 Pro 的單張圖像可以承載 PPT 級別的高密度信息,支持 14 種語言的圖內文字精準生成排版。
豆包音頻生成模型 1.0 可以幫助我們無需聲音樣本,僅靠文本、圖像或音頻輸入生成自然語音,大大降低定制門檻。其突破性的「長時一致性」解決了長音頻前后音色割裂的痛點,并支持影視級多軌混編,可直接產出多人對話級別的專業對白。
![]()
在 AI 領域,你可以永遠相信更好的還在后面。
結語
AI 能力質變帶來的不僅是數據的增長,更是對人們使用 AI 的方法,工作流程乃至生產力的顛覆。在大會上,火山表示,目前「萬億 Tokens 俱樂部」的成員已超 200 家,覆蓋互聯網、制造、金融、汽車等全行業。
不得不說,這種大規模應用和滲透率,是所有人始料未及的。當 AI 模型跨越了可用性的臨界點,底層算力、基座大模型與頂層的智能體應用正在加速形成閉環。180 萬億的日均 tokens 用量是一個清晰的信號。
![]()
AI 正在全面接管高價值生產任務,屬于大模型的時代,正在到來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.