无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

豆包專業版實測:2億人都可以體驗能干活的Agent了!

0
分享至


新智元報道


【新智元導讀】6 月 24 日,豆包上線專業版,首個 Agent 驅動的辦公任務模式搭載豆包 2.1 Pro。實測調研報告、財報分析、自建 Skill 等辦公場景,交付質量對標 Claude Opus 4.6。2 億日活的國民 AI 應用,開始認真干活了。

剛剛,豆包正式上線專業版,同步發布豆包 2.1 系列大模型。

這次更新最核心的變化是全新的「辦公任務模式」,分別為專業版用戶和免費用戶提供豆包 2.1 Pro 和豆包 2.1 Turbo 模型,這也可以被認為是豆包的第一個 Agent 版本。


在這個模式下,豆包能完成一個完整的工作目標,自主拆解步驟,調用本地電腦、瀏覽器、飛書辦公套件等工具,產出可以直接交付使用的工作成品,一份行業報告、一張數據分析表、一套 PPT,或者一個帶后端數據庫的網站。

談到模型能力,有個效果十分吸睛的 Demo:一個芯片設計 RTL 的測試,豆包 2.1 Pro 連續運行近 18 小時,完成 6 個核心模塊、1303 行 RTL 代碼,經歷 9 輪迭代,還跑通了仿真、測試、綜合檢查等完整工程流程,展現出模型在真實工程場景里的生產級 Coding 交付能力。過去完成該任務需要 3-5 個工程師做數周。

豆包日活超過 2 億,是中國用戶量最大的 AI 應用。

這 2 億人里大多數從未接觸過 Claude Code 和 Codex 等專業 Agent 工具。

Agent 能力進入一個每天 2 億人打開的 App,覆蓋的是一個全新的用戶群體。

免費用戶不受任何影響,現有功能和額度保持不變,底層模型升級為豆包 2.1 Turbo,能力甚至有顯著提升。

辦公任務模式也在一定額度內向所有用戶免費開放。

對于豆包的免費用戶來說,免費服務的現有功能和額度保持不變,還整體接入了豆包 2.1 模型,能力有所提升。

此外,免費用戶還能體驗接入豆包 2.1 Turbo 模型的辦公任務模式。

那么這個 Agent 模式到底能把活干到什么程度?

三大場景,實測豆包 Agent

辦公任務模式的邏輯很簡單,Agent 明確目標,拆解步驟,調用工具,交付成品。

產出物是可以直接發給同事、交給客戶的工作成果。

以下三個場景按難度遞進,用交付結果說話。

場景一:本地電腦操作 + 應用生成

第一個場景直接測豆包新推出的辦公任務模式最硬核的能力之一——操作用戶本地電腦上的文件,寫代碼、跑代碼、發現問題自己修。

實測分兩輪。

第一輪 Prompt:

設計一個可復用的本地軟件,幫助我檢測出重復照片中質量最好的,將其余質量相對更差的放入回收站??梢杂梦冶镜匚募A的這些照片來測試并完善軟件。


豆包先查看了本地照片文件夾,了解測試數據,然后開始寫代碼。

過程中經歷了多輪自我迭代,遇到依賴兼容性問題主動切換技術方案,發現評分算法和分組邏輯的 Bug 后自行修復重跑,直到測試結果達標才交付。

第二輪 Prompt:

能否加上一套極簡 UI,讓連運行 Python 代碼都不會的人也能傻瓜式操作?


豆包用 tkinter 做了一個完整的圖形界面,文件夾選擇、嚴格度滑塊、備份模式、可視化掃描結果、進度條、二次確認彈窗,刪除默認進系統回收站。


生成了一個雙擊啟動腳本,用戶點一下就能打開。

最終交付四個文件,命令行版、GUI 版、啟動腳本和使用說明。

最終,Agent 從兩張相同場景的照片中成功挑出了質量最好的一張。


正確對焦的清晰照片:IMG_5676.jpg


錯誤對焦的模糊照片:IMG_5684.jpg


成功選出了更清晰的第一張照片:IMG_5675.jpg

一個完全不會寫代碼的人,全程鼠標操作就能清理完重復照片。

場景二:財報數據分析 + 對比圖表

實測 Prompt:

幫我整理近半年全球 AI 芯片行業的財報核心數據,對比英偉達、AMD 兩家公司的營收增速、毛利率變化,生成對比分析表格并給出行業趨勢總結,輸出為飛書表格 + 500 字以內的投資摘要文檔。

Agent 要從多個數據源提取財務指標,清洗比對,生成可讀性強的表格,還要寫出有判斷力的趨勢分析。

從信息提取到數據處理到可視化到文字總結,這是一個多步驟鏈式任務,任何一環斷了都交不出合格的活。

豆包交付了兩個文件,一份雙 Sheet 的飛書表格和一份投資摘要文檔。

表格鏈接:https://my.feishu.cn/sheets/DFBHsfWtOh7zHMtJur4cootPn9c

文檔鏈接:https://my.feishu.cn/docx/Xwxfd5Dv5opPaAxcGLPccvs6nbd


Sheet 1


Sheet 2


文檔

表格做到了什么程度?

第一個 Sheet 是季度對比,按公司分列、按指標分行,英偉達 FY2027 Q1 營收 816 億美元(同比 +85%)、GAAP 毛利率 74.9%、數據中心收入 752 億美元(同比 +92%);AMD 2026 Q1 營收 103 億美元(同比 +38%)、毛利率 53%。

第二個 Sheet 是年度核心數據,包括全年營收、AI 業務占比、市值等維度。

每個數字都有明確的時間范圍標注,不需要人去猜「這個季度到底是哪幾個月」。

投資摘要沒有停留在復述數字的層面,而是提煉出了三個行業趨勢判斷,全球 AI 算力建設加速驅動需求持續超預期、英偉達 CUDA 生態加硬件迭代形成深厚護城河、競爭格局呈現「一超多強」分化。

最后給出了配置建議,英偉達超配、AMD 標配,并提示關注三季度新品節奏和云廠商資本開支變化。

AI 生成的財務數據仍需人工核驗,文檔也標注了「部分內容由豆包生成」。

但作為初稿,這份表格加摘要的雙交付,已經覆蓋了一個初級分析師大概半天的工作量。

場景三:自建 Skill + 世界杯數據分析

實測 Prompt:

創建一個可以生成數據可視化面板的技能,然后用這個技能把今天世界杯的所有比賽數據分析一下。

第三個場景展示的是 Agent 最有想象空間的能力,用戶在教 AI 學一個新技能,然后讓它用這個技能干活。

這條 Prompt 里包含兩個任務。

第一步是創建一個自定義 Skill,第二步是調用剛創建的 Skill 執行具體分析。

豆包先生成了一個名為「data-dashboard」的 Skill,基于 ECharts 構建,支持統計卡片、柱狀圖、餅圖、折線圖、雙軸圖等多種圖表類型,響應式設計,深色漸變主題,并附帶了完整的 HTML 模板和使用指南。

然后豆包調用這個 Skill,抓取了 6 月 24 日世界杯 4 場比賽的實時數據,生成了一個交互式數據面板。




面板里的信息讓人很難相信這是一句 Prompt 的產物。

6 個關鍵指標統計卡片(總進球、零封場次、場均進球等),各隊進球數對比柱狀圖,比賽狀態分布餅圖,進球時間分布折線圖,小組積分形勢雙軸圖,外加一張完整的賽程數據表格。

數據的時效性也跟上了,葡萄牙 5 比 0 大勝烏茲別克斯坦,C 羅梅開二度(siuuuuu~),成為歷史首位在六屆世界杯中全部取得進球的球員(41 歲 138 天),這些細節都準確呈現在面板里。


圖源:央視新聞

這個案例的價值在于 Agent 完成了「先造工具,再用工具干活」的復合指令。

傳統工作流里,創建一個數據分析模板和用模板執行分析是兩個獨立步驟,通常需要不同的技能棧。

豆包只需要一句 Prompt。

而且這個 Skill 創建一次之后可以反復調用,明天、后天的世界杯賽事數據不需要重新描述需求。

三個場景之外,辦公任務模式還有幾項能力值得留意。

本地電腦操作方面,經用戶授權后,豆包可以協助整理本地文件、歸類文檔、跨應用搬運信息。

定時任務方面,用戶可以設定豆包在固定時間自動執行重復性工作,比如每周一上午 9 點自動生成 AI 行業動態周報。

網站和應用生成方面,辦公任務模式支持創建帶后端數據庫的生產級網站,可供個人或團隊快速搭建信息系統。

所有能力仍在持續迭代,更多專業 Skill 后續會陸續上線。


底座之變,豆包 2.1 Pro 是什么水平

辦公任務模式的交付質量,底層由模型能力決定。豆包專業版搭載的是最新的豆包 2.1 Pro,免費版用戶則可使用豆包 2.1 Turbo。

豆包大模型 2.1 Pro 已經達到了可用的標準,可以對標 Claude Opus 4.6 的水平,進入到了 Agent 的可用門檻。

一個有意思的變化是,此前 Seed 團隊有單獨的 Coding 模型 SeedCode,豆包 2.1 發布后 Coding 和 Agent 能力全部合并到了主版模型里,與此同時推出了 Seed Evolving 系列,在 2.1 基礎上每一兩周更新一次。

在面向真實 Coding 場景的眾測開發者評估中,Seed 2.1 Pro 對比 Claude Opus 4.6 獲得了 59.1% 的勝率。

在 ALE(Agents' Last Exam)基準評測中,這個覆蓋 13 個行業集群、1000 多項高經濟價值真實任務的測試里,Seed 2.1 Pro 處于第一梯隊。


Agents' Last Exam 基準評測中,左側為完整通過率,右側為平均綜合得分

GDPval 基準衡量模型在真實工作任務中的完成質量和經濟價值,Seed 2.1 Pro 拿到了參評模型的最高分。

Terminal Bench 2.1 的得分為 71.0,與 Claude Opus 4.7 的 71.7 基本持平。


跑分是參考維度之一,前面的實測也更能反映 Agent 在真實辦公場景中的交付水平。

兩者結合來看,豆包 2.1 Pro 確實已經邁過了 Agent 的可用門檻。

價格方面,Seed 2.1 Pro 的 API 定價為輸入 6 元/百萬 Token、輸出 30 元/百萬 Token,約為海外同水平模型的四分之一。

豆包專業版采用三檔訂閱,標準 68 元/月,加強 200 元/月,高級 500 元/月,區別僅在使用額度,功能和模型完全一致。

與此同時,豆包即將推出面向在校大學生提供認證后 38 元/月的專屬優惠,針對視障人群的視頻通話功能也有特殊優惠方案。

再重復一遍關鍵信息:免費用戶現有功能和額度不受影響。

辦公任務模式也在一定額度內向所有用戶免費開放,免費用戶可以體驗接入豆包 2.1 Turbo 模型的辦公任務模式。

而專業版,主要解決的是專業用戶在復雜任務場景下的額度需求。

2 億人的 Agent 飛輪

豆包日活超過 2 億。

這 2 億用戶里也有相當多使用智能手機還不算流暢的中老年人等相對的「科技弱勢群體」。

他們大多數不知道 Claude Code 和 Codex 是什么。


Claude Code


Codex

對這個群體來說,Agent 此前只是科技媒體報道里的概念。

辦公任務模式把 Agent 工作流放進了這些人每天都在用的 App 里。

一個從沒寫過代碼的行政人員,現在能用一句話讓豆包幫她整理本地文件、生成周報,甚至部署一個內部查詢網站。

一個大學生可以用 38 元/月的學生優惠價,獲得搭載旗艦模型的辦公 Agent。

讓 2 億普通用戶零門檻使用專業級工作流,是 AI 普惠當下最務實的一步。

2 億日活還帶來一個結構性優勢——海量用戶在 Agent 模式下處理真實工作任務,積累的數據將持續反哺模型的 Agent 能力迭代。

用戶量級帶來數據量級,數據量級加速模型進化,模型進化再拉動更多用戶使用 Agent 功能。

Seed Evolving 系列每一兩周更新一次,就是這種飛輪效應的產品化體現。

辦公任務模式將不斷快速進化,即將上新的功能包括但不限于:

  • 技能商店頁面,支持用戶添加 / 管理;

  • 手機遠程操作電腦;

  • 電腦端支持 GUI 操作;

  • 進一步和飛書融合打通。

方向已經很清楚了。

Agent 時代,跑分是入場券,2 億日活才是戰場。

當一個國民級應用開始替用戶干活,改變的是 2 億國民的工作方式。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
好家伙!《中餐廳10》開播就差評一片,觀眾差評理由出奇一致

好家伙!《中餐廳10》開播就差評一片,觀眾差評理由出奇一致

星宿影視鴨
2026-06-24 14:39:14
15歲姑娘被押去槍決,突然塞一把生黃豆進嘴,槍響后一顆沒掉

15歲姑娘被押去槍決,突然塞一把生黃豆進嘴,槍響后一顆沒掉

歷史圖鑒
2026-06-22 15:52:00
重磅!拒絕WNBA!又一個中國球員!

重磅!拒絕WNBA!又一個中國球員!

左右為籃
2026-06-24 13:10:41
重慶市2026年普通高校招生錄取最低控制分數線公布

重慶市2026年普通高校招生錄取最低控制分數線公布

人民資訊
2026-06-24 16:42:37
解密加勒萬河谷沖突全過程,我軍是如何以80人擊潰印軍600人的?

解密加勒萬河谷沖突全過程,我軍是如何以80人擊潰印軍600人的?

阿胡
2024-12-02 14:33:09
降價也賣不動的合資燃油車開始主動撤出門店

降價也賣不動的合資燃油車開始主動撤出門店

界面新聞
2026-06-22 19:38:24
天空:皇馬將激活尼科-帕斯1000萬歐回購條款

天空:皇馬將激活尼科-帕斯1000萬歐回購條款

懂球帝
2026-06-23 20:18:11
黃粱一夢,俄國人加速撤離克島,烏3位前總統集體退還波蘭勛章

黃粱一夢,俄國人加速撤離克島,烏3位前總統集體退還波蘭勛章

史政先鋒
2026-06-21 20:15:46
所謂的愛情本質是肉體吸引,跟精神或者靈魂沒有半點關系

所謂的愛情本質是肉體吸引,跟精神或者靈魂沒有半點關系

加油丁小文
2026-06-07 11:00:11
WTT美國大滿貫抽簽確定!王楚欽、陳熠"扛旗",孫穎莎王曼昱缺席

WTT美國大滿貫抽簽確定!王楚欽、陳熠"扛旗",孫穎莎王曼昱缺席

史料布籍
2026-06-24 10:59:20
屋漏偏逢連夜雨!田新菊腦梗偏癱后,小天賜家又傳來另一壞消息

屋漏偏逢連夜雨!田新菊腦梗偏癱后,小天賜家又傳來另一壞消息

以茶帶書
2026-06-23 22:04:15
徹底涼透!馮小剛號稱3億執導的大片,上映第5天票房跌破250萬

徹底涼透!馮小剛號稱3億執導的大片,上映第5天票房跌破250萬

火山詩話
2026-06-24 05:43:02
南京樓市即將反轉,南京鼓樓區待售二手房從1.5萬套增到了2.1萬套

南京樓市即將反轉,南京鼓樓區待售二手房從1.5萬套增到了2.1萬套

石辰搞笑日常
2026-06-24 14:06:19
高市狂不了了,日本天皇發出警告,接班人已浮現,對華態度不簡單

高市狂不了了,日本天皇發出警告,接班人已浮現,對華態度不簡單

青煙小先生
2026-06-17 17:00:13
人生最大的愚蠢 ,就是把千辛萬苦賺來的錢借給別人

人生最大的愚蠢 ,就是把千辛萬苦賺來的錢借給別人

風起見你
2026-06-22 08:01:38
特控率約35%,本科率約78%,上海2026高考數據解讀與形勢分析

特控率約35%,本科率約78%,上海2026高考數據解讀與形勢分析

史海流年號
2026-06-24 05:04:47
14歲國少小將遭群毆后續:帶頭者身份被扒,多人被禁賽,警方介入

14歲國少小將遭群毆后續:帶頭者身份被扒,多人被禁賽,警方介入

北緯的咖啡豆
2026-06-24 16:50:21
37輛馬車押送金國太后、皇后趕往青城,蒙古主將下令將男子全拖走

37輛馬車押送金國太后、皇后趕往青城,蒙古主將下令將男子全拖走

磊子講史
2026-06-15 17:05:46
車主多店檢修無果求助,張雪直言非本店售出車輛不予故障診斷。

車主多店檢修無果求助,張雪直言非本店售出車輛不予故障診斷。

音樂時光的娛樂
2026-06-24 09:32:06
他接受紀律審查和 監察調查

他接受紀律審查和 監察調查

錫望
2026-06-24 11:32:57
2026-06-24 17:27:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15520文章數 66935關注度
往期回顧 全部

科技要聞

豆包專業版上線:定價68-500元每月

頭條要聞

村民搶建700平米房屋獲182萬拆遷補償被刑拘 家屬發聲

頭條要聞

村民搶建700平米房屋獲182萬拆遷補償被刑拘 家屬發聲

體育要聞

字母哥,會把凱爾特人拆了嗎?

娛樂要聞

向佐向佑兄弟合體直播!母子終于和解

財經要聞

爆料人:如果我錯了,賠償坐牢都接受

汽車要聞

施鵬澤:為什么奧迪E7X強調座艙氣味安全?

態度原創

本地
藝術
旅游
游戲
公開課

本地新聞

2026世界杯全勤太難?這份保姆級攻略請收好

藝術要聞

世界第一高樓差點姓“深”,高1111米!

旅游要聞

山為骨,水為血,天地為窖,時光為曲,釀一杯迎駕山河

505 Games 正式公布發行《ExeKiller》

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版