![]()
AI應(yīng)用風(fēng)向標(biāo)(公眾號:ZhidxcomAI)
作者|江宇
編輯|漠影
智東西6月15日報道,近日,豆包全量上線了任務(wù)模式。打開應(yīng)用后可以發(fā)現(xiàn),頂部模型切換欄已經(jīng)從原來的“快速、專家”兩檔模式,擴(kuò)展為“快速、專家、任務(wù)”三檔模式。
![]()
為了弄清楚任務(wù)模式到底能做什么,智東西第一時間進(jìn)行了體驗。我在任務(wù)模式下,直接向豆包提問:“你能完成哪些任務(wù)?”
隨即,豆包列出了一長串能力清單,其中包括產(chǎn)品設(shè)計與開發(fā)、文檔創(chuàng)作、數(shù)據(jù)分析、研究整理、多媒體創(chuàng)作、自動化工具以及瀏覽器網(wǎng)頁操作等多個方向。在回答的最后,豆包給出了一個頗為直接的定義:任務(wù)模式=端到端完成任務(wù)。
![]()
可見,豆包此次上線的任務(wù)模式,也已經(jīng)不再只是傳統(tǒng)意義上的聊天機(jī)器人,而更接近騰訊Workbuddy、月之暗面Kimi Work這類桌面智能體產(chǎn)品。
不過體驗下來發(fā)現(xiàn):豆包選擇了一條和不少桌面Agent不太一樣的路線。
一、豆包能“動手”幫我點咖啡了
最近,瑞幸上線了My Coffee Skill,支持搜索門店、瀏覽商品、下單、查詢訂單狀態(tài)等功能。于是我決定拿這個場景作為第一個測試。
![]()
我直接向豆包客戶端發(fā)送了My Coffee Skill的安裝地址。幾秒鐘后,豆包開始安裝My Coffee Skill。
![]()
整個過程中,豆包沒有彈出任何系統(tǒng)級權(quán)限申請窗口。既沒有要求訪問電腦,也沒有要求讀取本地文件,更沒有申請瀏覽器控制權(quán)限。安裝信息顯示,這個Skill會被部署到獨立運行目錄中。
這意味著至少在目前階段,豆包的思路并不是先獲取系統(tǒng)權(quán)限,再去完成任務(wù),反而是優(yōu)先通過Skill機(jī)制調(diào)用能力。
安裝完成后,豆包提示需要配置瑞幸MCP Token。這個Token可以直接在瑞幸AI開放平臺獲取。
![]()
配置完成后,豆包還專門詢問是否需要保存Token。保存之后,后續(xù)使用Skill時便無需重復(fù)配置。
![]()
隨后豆包開始搜索門店,這里出現(xiàn)了一個比較有意思的現(xiàn)象。它并沒有主動獲取我的實時位置,而是先整理出門店列表,讓我自行指定去哪一家門店取餐。換句話說,即便是在下單場景里,豆包依然沒有獲得定位權(quán)限。
![]()
確認(rèn)門店后,它開始搜索商品并生成訂單。在此期間,我故意給出一個相對模糊的需求——少冰。
豆包并沒有報錯,并且根據(jù)商品規(guī)則重新調(diào)整配置,再次確認(rèn)訂單內(nèi)容。
![]()
最終生成訂單后,我又打開瑞幸微信小程序進(jìn)行了對照。但是無論是商品價格還是優(yōu)惠券使用情況,兩邊均不一致,甚至在豆包下單還便宜了3角錢。
![]()
完成支付后,豆包繼續(xù)跟進(jìn)訂單狀態(tài),并成功返回取餐碼。
![]()
幾分鐘后,我順利拿到了這杯咖啡。
![]()
二、買完咖啡之后,我決定讓它順手做個App
既然已經(jīng)完成了一次下單,我索性繼續(xù)加大難度。我把一個咖啡愛好者App的需求直接扔給了豆包。
這個App需要能夠記錄每日咖啡、統(tǒng)計咖啡因攝入量、生成分享卡片,并支持查看長期數(shù)據(jù)趨勢。
收到需求后,豆包直接進(jìn)入任務(wù)執(zhí)行狀態(tài)。與普通聊天模式最大的區(qū)別在于,它會主動拆解任務(wù),并實時展示當(dāng)前執(zhí)行進(jìn)度。在此期間,用戶可以選擇追加信息,也能直接結(jié)束任務(wù)。
![]()
隨后,豆包給出了一整套交付結(jié)果。除了產(chǎn)品方案和UI設(shè)計稿之外,它還生成了完整的SwiftUI代碼,以及一個能夠直接運行的網(wǎng)頁Demo。
![]()
▲產(chǎn)品方案與SwiftUI代碼
細(xì)看這份完整方案文檔,豆包是按照一份正式產(chǎn)品文檔的結(jié)構(gòu)展開的。
![]()
文檔開頭就先給出產(chǎn)品定位,隨后,豆包繼續(xù)拆出了產(chǎn)品概述、市場定位、用戶畫像、核心功能、頁面流程與交互設(shè)計等內(nèi)容。其中,還包括:核心用戶群體、用戶使用場景、貼紙式記錄系統(tǒng)、咖啡因智能統(tǒng)計、時間流手賬首頁、分享創(chuàng)意工坊等更細(xì)分的模塊。
比較有意思的是,這份文檔最后還自動寫上了版本號、日期和作者信息。作者一欄顯示為“SuperDoubaoAgent Product Team”,有點像豆包給自己臨時組了一個產(chǎn)品團(tuán)隊。
![]()
同時,這份文檔出現(xiàn)在一個可繼續(xù)編輯的文檔編輯器里,用戶可以繼續(xù)手動修改內(nèi)容,也可以直接調(diào)用AI繼續(xù)優(yōu)化。
打開網(wǎng)頁Demo后,一個手機(jī)模擬器直接出現(xiàn)在頁面中央。
![]()
首頁展示當(dāng)天咖啡因攝入量;底部中央按鈕用于記錄咖啡;
![]()
統(tǒng)計頁面展示趨勢變化;分享頁面則負(fù)責(zé)生成分享卡片。
![]()
我也很快發(fā)現(xiàn)了一個問題。在初始版本里,底部導(dǎo)航欄中央用于添加咖啡記錄的“+”按鈕采用了懸浮設(shè)計,但位置明顯高于兩側(cè)導(dǎo)航按鈕,看起來并不協(xié)調(diào)。
如果是傳統(tǒng)開發(fā)流程,這時候通常需要重新修改代碼、編譯預(yù)覽,再查看效果。不過在豆包這里,我直接進(jìn)入了可視化編輯模式。
![]()
選中按鈕后,我輸入了一句非常簡單的需求:“與下方其他按鈕水平對齊。”隨后豆包開始調(diào)整頁面布局,并重新生成預(yù)覽。
![]()
與很多AI工具依然圍繞代碼展開不同,豆包這里已經(jīng)開始嘗試把“設(shè)計修改”從代碼層抽離出來。對于不會寫代碼的用戶來說,直接描述需求,可能比修改代碼更符合直覺。
另一個比較細(xì)節(jié)的設(shè)計是版本管理。每次完成修改之后,系統(tǒng)都會自動生成新的版本記錄。用戶可以在V1、V2等多個版本之間自由切換。
![]()
三、幾個開發(fā)小細(xì)節(jié),讓代碼小白狂喜
做完基礎(chǔ)Demo之后,我還給豆包追加了一個需求:為每一杯咖啡添加精美貼圖。
收到需求后,豆包立馬分析了貼圖對于產(chǎn)品體驗的影響,隨后規(guī)劃了貼圖設(shè)計方案、頁面替換方案以及后續(xù)渲染邏輯。隨后,它又進(jìn)一步拆分出貼圖顯示優(yōu)化、頁面渲染更新以及功能實現(xiàn)等多個子任務(wù),并逐步推進(jìn)。
完成修改之后,網(wǎng)頁Demo中的咖啡記錄與選擇頁面直接發(fā)生了變化。原本較為簡單的文字被替換成了風(fēng)格統(tǒng)一的咖啡插畫,整體視覺豐富了不少。
與此同時,貼圖的配色也延續(xù)了產(chǎn)品原本的咖色系設(shè)計,沒有出現(xiàn)明顯的風(fēng)格割裂。
![]()
完成貼圖之后,我又繼續(xù)追問:還能增加什么功能?這一次,豆包直接給出了25+個功能創(chuàng)意。
![]()
既包括咖啡因攝入預(yù)警、年度咖啡報告、咖啡地圖,也包括咖啡豆收藏、好友打卡、沖煮記錄等偏社區(qū)方向的功能。對于缺乏產(chǎn)品經(jīng)驗的用戶來說,相當(dāng)于多了一位能夠持續(xù)提供創(chuàng)意的產(chǎn)品經(jīng)理。
五、圖片、文案、視頻一起上,能調(diào)度更多工具
最后,我又加了一個更進(jìn)一步的任務(wù)。豆包既然能把App做出來了,不如順手借助其生圖和生視頻的能力,再生成一支宣傳視頻。
收到需求后,豆包開始自動規(guī)劃任務(wù)。先調(diào)用生圖工具生成宣傳圖,再匹配上廣告文案,隨后拆解鏡頭和分鏡。
![]()
不過在最終的視頻生成環(huán)節(jié),工具出現(xiàn)了異常。最終,豆包判斷當(dāng)前更可能是視頻工具服務(wù)異常。
隨后,豆包主動給出兩種替代方案:一種是利用現(xiàn)有素材在剪映中快速制作簡單視頻;另一種則是保留完整視頻腳本和分鏡,等待后續(xù)重新生成。
雖然最終廣告片沒有成功產(chǎn)出,但整個過程中能夠明顯感覺到Agent與傳統(tǒng)聊天機(jī)器人的區(qū)別。
任務(wù)模式下,豆包已經(jīng)不只是回答問題,而是能夠圍繞一個目標(biāo)任務(wù),調(diào)用Skill、連接MCP,并協(xié)調(diào)代碼、圖片、視頻等不同工具共同完成工作。
同時,豆包也選擇了一條相對克制的路線。
至少從本次體驗來看,無論是咖啡下單還是App開發(fā),它都沒有主動獲取定位權(quán)限,也沒有申請電腦控制權(quán)限或本地文件訪問權(quán)限。相比一些強(qiáng)調(diào)“接管電腦”的桌面Agent產(chǎn)品,豆包在有限權(quán)限下,盡可能完成更多任務(wù)。
對于擁有龐大用戶規(guī)模的產(chǎn)品來說,這條思路或許更容易落地。
從此次上線的任務(wù)模式來看,豆包顯然已經(jīng)不滿足于繼續(xù)做一個聊天機(jī)器人,也開始向桌面Agent方向邁進(jìn)。而這條賽道上已經(jīng)站著Codex、Claude Code,以及積累了一定AI辦公場景經(jīng)驗的騰訊WorkBuddy。
對于豆包來說,任務(wù)模式或許只是第一步。未來,豆包究竟能夠接管多少工作,又會以什么方式接管,仍值得持續(xù)觀察。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.