无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

測完幾個Agent工具,我發(fā)現(xiàn)他們能代打游戲了。。。

0
分享至


發(fā)個指令,給點權(quán)限,AI就能自己打開游戲庫庫玩了。

不懂咋玩?那就截圖識別。沒法操作?直接現(xiàn)搓腳本。操作一坨?甚至還能上網(wǎng)自己找攻略。

這就是現(xiàn)在跑在你電腦上的 AI Agent 能做到的事兒。

Codex


世超把市面上的一些 Agent 工具測了一遍,比如Codex,TRAE,QoderWork,Workbuddy,Marvis等等。

只能說,這玩意兒吹了這么久,大伙兒可能真不用再觀望了。

從左向右依次為:第一行WorkBuddy,TRAE,Marvis;第二行Codex,QoderWork,悟空


當(dāng)然,一聽 code 啥的,大伙兒可能覺得是為專業(yè)開發(fā)者造的,門檻高,學(xué)起來用起來會很麻煩。

誒,莫擔(dān)心,大廠們也都悄摸進(jìn)化一輪了。

之前確實硬核了點,一個兩個的都照搬 VS Code 那種傳統(tǒng)的編程頁面,適合開發(fā),但并不適合和 AI 一起開發(fā)。

VS Code頁面


既然引入 Agent 了, 那肯定得重新設(shè)計,畢竟它是來干活的,而人是監(jiān)督它的。

所以大家都很默契地改了同一套交互邏輯,把具體的代碼隱去,再把 Agent 干活兒時的日志顯示出來。

在網(wǎng)頁里你可以叫它老師,但在 Agent 工具里,你得化身老板,把活兒給攤派明白。

Codex


咱先來看界面,也很簡潔,主要三個部分。

左邊是你手底下掌管的項目,中間是常規(guī)的聊天窗口,右邊就能看到等待驗收的東西了 ( 一般等工作開始了才會有動靜 )。




向左滑動,依次為:Codex,TRAE,WorkBuddy,Qoderwork

能 BB 就不動手,咱先去 Agent 工具的 “ 應(yīng)用商店 ” 里逛逛,看看有啥合適的技能包,也就是 Skill,給 Agent 裝上左膀右臂。

能看到,琳瑯滿目啊,畢竟活兒的種類也就那么多,所以但凡有名有姓的基本都能扒拉到現(xiàn)成的方案。

什么數(shù)據(jù)分析,內(nèi)容創(chuàng)作都不在話下,雖然不至于個個都好用,但參考參考終歸是能少走點彎路的。

Marvis


其中做的比較有新意的是騰訊新出的 Marvis,把技能商店做成了類似小紅書的信息流,可以邊刷邊收藏技能。

再加上技能在這些工具里是通用的,所以最近小紅書自己也上線了 Skill 商店,用起來也相當(dāng)方便。

當(dāng)然,就算挑不過來也沒關(guān)系,技能商店里還有幫咱選技能的技能。

Codex 里叫 Skill Installer,WorkBuddy 里叫 Find Skills,算是將懶人式進(jìn)行到底。

左:Codex;右:WorkBuddy


至于自己造技能倒是不用急,雖然可以通過 AI 一步步引導(dǎo)造出來,但先射箭后畫靶一般都不好使。

好的技能往往是先自己跑通幾遍,再提煉總結(jié),會更接地氣,也更貼合自己的使用場景。



向左滑動,依次為:WorkBuddy,TRAE

選好技能就可以開始任務(wù)了,這里在開始前需要選一下任務(wù)類型,默認(rèn)的是普通款,但一般 Plan 模式更好使。

這點還挺重要的,因為很多時候結(jié)果不理想不是 Agent 太笨了,而是咱自己也不知道想要什么。

這個 Plan 就是在任務(wù)開始前先規(guī)劃一下,明確任務(wù)的條條框框。

有什么不妥就直接改了,不用等到最后才發(fā)現(xiàn)方向跑偏了。

Codex


簡單說一下咱要做什么,就能敲回車下發(fā)指令了。

為了看具體流程,咱挑 3 個幸運兒來展示一下,OpenAI 的 Codex,字節(jié)的 TRAE 和 騰訊的 WorkBuddy,國內(nèi)外的都拉出來溜溜。

任務(wù)就原地 TP,讓它們仨銳評它們仨。

此時就能發(fā)現(xiàn) Plan 的好處了,比如執(zhí)行任務(wù)前,Codex 和 TRAE 都向我二次確認(rèn)了下 WorkBuddy 具體是哪一個,因為國外有同名的應(yīng)用,容易混淆。

TRAE


當(dāng)然,由于都是默認(rèn)的模型,速度有快有慢,但就報告結(jié)果來看,確實各有 “ 特點 ” 吶。

WorkBuddy


先說 WorkBuddy,給到一個老實人,上來也沒問我報告是個啥形式,吭哧吭哧就是干。

最后給的網(wǎng)頁,就效果來看,還是不錯的,排版和內(nèi)容雖然 AI 味道重了點,但花里胡哨的符合咱銳評的主基調(diào)。

而且調(diào)研后的結(jié)論相當(dāng)?shù)驼{(diào),把自己放在了靠后的位置,噴起自己毫不手軟,實誠這一塊兒到位了。

TRAE


再來看 TRAE ,給到一個人上人,活兒干的比較細(xì)致,不管是前期的彈出式的表單規(guī)劃,還是中間的調(diào)研,思路都很清晰,子 Agent 的調(diào)用也是相當(dāng)熟練了。

核心結(jié)論里,雖然把自己排到了老大,但考量了 6 個維度,總分是加權(quán)出來的,也算是有理有據(jù)了。

Codex


最后的 Codex,基本就是目前這個領(lǐng)域的標(biāo)桿了,報告里先來一手信源分析,就跟大伙兒拉開了點距離,下面的評價也能明顯感覺到更深入一些,結(jié)合了官方產(chǎn)品文檔的內(nèi)容。

模型好確實有優(yōu)勢,但考慮到國內(nèi)用起來不方便,暫且給到一個半夯吧。

接下來,任務(wù)繼續(xù),讓他們把各自的報告生成一份可視化的落地頁。

你可能會說這活兒在網(wǎng)頁里也能做,而且還更快。

Gemini


倒也沒錯,但不同的點在于,這里你不需要把代碼再復(fù)制粘貼到本地了,而且最重要的,Agent 會自己調(diào)用工具,去檢查成品有沒有 BUG。

比如同樣的任務(wù),交給網(wǎng)頁的 Gemini,這家伙甩給我?guī)装傩写a,我粘到本地打開,發(fā)現(xiàn)一片空白。。。

而這些 Agent 會在交付之前就避免這種情況。

WorkBuddy


WorkBuddy 是自己調(diào)用了 3 次預(yù)覽,做了 2 次優(yōu)化,才把網(wǎng)頁交給我。

TRAE


TRAE 直接一些,直接打開了內(nèi)置的瀏覽器,通過不同角度的截圖識別,打不開就刷新重試,直到確認(rèn)渲染效果符合預(yù)期。

Codex 也一樣, 權(quán)限不夠,老是截不著網(wǎng)頁,試了 N 次才確認(rèn)好效果。

所以落地頁的效果倒是其次,重點是這套任務(wù)執(zhí)行的邏輯,是跟網(wǎng)頁端應(yīng)付交差完全不同的打法。

特別是截圖反饋的工具調(diào)用,相當(dāng)于給電腦安了個賽博義眼。

而像 Codex 這種更進(jìn)一步,有 Computer Use 功能,可以全局截圖反饋,然后操作。相當(dāng)于你電腦上的軟件,它都能打開,等模型能力更猛了,代打幾局 LOL 也不是不可能。

Codex


當(dāng)然,除了技能 skill,這些 Agent 工具還能接入其他應(yīng)用,像是 GitHub,郵箱,網(wǎng)盤等。

更妙的是接入一些通訊軟件,像微信,飛書,這也是龍蝦當(dāng)初火起來的一大原因。

接入后就能雙向鏈接,甭管是從 Agent 往飛書發(fā)文檔,還是從微信命令 Agent 往工位上下載資料,都沒問題。

WorkBuddy


像是之前遠(yuǎn)程軟件的升級版,加了個 Agent 當(dāng)管家,幫你 24 小時盯著自己的電腦,隨叫隨到。

或者有一些定時的任務(wù),也能找到 “ 自動化 ” 這種類型的入口,讓它接管每天枯燥重復(fù)的流程性任務(wù)。





向左滑動,依次為:Codex,TRAE,WorkBuddy,Marvis

說了這么多,其實無論是什么手段,裝什么插件,本質(zhì)上都是在約束,控制著 Agent 朝咱預(yù)定的方向產(chǎn)出東西。

有大佬精心優(yōu)化的工作流,有廠商調(diào)教好的記憶系統(tǒng),也有方便實用的技能包。

用專業(yè)點的話說這些都是 “ Harness ”,原意是給馬套上馬具,放這兒也是非常貼切了。


無論馬具下面的模型是哪一匹,這些 Agent 工具都得隨套隨用。

就用起來的體感而言,Codex 是比較夯的,模型給力,額度還偶爾重制,雖然需要一點手段,但比起 Claude 要簡單得多,適合想體驗頂尖性能的折騰黨。

要是不想麻煩,直接用國內(nèi)大廠的方案也行,嫌默認(rèn)的模型笨,就去買點 DeepSeek 的 API 接上,也是妥妥的性價比平替。

至于平替里面選哪一個就取決于你的使用場景了,微信和 WorkBuddy 搭伙方便,飛書和 TRAE 集成更深,釘釘那邊就是 Qoder 以及咱沒測到的悟空了,不過邏輯都是一樣的。


但話說回來,Agent 工具也是有缺點的,就是上的手段越多,花費的模型 Token 也越多,動不動幾十分鐘的長線任務(wù),賬單會變得賊拉長。

所以有什么便宜管飽的模型套餐,大伙兒就各顯神通吧。。。

而要是不太繁瑣的活兒,這些 Agent 工具也有免費的額度,白嫖一下嘗嘗咸淡總是不虧的。

撰文:風(fēng)華

編輯:江江 & 面線

美編:煥妍

圖片、資料來源

Codex, TRAE, WorkBuddy, Marvis,QoderWork,悟空


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
我59歲才頓悟一個道理:如果別人請客不想去,千萬別傻傻地回“有事去不了,下次再約”,高情商的人這樣回應(yīng)

我59歲才頓悟一個道理:如果別人請客不想去,千萬別傻傻地回“有事去不了,下次再約”,高情商的人這樣回應(yīng)

心理觀察局
2026-05-13 09:07:23
景甜身材真豐腴!穿緊身T恤+短褲秒變“大號水蜜桃”,又純又欲

景甜身材真豐腴!穿緊身T恤+短褲秒變“大號水蜜桃”,又純又欲

蓓小西
2026-05-24 09:31:04
央視提醒家家戶戶應(yīng)急儲備?這次真該重視的3個意外細(xì)節(jié)

央視提醒家家戶戶應(yīng)急儲備?這次真該重視的3個意外細(xì)節(jié)

奇思妙想生活家
2026-05-31 00:49:07
普京怒了:這簡直是恥辱和噩夢

普京怒了:這簡直是恥辱和噩夢

封面新聞
2026-05-30 18:54:17
“都把兒子養(yǎng)雌化了!”初中男孩出現(xiàn)雌化現(xiàn)象,家長卻執(zhí)迷不悟

“都把兒子養(yǎng)雌化了!”初中男孩出現(xiàn)雌化現(xiàn)象,家長卻執(zhí)迷不悟

妍妍教育日記
2026-05-29 07:55:13
人餓到極致身體會發(fā)生哪些變化?網(wǎng)友:直接逼出了茹毛飲血的技能

人餓到極致身體會發(fā)生哪些變化?網(wǎng)友:直接逼出了茹毛飲血的技能

夜深愛雜談
2026-05-30 08:28:26
港獨、罵中國人,如今卻還想來內(nèi)地?fù)平?,這3位香港明星令人作嘔

港獨、罵中國人,如今卻還想來內(nèi)地?fù)平?,這3位香港明星令人作嘔

傲傲講歷史
2026-04-19 01:20:08
崔天凱:如果真關(guān)心臺灣問題 就支持中國實現(xiàn)統(tǒng)一

崔天凱:如果真關(guān)心臺灣問題 就支持中國實現(xiàn)統(tǒng)一

看看新聞Knews
2026-05-31 01:14:08
扎克伯格再出王炸!開源全球首個AI蛋白質(zhì)世界模型,最高88%命中率,顛覆藥物研發(fā)!

扎克伯格再出王炸!開源全球首個AI蛋白質(zhì)世界模型,最高88%命中率,顛覆藥物研發(fā)!

智藥局
2026-05-28 19:10:25
王菲看謝霆鋒北京演唱會,害羞得躲在俞飛鴻身后,陳魯豫也陪著

王菲看謝霆鋒北京演唱會,害羞得躲在俞飛鴻身后,陳魯豫也陪著

八卦寶寶
2026-05-30 21:40:10
【微特稿】白宮公布特朗普年度體檢報告:增重超6公斤

【微特稿】白宮公布特朗普年度體檢報告:增重超6公斤

新華社
2026-05-30 19:54:05
金溥聰目的終于達(dá)到!馬英九方正式提告蕭旭岑,蔡正元努力全白費

金溥聰目的終于達(dá)到!馬英九方正式提告蕭旭岑,蔡正元努力全白費

青杍無夢
2026-05-29 20:51:07
釋永信四罪并罰,不僅資產(chǎn)、私生子多,還有3位家喻戶曉明星徒弟

釋永信四罪并罰,不僅資產(chǎn)、私生子多,還有3位家喻戶曉明星徒弟

飄逸的云朵
2026-05-31 01:56:53
難以置信!網(wǎng)傳遼寧83年女生還是黃花閨女,哭訴三段戀情無疾而終

難以置信!網(wǎng)傳遼寧83年女生還是黃花閨女,哭訴三段戀情無疾而終

火山詩話
2026-05-01 06:40:06
香港網(wǎng)友質(zhì)疑黎家盈宇航服名牌拼音錯誤,實則是嚴(yán)肅的國家隊規(guī)矩

香港網(wǎng)友質(zhì)疑黎家盈宇航服名牌拼音錯誤,實則是嚴(yán)肅的國家隊規(guī)矩

普陀動物世界
2026-05-31 00:11:00
烏克蘭拆解“榛樹”導(dǎo)彈,結(jié)果震驚西方,七十年代古董為何能破盾

烏克蘭拆解“榛樹”導(dǎo)彈,結(jié)果震驚西方,七十年代古董為何能破盾

逐夢先鋒
2026-05-29 18:25:51
赴泰國失聯(lián)的4名男子已從緬甸轉(zhuǎn)移到曼谷,警方還意外解救一名40歲云南男子:家屬稱其不會用電腦園區(qū)不要他,讓給3萬元路費,最后翻墻逃跑

赴泰國失聯(lián)的4名男子已從緬甸轉(zhuǎn)移到曼谷,警方還意外解救一名40歲云南男子:家屬稱其不會用電腦園區(qū)不要他,讓給3萬元路費,最后翻墻逃跑

每日經(jīng)濟(jì)新聞
2026-05-30 15:09:11
消費新圖景|銀發(fā)經(jīng)濟(jì)解鎖品質(zhì)養(yǎng)老新生活

消費新圖景|銀發(fā)經(jīng)濟(jì)解鎖品質(zhì)養(yǎng)老新生活

新華社
2026-05-30 10:25:40
馬刺雷霆誰能贏下?lián)屍叽髴?zhàn)?楊毅、蘇群、字母哥發(fā)表了看法

馬刺雷霆誰能贏下?lián)屍叽髴?zhàn)?楊毅、蘇群、字母哥發(fā)表了看法

籃球大視野
2026-05-30 10:32:37
人活多久,看喝酒就知道?壽命短的人,喝酒一般有這6個特征

人活多久,看喝酒就知道?壽命短的人,喝酒一般有這6個特征

芹姐說生活
2026-05-14 23:38:55
2026-05-31 02:35:00
差評XPIN incentive-icons
差評XPIN
用知識和觀點Debug the world!
10859文章數(shù) 489653關(guān)注度
往期回顧 全部

科技要聞

車圈大佬發(fā)聲:價格戰(zhàn)遠(yuǎn)去,但競爭仍殘酷

頭條要聞

兩名9歲女孩被困電梯近2小時 求救幾十次物業(yè)無動于衷

頭條要聞

兩名9歲女孩被困電梯近2小時 求救幾十次物業(yè)無動于衷

體育要聞

歲月不饒人!39歲德約鏖戰(zhàn)近5小時拼到嘔吐

娛樂要聞

張碧晨《歌手》 “活人微死” 自嘲

財經(jīng)要聞

雙匯管不住一頭豬

汽車要聞

900V+3.2秒破百 領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

態(tài)度原創(chuàng)

手機(jī)
時尚
教育
房產(chǎn)
游戲

手機(jī)要聞

REDMI K90至尊版入網(wǎng)?K90單品激活破200萬

美回巔峰的她們,帶火的這些爆款真的好用嗎

教育要聞

四大名著怎么選?Young媽按年齡給大家整理好進(jìn)階路線啦

房產(chǎn)要聞

紅動五月!全國搶入核心資產(chǎn),廣州盯緊凱旋新世界!

巫師3新DLC跨十年:年輕玩家在初發(fā)售時還是小孩!

無障礙瀏覽 進(jìn)入關(guān)懷版