網易首頁 > 網易號 > 正文 申請入駐

比DeepSeek更香的,是今年爆火的Agent,外包工作的含金量懂不懂

0
分享至

今年WAIC昨天已經結束了,以黑馬所知的情況來看,今年大家最關注的毫無疑問還是機器人。

雖然這群硅基生命在經歷了一年的沉淀之后,依舊保留著碳基人類所缺少的那種小腦缺失的美感。(bushi)

相對而言,其實工業機械臂的表現好了不止一星半點,但大家討論最多的依舊是人形機器人。

我覺得吧,人類可能還是對類人形態更感興趣一點。

在大部分機器人展位還停留在“看個熱鬧”的情況下,黑馬明顯對那些當下已經可以服務于人類(尤其是黑馬這種搬磚人)的東西更感興趣。

科技既然是造福人類的,請讓我率先享受。(bushi)

去年橫空出世的DeepSeek將大模型的實用性拔高到了一個新的層次,到了今年,將大模型與場景綁定更深的、生產力落地的Agent,就成為了兵家必爭之地。

盲猜應該有朋友還不知道Agent是什么,簡單來說就是一個基于AI大模型構建的,能夠完成具體事情的智能體。

相比于大模型需要我們主動去輸入指令,一步一步獲取信息達到目的,Agent的好處在于你只用給出一個目標,過程它會自己去琢磨,你只用坐等一個結果就好了。

是不是感覺很眼熟,這不就外包嘛!

作為天天一線搬磚的牛馬,Agent代表的生產力解放是黑馬最饞的,而當下市面上的Agent產品,雖然不能說很多,但頭部的廠商基本都已經下場。

目前市面上體量比較大的通用Agent像Manus(已經退出中國市場)、通義千問、kimi、MinMax Agent(面向海外)、扣子空間、夸克AI、納米AI都已經趨于成熟。

黑馬今天就淺撈了扣子空間、通義千問和kimi智能體三個Agent來試試,看看能不能幫我完成日常工作。

首先聲明,測試結果僅為黑馬以特定目的為前提的純主觀感受,并不代表Agent的綜合能力,建議大家親自體驗之后再做判斷。

以及還有更多諸如Manus、MinMax Agent、Genspark等優秀的Agent,但考慮到成本問題這次暫時擱置,如果大家想看我們之后再測。

PPT制作

作為最容易出“成果”的工作內容,各位牛馬估計對PPT又愛又恨。

如果給“最想外包出去的活”做個排名,黑馬大概會把PPT放在第一個。

于是,黑馬首先讓三個Agent給我做了一個“理想i8發布會PPT”,直接來看效果。

表現最好的是扣子空間,在我提出要求之后,扣子有明顯的步驟思考,比如先確定理想i8的產品信息;

然后又搜索了i8的設計細節、競品情況等;

最后給到一個大綱讓我確認。

因為是測試,所以我沒有做任何調整,扣子給我的PPT風格確認中,也直接選擇了智能選擇。

大概等了9分鐘之后,扣子給到了一份理想i8發布會PPT。

說實話,扣子輸出的PPT和真正的發布會PPT還是有一定差距的。

但考慮到全程我只給了一句話,其余什么干涉都沒有,全靠扣子自己扒拉素材,甚至用有限的素材給我整了個配色方案和車內空間設計。

就這效果,日常拿來糊弄應該問題不大的。(扣子也是三個里面唯一自己找了i8相關配圖的Agent)

不過理想發布會昨晚就已經開過了,扣子搜到的素材還是早期的爆料圖,信息檢索方面還有待進步啊。

接下來是通義千問。(PS:通義千問也有自己的PPT智能體)

在我提出要求之后,千問非常快速(不超過5s)的生成了一個大綱,我們可以在大綱里自行刪減。

下方可以選擇PPT風格,但沒有扣子空間那樣的智能選擇,必須自己確定模板。

等都確定好之后點擊下一步就可以生成得到一個PPT。

從結果來看,通義千問生成的PPT更加模板化,黑馬感覺就是將生成的大綱直接塞進了PPT模板里。

模板和內容之間沒有邏輯關系,產品細節也缺失,圖片只能選擇自己上傳或者AI生成,相比扣子有點呆。

如果要使用通義生成的內容,黑馬感覺少不了自己返工。

Kimi的表現和通義千問差不太多,都是根據要求直接生成大綱,但不支持修改,模板也需要自己確定。

成品也是PPT模板+大綱的拼接,但相比通義千問,有著更濃郁的毛坯房的味道。

PPT這一趴,扣子完勝。

內容檢索和總結

做完PPT,黑馬決定讓三位幫我進行內容信息檢索和總結。

我提出的要求是:檢索微信公眾號上關于WAIC 2025熱門話題,總結主要觀點并輸出成PDF文件。

扣子在經過了7輪思考之后,期間自主調動了LinkReaderPlugin等工具輔助驗證,終于確定沒有辦法鎖定公眾號來源。

最終扣子給了我一份不限平臺的WAIC熱點總結。

從內容來看,扣子輸出的內容只能說中規中矩,內容是完備的,但有點過于簡潔了,在大眾反饋上有一些信息缺失。

另外純文字看著有點難受,不過額外發出指令就能夠重新生成補充圖表。

通義千問直接告訴我沒有辦法檢索微信公眾號的內容,然后根據官方消息和媒體報道生成了一個熱點總結。

但從輸出的內容來看,通義千問相對扣子來說邏輯要更清晰一點,總結的點也更到位。(完整內容見連接:

https://lxblog.com/qianwen/share?shareId=bf507481-667f-468d-8f5d-476b81c3caae&type=agentChat)

不過通義不支持圖表輸出,看著有點抽象。

到了Kimi就更抽象了,kimi大概只用了2s時間就檢索完了所有信息,并給到了一個PDF下載鏈接。

但遺憾的是這個鏈接點進去是空的,啥也沒有。

而我們只得到了一個很簡略的摘要,簡短到讓我摳腦殼。

Emmmm……只能說進步空間還很大吧。

對了,我還嘗試了Kimi的學術搜索智能體,但最開始因為無法檢索公眾號,所以任務直接中斷,第二次我沒有要求平臺了,但檢索結果也不理想,甚至很多信源是前幾年的。

總的來說,內容檢索和總結上,扣子在多形態信息輸出上更有優勢,但個人感覺如果只需要簡短的文字總結,通義千問的檢索和總結能力更厲害。

Kimi的話……未來可期,嗯。

寫文章

最后,黑馬把爪子伸向了我的老本行,寫文章。

自從AI搜索普及之后,黑馬在寫作過程中通常都少不了AI幫忙檢索信息,但至今還沒找到一個能直接幫我寫文章的。

于是黑馬又提出一個要求:我的公眾號面向手機汽車泛科技圈新聞等受眾,我的文章內容要求:文章生動有趣,深入淺出,有自己的觀點,內容來源有事實依據,生成一篇公眾號文章。

這個要求定位主打一個寬泛,像極了黑馬領導給黑馬布置任務時候的要求,需要Agent發揮極致的自主能動性。

還是先來看扣子,扣子依舊邏輯清晰的開始思考,在我圈定的手機汽車泛科技范圍內進行熱點檢索。

不過扣子在理解最終需求的時候還是比較保守,選擇了手機汽車生態交叉的地方為切入點。

思考過程這里就不詳細放圖了,淺放一下扣子生成的文章:

扣子確實給到了一個觀點:手機和汽車的生態綁定逐漸加深。但不妨礙文章整體還是單純的素材羅列。

看來在寫文章方面,目前的AI還是無法一步到位完成工作,需要更細致的調教,比如直接給出大綱。

壞消息:工作外包失敗。

好消息:還沒被AI替代。(bushi)

因為我沒在通義千問找到官方的寫作智能體(非官方的很難用可以忽略),所以這趴通義缺席。

直接來看kimi。

Kimi依舊缺少思考過程,在檢索了7個網站后,就給出了一個手機和汽車的“黑科技”的文章。

可能也是我給的范圍太寬泛的原因,kimi的文章看著沒有重點,分別寫了手機拍照、折疊屏、智能駕駛、新能源環保等事情。

個人感覺文章是通過關鍵詞檢索后直接將內容組合而成,不管是時效性還是文章整體脈絡都存在很大的問題。

如果把這趴和上一趴結合來看,扣子通過更清晰的指令和多次修正,應該能夠創作出不錯的文章,但在創作力方面可能還有所欠缺。

按照黑馬的過往經驗,豆包和deepseek在這方面應該更有優勢。(感興趣的可以測測)

好了,以上就是這次的測試內容,再次提醒:測試項目和內容是黑馬從自身需求出發隨機出的,僅供參考。

扣子空間給我的驚喜比較大,它有一套完整的項目邏輯,是符合我認知里Agent的定義的,相對而言,kimi和通義千問距離Agent其實還有一點距離。

但說實話,這次的對比其實不是很明顯,幾個產品效果相差有點大了,搞得像在恰米。(真沒恰)

但其他比較好用的Agent要么只面向海外,要么需要付費,扣子相對而言是我們能接觸到的門檻比較低的Agent。

其實我還是很期待國內能有更多好用的Agent產品出現的。

如果大家有好用的Agent推薦,可以在評論區分享。

我可太想進步了。

撰文:柯然

編輯:小馬哥

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
車圈最卷的時候,有人開始做減法

車圈最卷的時候,有人開始做減法

虎嗅APP
2026-04-25 16:02:28
倆女子大鬧上海地鐵,拳打薅頭滿臉血,攔都攔不住,結局令人舒適

倆女子大鬧上海地鐵,拳打薅頭滿臉血,攔都攔不住,結局令人舒適

奇思妙想草葉君
2026-04-26 02:02:15
37歲男籃傳奇人物:定居廣東,身居要職財富自由,娶嬌妻生雙胞胎

37歲男籃傳奇人物:定居廣東,身居要職財富自由,娶嬌妻生雙胞胎

尋墨閣
2026-04-26 01:21:55
森林狼又傷一人:愛德華茲落地左膝過度伸展受傷 被隊友攙扶離場

森林狼又傷一人:愛德華茲落地左膝過度伸展受傷 被隊友攙扶離場

醉臥浮生
2026-04-26 09:48:54
首組2-2!尼克斯大勝老鷹進天王山 唐斯20+10+10布倫森19分

首組2-2!尼克斯大勝老鷹進天王山 唐斯20+10+10布倫森19分

醉臥浮生
2026-04-26 08:52:23
交警提醒:5月開始全國嚴查,這些行為一律扣分罰款,車主別大意

交警提醒:5月開始全國嚴查,這些行為一律扣分罰款,車主別大意

復轉這些年
2026-04-25 23:39:55
離譜到家!湖人G4故意輸球!?就為了這個...

離譜到家!湖人G4故意輸球!?就為了這個...

柚子說球
2026-04-25 21:20:46
百年品牌底蘊加持:別克至境E7如何填平中國家庭的新能源真空區

百年品牌底蘊加持:別克至境E7如何填平中國家庭的新能源真空區

大眾侃車
2026-04-25 18:32:13
震驚!東方甄選員工集體辭職要挾俞敏洪,被網友直言“蠢出天際”

震驚!東方甄選員工集體辭職要挾俞敏洪,被網友直言“蠢出天際”

火山詩話
2026-04-26 07:09:07
重返WNBA首秀!韓旭替補10中6轟20分全場最高 難阻自由人慘敗

重返WNBA首秀!韓旭替補10中6轟20分全場最高 難阻自由人慘敗

醉臥浮生
2026-04-26 05:35:45
長沙公園驚現 “老年服務圈”!低價剛需服務,姑娘邊服務邊嘮嗑

長沙公園驚現 “老年服務圈”!低價剛需服務,姑娘邊服務邊嘮嗑

社會日日鮮
2026-04-25 19:09:27
色情片并不可怕,但它會偷走你的“勁”,讓你做什么都索然無味

色情片并不可怕,但它會偷走你的“勁”,讓你做什么都索然無味

知識圈
2026-04-26 09:35:01
華晨宇哭了損失大了,在云南投資上億拿下地皮,如今緊急叫停

華晨宇哭了損失大了,在云南投資上億拿下地皮,如今緊急叫停

以茶帶書
2026-04-25 16:22:06
58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

墨印齋
2026-04-24 16:43:38
誰把東方甄選的主播們逼走了? 俞敏洪一天損失四員大將!主播明明等發公開信直指新管理層“不友好”

誰把東方甄選的主播們逼走了? 俞敏洪一天損失四員大將!主播明明等發公開信直指新管理層“不友好”

新浪財經
2026-04-25 18:08:34
廣場舞噪音亂入!深圳一演唱會現場遭觀眾吐槽,官方回應

廣場舞噪音亂入!深圳一演唱會現場遭觀眾吐槽,官方回應

南方都市報
2026-04-25 15:33:03
因突發事件撤離晚宴后 特朗普發帖:已建議“讓活動繼續進行”

因突發事件撤離晚宴后 特朗普發帖:已建議“讓活動繼續進行”

財聯社
2026-04-26 09:36:05
女子深圳公交站臺勸阻男子抽煙起沖突,當地通報:責令男子改正,并處行政罰款

女子深圳公交站臺勸阻男子抽煙起沖突,當地通報:責令男子改正,并處行政罰款

封面新聞
2026-04-25 22:44:22
約基奇準三雙仍該批:決戰夢游輸殘陣狼隊丟賽點 引沖突慘遭驅逐

約基奇準三雙仍該批:決戰夢游輸殘陣狼隊丟賽點 引沖突慘遭驅逐

醉臥浮生
2026-04-26 11:23:37
補丁老頭掛專家號被嫌臟,次日院長晨檢看清長相瞬間哽咽

補丁老頭掛專家號被嫌臟,次日院長晨檢看清長相瞬間哽咽

星星會墜落
2026-04-25 20:02:10
2026-04-26 11:47:01
黑馬公社 incentive-icons
黑馬公社
解讀、體驗你關心的科技
2632文章數 80475關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

白宮突發槍擊案 250名記者聯名要求將晚宴變維權現場

頭條要聞

白宮突發槍擊案 250名記者聯名要求將晚宴變維權現場

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《八千里路云和月》大結局意難平

財經要聞

DeepSeek V4背后,梁文鋒的轉身

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

本地
旅游
親子
時尚
公開課

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

旅游要聞

臺兒莊古城國潮文化季正式啟動 五一“入夢臺城”拉開帷幕

親子要聞

媽媽記錄下寶寶的第一次擁抱,最幸福的瞬間

伊姐周六熱推:電視劇《方圓八百米》;電視劇《金關》......

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版