文 | 光錐智能,作者|魏琳華,編輯|劉俊宏、王一粟
開年爆火的OpenClaw,讓我們一連吃了三個月的“國產(chǎn)龍蝦大餐”。
從最先端上的云端版本,到后期號稱“原生龍蝦體驗”的本地小龍蝦,別說用戶分身乏術(shù),就連每天要追產(chǎn)品測評的我們,都追得眼冒金星。
它們帶火的,不僅是一個產(chǎn)品,更是一種想象——“讓AI替我打工”。
當大佬們紛紛曬出跑龍蝦消耗的海量Token,當社交媒體上充斥著“讓AI幫我干活”的炫酷截圖,無數(shù)打工人心里都燃起了一個樸實無華的念頭:我也想要一個能替我干活的小龍蝦。最好便宜,最好好用,最好比我同事還靠譜。
但熱鬧是廠商的,作為用戶,我卻感到了一種空虛:產(chǎn)品剛發(fā)布我就安到電腦上,但報錯報的人頭皮發(fā)麻,一天時間可能都體驗不了兩個任務(wù);復(fù)雜的活給它好像搞不定,不復(fù)雜的我為什么不用Manus,要用它?
一眾蝦之中,到底哪款蝦能讓我無痛擁有可以媲美OpenClaw的體驗?
帶著這樣的想法,光錐智能測評了市面上10款小龍蝦產(chǎn)品,從一個沒有AI基礎(chǔ)的用戶視角出發(fā),看看它們到底能不能扛得起測試“拷打”。
![]()
由于有的用戶只想嘗鮮用蝦對付簡單工作,有的用戶想當“逮蝦戶”和蝦一起向硅基生命的方向進化,針對不同需求,我們由淺入深地做了套測評:先從最簡單的定時日報、搜集信息做起,再進階到看看這批蝦能不能玩轉(zhuǎn)Skill,帶我手把手完成大佬們同款的復(fù)雜任務(wù)。
先說結(jié)論,大多數(shù)蝦都能搞定簡單任務(wù)。但想干點難活,大部分蝦都成了“時間殺手”,還不保證成功。
誰能讓用戶做“逮蝦戶”,誰讓用戶當“蝦奴”?我們做了個大橫評。
國產(chǎn)小龍蝦,真能讓打工人靠蝦“摸魚”嗎?
“吃蝦”的最開始,我的心情非常愉悅,因為每一款的安裝體驗都非常絲滑。
如果你自己嘗試過部署OpenClaw,且沒有開發(fā)經(jīng)驗,我敢打賭你肯定浪費過一天以上的人生,否則也不會讓千元上門安裝OpenClaw變成一門生意。
國產(chǎn)小龍蝦的貢獻,就是把“小龍蝦”的門檻從專業(yè)級降到了消費級:
其中,云端小龍蝦目前基本都能做到開箱即用,不需要用戶操作,你和云端蝦對話就像打開個AI模型網(wǎng)址的對話框一樣簡單。本地龍蝦的安裝也不難,和正常的電腦應(yīng)用下載過程一樣,只要你會從官網(wǎng)下載安裝包,問題不大。
安裝相當于起跑線,從配置開始,就是廠商們“八仙過海,各顯神通”的時刻。
你不想要個冷冰冰的AI助手,想讓它更像個人。好辦,你可以給蝦設(shè)定好你想要的性格。
比如飛書、階躍、百度的龍蝦,它們都有當下流行的性格配置(Soul.md),可以讓你定義龍蝦怎么稱呼你、用提示詞描述你想要的小龍蝦“性格”,讓它交流起來更像真人對話。
![]()
我在DuClaw上配置的龍蝦性格
我把這批小龍蝦的人設(shè)全都變成了“靠譜但愛吐槽的同事”,于是,階躍蝦會在跑任務(wù)時抱怨流程太復(fù)雜了,百度會說“放心交給我”。告別了AI的冰冷味兒,這種帶點脾氣的賽博同事,報錯時好像也沒那么氣人了。
如果只能在電腦前用AI,那它的便利性就要大打折扣。“小龍蝦之父”的初衷就是給自己找個遠程辦公的助手,所以能不能接入手機,也是一個關(guān)鍵的功能。
相比還要自己辛苦配置的OpenClaw,國內(nèi)各大IM平臺開始主動給龍蝦“開后門”,現(xiàn)在大多只需要用戶掃個碼,再等上幾分鐘,平臺自己就給你配置好了。
比如,微信做了插件歡迎各大龍蝦掃碼接入,飛書和QQ等產(chǎn)品現(xiàn)在都能做到一步掃碼就完成連接。
龍蝦建好了,蝦能給你手機發(fā)消息了,現(xiàn)在我們就可以正式支配小龍蝦干活。
到了干活環(huán)節(jié),想象與現(xiàn)實的落差就出來了:用戶的悲歡并不相通,蝦與蝦的腦子也并不一樣好用。
先以測試AI日報任務(wù)為例,這是一個定時任務(wù),需要AI不僅能夠按照你的要求從各大信息源上扒到所需信息并整合成日報,還需要它每天按照固定的時間發(fā)給你。
![]()
測試結(jié)果令人意外:按照“第一次就能準時完成”的標準,我們直接篩掉了一半產(chǎn)品。
其中,第一次能做到準時發(fā)我的,包括智譜、KimiClaw、MiniMax、QClaw,剩下的幾個報錯理由各異,還要人工陪蝦“改作業(yè)”。
云端vs本地的差異在這里體現(xiàn)得尤為明顯。對于沒有條件配備專用設(shè)備(如Mac mini)的用戶來說,本地龍蝦如果關(guān)機或者斷網(wǎng),定時任務(wù)的執(zhí)行有可能受到影響。而云端版本可以做到每天穩(wěn)定推送,不受本地設(shè)備狀態(tài)限制。
![]()
再從內(nèi)容質(zhì)量的角度評估,智譜的AutoClaw、阿里JVS Claw和百度Duclaw給的信息更豐富全面,基本確保了是前一天的新鮮內(nèi)容。也有蝦出了時間和事實性錯誤,比如KimiClaw就出現(xiàn)了把去年新聞當成今年新聞的情況,錯誤明顯。
![]()
光會做日報的小龍蝦,只能算得上是路邊一條。打工人也需要把各種工作中的簡單需求丟給AI處理,看看它能不能真的辦成各種雜活。
以需求較高的“文生圖”任務(wù)作為測試標準,我們讓每個蝦都做一份之前爆火的Nano Banana風格的卡通風“一圖介紹xxx”的主題圖。介紹的對象則是自己。
從最終生成質(zhì)量來看,阿里蝦JVS Claw的表現(xiàn)一騎絕塵,它從Vercel團隊的官方Skill網(wǎng)站找到了個人用戶上傳的技能,一口氣給出了5張產(chǎn)品介紹圖,雖然調(diào)用的是小紅書生圖的Skill,但整體風格已經(jīng)滿足了卡通講解的需求。
![]()
除了阿里,階躍星辰也調(diào)用了自家水產(chǎn)市場中的skill,這個skill明確用Nano Banana命名,最終產(chǎn)圖雖然是英文版的,但卡通風格實現(xiàn)了,也符合了一張圖講解的要求。
![]()
其它幾款產(chǎn)品雖然也通過丟給我文生圖提示詞或者接入API的方式生成了圖片,雖然都做出來了,但和我想要的風格差了十萬八千里。
![]()
“不是哥們,生成自我介紹你給我出這么個圖嗎”
說白了,任務(wù)執(zhí)行的效果,最終還是靠小龍蝦本身接入的模型理解能力如何、Skill庫中的儲備是否夠豐富。雖然都接入Gemini的畫圖模型,但生成圖片的效果,仍然因為龍蝦本身的理解和調(diào)用情況產(chǎn)生了天差地別的效果。
“能用”和“好用”之間,往往隔著十萬八千里。
![]()
進階小龍蝦,玩轉(zhuǎn)大佬的同款Skill
進階玩法的核心,是Skill生態(tài)。
為什么網(wǎng)上大佬們的小龍蝦那么厲害?今天能做賈維斯,明天又能當理財管家?要解鎖想象力,讓龍蝦辦到更多復(fù)雜任務(wù),用戶是沒有耐心打上幾百字小作文教AI干活的。
互聯(lián)網(wǎng)上豐富的Skill生態(tài),就是小龍蝦可以按需安裝和拆卸“爪牙”。在開源生態(tài)中長起來的Skill,就來自于每個開發(fā)者的貢獻——
當Ta有長期大量的同質(zhì)化任務(wù)需求,比如每天都需要跑郵件來確定日程,就可以把這一套寫給AI的提示詞固定下來,下次再調(diào)用的時候就可以直接選擇這個Skill執(zhí)行,輔導孩子未必能有100%回報率,但教蝦可以。
Skill的數(shù)量和質(zhì)量,就代表了蝦的擴展能力。
廠商的預(yù)裝是用戶好體驗的開始,我讓小龍蝦們來搜索了一下上述這些產(chǎn)品初始預(yù)裝的Skills數(shù)量,并做成表格發(fā)給我。表現(xiàn)突出的是智譜,完整找到了所有產(chǎn)品,并且給出了多數(shù)正確的結(jié)果。
![]()
智譜AutoClaw給出的表格
錯的離譜的是騰訊的QClaw和MiniMax的MaxClaw,它們連“對標OpenClaw的產(chǎn)品”這個指令都無法理解,找成了字節(jié)扣子這類Agent產(chǎn)品,百度連產(chǎn)品也沒篩出來,統(tǒng)計的對象甚至是公司。
其中,三種Skill基本成了裝配的剛需:
Creator,讓用戶能按需創(chuàng)造自己的Skills;
Find Skill免去用戶自己上Skill網(wǎng)站下載安裝,它直接幫你在后臺找到你需要的Skill并安裝;Vetter則確保你安裝的Skills安全,它會對每個需要安裝的Skill審查一遍,避免帶著惡意行為的Skill損害你的電腦。
但有的即使安裝了Skill,卻沒有實現(xiàn)它該有的效果。
比如百度Duclaw也配置了安全相關(guān)的審查Skill,但它的做法是先安裝,再提示用戶有風險,被我們指出后才表示“下次會先審查”。這個“下次”來得未免太遲了。
![]()
skill生態(tài)的質(zhì)量也很重要
在海外已有一些Skill網(wǎng)站的情況下,國內(nèi)也有不少產(chǎn)品選擇自建Skill生態(tài),目前包括騰訊、階躍星辰、獵豹的官方Skill商店有做相關(guān)的儲備。比如階躍星辰就做了一個5000+Skills的水產(chǎn)市場,里面涵蓋了官方和用戶自主上傳的Skills,前文階躍調(diào)用的Nano Banana相關(guān)Skill,就是來自于他們自己搭建的“水產(chǎn)市場”。
![]()
例:EasyClaw的Skill商店里,還標出了傅盛版小龍蝦的同款技能
Skill固然重要,那么小龍蝦能根據(jù)我的需求找到對的那個Skill嗎?
我們讓這些小龍蝦都來找一個技能——前段時間很火的“龍蝦辦公室”可視化項目,你可以通過這個辦公室界面,看到小龍蝦是在辦公、思考還是坐在沙發(fā)前摸魚。QClaw由于自帶這個功能,跳過本次測試。
![]()
雖然我下班沒力氣運動,但龍蝦還能舉鐵 圖源QClaw
我讓它們幫我搜集這種能搭建“小龍蝦辦公室”的Skill,多數(shù)都能找到對的項目,但在運行效果上,大家表現(xiàn)不一:
阿里的JVS Claw加載失敗了一次后就運行成功,EasyClaw一次就安裝成功了,算是反應(yīng)速度比較快的;智譜審題失敗后安裝成了儀表盤,沒聯(lián)動也沒有辦公室界面。甚至有蝦要給我自己寫個代碼,用沈騰的話說,就怕人“又笨又勤快”。
可以看到,單靠描述完成“找和安裝”,對于絕大部分龍蝦來說已經(jīng)不是難題。但很多壞就壞在后面一連串的執(zhí)行上。
![]()
我們又找了個稍微復(fù)雜一點的任務(wù),讓蝦幫我接上自己的郵箱,整理好未讀郵件的內(nèi)容,相當于以后我都不需要看郵件,只需要AI告訴我,我就知道自己大概都收到了什么。
配置郵件這個需求看似簡單,細究起來全是麻煩事:讓AI幫我以接郵箱API的方式進行,所以AI還涉及到教我怎么開通相關(guān)配置,引導我開通郵箱API,接入的過程中,涉及到刷新令牌(Refresh Token)過期的情況,蝦們還要幫我想想如何解決時間問題。
![]()
這是StepClaw盤了一遍自己到底都做了哪些工作的總結(jié)
看起來只需要接個API的事情,這十幾個龍蝦做起來,總共花了我3個多小時的時間。我明明想讓AI幫我省事,但花在教它們的時間上,長得讓人懷疑人生。
先執(zhí)行完成的是階躍星辰的StepClaw,雖然中間它無數(shù)次委婉提示我可以直接手動導入郵箱數(shù)據(jù)來讓它分析(像極了我推活的同事),但在我堅持要求“不要讓人類動一下手”后,它自己繞過了獲取Token的坎,干脆自己寫了個可以在網(wǎng)頁端運行的腳本來自行讀取Token給它。在它一遍遍催促我“要快”的情況下,終于連接成功了。
![]()
持續(xù)吐槽后,我連接成功的第一個案例
后面,Kimi Claw也寫了個自動獲取Token的腳本給我,但最終腳本點擊不開,失敗;智譜AutoClaw執(zhí)著讓我用命令行,但大多沒有響應(yīng);MiniMax給的鏈接越來越抽象,它給我寫好的腳本我也沒辦法運行,失敗;EasyClaw糾結(jié)環(huán)境問題,兩遍失敗后才開始想辦法,最終也沒等到靠譜辦法。
選擇“走捷徑”的是QClaw和百度的DuClaw、阿里的JVS Claw,這得益于它們找到的Skill用了更簡單的方法,就是push我在Google上設(shè)置個專給應(yīng)用使用的密碼,就能無需獲取我真正登錄的密碼信息直接看消息,不過阿里和百度都一次成功了,百度還記得我之前的要求,直接幫我把郵件總結(jié)的結(jié)果發(fā)過來了,贊!
![]()
QClaw已讀不回
但QClaw似乎被系統(tǒng)設(shè)置堵住了,然后就是頻發(fā)的“遇到困難睡大覺”,六次里有4次都響應(yīng)失敗,更別提怎么處理問題了。
![]()
可以說,即使能執(zhí)行成功,沒有編程基礎(chǔ)的小白,能做的只是跟著蝦的結(jié)果一遍遍操作,賭它會不會成功,然后在一次次試錯中,要么成功,要么喪失耐心。
為什么蝦之間表現(xiàn)差異這么大?相對復(fù)雜的任務(wù),考驗的是配置模型的能力和Harness的設(shè)計。
前者決定了模型能不能用它的Agent相關(guān)能力幫你搭些好用的工具,在遇到上述環(huán)境問題幫你解決問題。后者是最近風很大的Harness,這個詞本身直譯是馬的挽具,用在Agent身上也一樣——Harness就相當于Agent套的那層殼,所有工程化的配置加在一起,就是Harness。
模型能力決定了AI能否在遇到問題時自主找到解決方案。測試中我們發(fā)現(xiàn),“便宜沒好貨”在AI領(lǐng)域同樣適用。
比如用下來好用的智譜,一次統(tǒng)計表格的任務(wù)就花掉了我300積分(智譜增送的免費額度是500),相比來說,QClaw雖然沒那么好用,但可能也和內(nèi)置的模型便宜大碗有關(guān)系,畢竟能豪橫地送我一天4000w Tokens的消耗量。
![]()
QClaw大氣!
由于大部分類OpenClaw產(chǎn)品基本不支持外界接入其他模型,這一點在大模型創(chuàng)企上和云廠商的產(chǎn)品上比較明顯。但類似EasyClaw、QClaw這類本地產(chǎn)品還是支持的,在模型不同的情況下,很難對比Harness的區(qū)別。
但從穩(wěn)定性和自我修復(fù)的能力上評斷,其中一些產(chǎn)品出現(xiàn)了明顯的問題。比如EasyClaw、StepClaw都在我使用的時候出現(xiàn)過報錯,前者沒有“網(wǎng)關(guān)重啟”的設(shè)置給我啟動,后者雖然主推能拿階躍自己的Agent助手“修理”StepClaw,但我多次嘗試的效果并不好。
順帶一提,上面那倆我百思不得其解,最終還是靠阿里的JVS Claw一步步指導我怎么針對Windows系統(tǒng)寫特定的網(wǎng)關(guān)重啟命令行,才修好的。
![]()
阿里蝦和我一點一點碰出來的命令行
到這里,你也明白了,靠養(yǎng)蝦能解鎖的上限其實很高,就看你想怎么用:
各大Skill網(wǎng)站相當于裝滿了武功秘籍的商店:做爆款小紅書文案、讓蝦每天早上“自我學習進化”等玩法琳瑯滿目。你要想學習更多場景下腦洞大開的玩法,剩下的就是交給AI來替你去做。
但能做到什么程度,穩(wěn)定不穩(wěn)定、能不能“舉一反三”,那就看各家產(chǎn)品靠模型和Harness各顯神通了。
如同被指責套殼的Manus在一年內(nèi)少有敵手、沒被大廠成功抄作業(yè),這類OpenClaw的平替產(chǎn)品,要想真正進化到好用的程度,還需要大家多下功夫。接下來就是怎么快速迭代到產(chǎn)品上,讓用戶們不再對著頻繁死機、報錯的小龍蝦抱怨了。
結(jié)論篇:十只蝦,到底誰更好用?
在我的電腦每隔一會兒就會彈出莫名其妙的命令行界面、安裝數(shù)十種蝦導致C盤爆紅(因為有的蝦不支持我改工作區(qū)到D盤)等一系列副作用后,測評結(jié)果也基本落幕了。
![]()
從穩(wěn)定性、可用性的維度評判,云端比較推薦的是阿里云的JVS Claw,在面對一系列問題的時候,它基本沒有報錯,在日報任務(wù)、郵箱配置等任務(wù)上的表現(xiàn)也令人滿意。
對比同類云端部署產(chǎn)品,它在產(chǎn)品社交上也比較完善。比如,百度和字節(jié)的蝦都需要靠云盤文件上傳的方式來傳圖片,字節(jié)的ArkClaw甚至需要手動配置網(wǎng)盤,或者接管云電腦來上傳。但阿里的版本就能直接上傳,和KimiClaw、MaxClaw這類有Agent產(chǎn)品基礎(chǔ)的設(shè)計也比較接近。而且云電腦的設(shè)置意味著它能在云端操作一些模擬本地的任務(wù)方式,但Kimi們又沒有云電腦模式。
本地端產(chǎn)品來說,表現(xiàn)比較突出的是階躍星辰和智譜兩家的產(chǎn)品:
其中智譜AutoClaw的穩(wěn)定性更勝一籌,同樣是基本沒怎么報錯的產(chǎn)品,它在搜索信息匯總表格的任務(wù)上都做到了第一檔體驗;階躍星辰雖然穩(wěn)定性上表現(xiàn)不佳,又給人一種“推事蝦”的感覺,但日報、郵件連接任務(wù)表現(xiàn)也很出色,它能自己做個網(wǎng)頁工具處理任務(wù),這體驗和蝦幫你自動找工具、接API的體驗接近。
排在中等的是KimiClaw、MaxClaw、QClaw、DuClaw,前兩個穩(wěn)定性沒問題,只是在任務(wù)表現(xiàn)上處于中等水平;后兩個不時會出現(xiàn)報錯無反饋的情況,但沒有出現(xiàn)無法修復(fù)的問題,可能和服務(wù)器有關(guān),任務(wù)表現(xiàn)也是在中等水平。
印象最差的是WorkBuddy和ArkClaw,這兩個非常明顯的情況就是無法持續(xù)使用,比如WorkBuddy大規(guī)模報錯的情況應(yīng)該就出現(xiàn)了兩次,雖然第一次是大規(guī)模流量涌入導致的問題,但后續(xù)也出現(xiàn)了長達兩天的無響應(yīng)情況,后續(xù)恢復(fù)之后回復(fù)速度快了、也能達到及格水平;ArkClaw則基本上問2-3句才能回復(fù)一次。當正常使用都變成了奢望,就更別提測試具體任務(wù)表現(xiàn)了。
無論哪種形態(tài),穩(wěn)定性和任務(wù)成功率才是決定用戶體驗的核心指標。再花哨的功能,不如穩(wěn)定運行一次。
當然,“誰是國內(nèi)OpenClaw平替”的爭奪才剛剛掀開帷幕。
比起搶跑、先發(fā)的占領(lǐng)式更新,后續(xù)的更新和維護,決定了這些蝦能不能持續(xù)出現(xiàn)在用戶的電腦、手機上,而不是在短暫嘗鮮后被卸載。
對比云端和本地產(chǎn)品也能看出,云端顯然更適合當下用戶對電腦安全的要求,畢竟本地端如果隨便修改了電腦配置和文件,損失未必能通過它再還原;但從功能拓展上,靠著本地端權(quán)限開放的優(yōu)勢,小龍蝦能做到的任務(wù)范圍更廣,表現(xiàn)也更驚艷。
第一波測評的尾聲中,我們又看到了扣子版小龍蝦的發(fā)布,以及QClaw V2版本的大更新等等。在用戶吐槽難用、昂貴的當下,小龍蝦的迭代還在加速進化。
爆款蝦或許就在路上。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.