網易首頁 > 網易號 > 正文 申請入駐

全球首款龍蝦模型上線!Agent這波直接起飛了~(夾帶干貨)

0
分享至

先看看用GLM-5-Turbo開發的:一人公司-龍蝦團隊管理系統

可以跟你的龍蝦配對,一鍵把龍蝦中的所有Agent納入系統進行可視化管理,非常直觀,他們甚至還能去喝水,換工位,哈哈就像一個辦公室一樣。

另外,我還找到了讓龍蝦幫我全自動操縱claude code完成長任務(一整晚那種)的終極方案,再也不用守著電腦當claude code的監工了!

大家好,我是袋鼠帝。

我最近每天都會盯一眼 OpenClaw 的微信指數。

然而這兩天我發現openclaw(龍蝦)的熱度開始斷崖式下降了


這是為什么呢?

我跟幾位圈內大佬交流了一下,大家的看法出奇的一致:狂歡過后,是一地雞毛。。

很多人一開始都是看熱鬧,各路媒體鋪天蓋地地報道,大家聽說出了個能代替人干活的賽博員工,還能裝進手機里,覺得非常NB,然后紛紛產生了羊群效應,跟風去部署或者買現成的龍蝦。

但是,隨著新鮮感褪去,大家開始發現不對勁了:

臥槽,我花了大價錢、費了老勁搞的這個龍蝦,怎么用起來感覺也就是個普通的聊天AI?在某些日常對話上,甚至還沒免費的豆包好用!


有些執行力更強的朋友,給龍蝦裝了各種各樣的 Skills(技能插件),試圖讓它去執行一些自動化任務。

結果發現,龍蝦干活慢吞吞的,而且有時候干到一半就莫名其妙的罷工或者報錯,讓人血壓飆升。


真相是:跟 AI 聊天和讓 AI 干活,完全是兩碼事。

你讓通用大模型跟你嘮嗑、寫寫文章,它非常擅長。但是,你讓它去執行一個長鏈條的復雜任務,中間只要涉及多次工具調用、跨應用協同,很多模型不穩定,腦子容易亂。

問題出在哪?在于很多大模型并沒有專門針對龍蝦任務進行過訓練。

以及你的使用方式可能沒用對,好的工程化+強大的模型=好用的Agent,龍蝦也不例外。

就在今天,智譜扔出了一顆重磅炸彈:正式發布了全球首個專門為龍蝦優化的模型--GLM-5-Turbo。


這款模型是在他們原本就已經很能打的旗艦級代碼模型 GLM-5 的基礎上,再次回爐,專門針對龍蝦流進行了深度訓練,非常適合作為Agent的基座模型。

先給大家劃一下重點(省流版):

工具調用極穩:不再出現調錯接口、傳錯參數的低級失誤。

復雜任務規劃、拆解:你給它一個宏大的目標,它能像個項目經理、架構師一樣,有條不紊的拆解需求,設計架構,最終完成目標。甚至還能輕易開啟多Agent去并行執行。

長任務不中斷:它能處理那些需要掛機跑幾個小時的長線任務,中途不掉線、不失憶。

速度大幅提升:在處理邏輯鏈條長、吞吐量大的任務時,響應速度也肉眼可見的變快了。

而且在正式發布之前,它是以 Pony-Alpha-2 的匿名代號在智譜的 AutoClaw(澳龍)上進行了內測。


說實話,我原本是不太敢在自己這臺存了很多重要資料的主力辦公電腦上安裝開源的 OpenClaw 的,怕它權限太大亂動東西。

但智譜官方出的這個 AutoClaw 在安全合規上讓人更放心,我就直接裝了。

https://autoglm.zhipuai.cn/autoclaw/


裝完之后,它有一個一鍵接入飛書的操作,直接給我看呆了。

我只點了一下授權登錄飛書,剩下的創建機器人、配置權限、配置長連接、發布版本那些繁瑣的步驟,在我面前全自動幫我做了。

開箱即用,這個體驗,真的有點爽。

由于我是coding plan的Max會員,又是博主,所以我提前拿到了這個 Pony-Alpha-2(也就是現在的 GLM-5-Turbo)的內測資格,這幾天深度體驗下來,感覺非常驚艷!它確實對得起龍蝦專用模型這個稱號。

一、 耗時兩天,打造了OpenClaw可視化管理系統

用過原生 OpenClaw 的朋友都知道,它的web界面比較簡陋,如果有多個Agent在后臺干活,根本不直觀。

所以我決定直接OpenClaw結合GLM-5-Turbo,擼一套 OpenClaw 多 Agent 可視化管理系統。

把它當做我一人公司的賽博辦公室,每個Agent都是我的員工,有自己的工位。

大致功能如下:

新增員工,可以看到它是從大門進來找工位工作的,他們還會時不時的去喝水

這套系統就是靠 龍蝦 + GLM-5-Turbo 寫出來的。

花了兩天迭代,它幫我完成了包括 Vue 3 前端(帶有 Canvas 虛擬辦公室、深色 UI 和動畫系統)、Node.js 后端(包含 Express API 和 WebSocket 實時通信服務),還寫了一個準備發布的 npm 包。

生成了幾十個文件,幾千行代碼,代碼質量也非常穩定。

中間遇到跑不起來的情況,基本都是我本地的 Node 環境或者端口沖突問題,代碼本身的邏輯漏洞很少。

最讓我佩服的是它在長程對話中的上下文記憶能力。

在開發過程中,我遇到了一個頭疼的 Bug:我派發出去的子 Agent 執行完任務后,返回的結果總是空的。

這個問題有點復雜,需要模型同時理解 OpenClaw 的網關認證機制、后端降級架構,以及各種 Session Key 的讀取邏輯。


它沒有像無頭蒼蠅一樣瞎改,通過層層排查,最終精準地找到了病根:

原來是我代碼里讀取 Session Key 的函數,優先返回了子 Agent 的 Key,而不是主任務的 Key,導致權限不足被網關攔截了。

不過這個項目目前還有一些點小瑕疵,準備近期完善之后開源出來~

感興趣的朋友可以多多三連

二、AI監工:龍蝦全自動操縱Claude Code寫代碼

做過 AI coding 的朋友肯定都有過這樣的痛點:

你想讓 AI 幫你寫個復雜的項目,雖然它能寫,但你得時不時盯著它。

它可能會寫了一段就停下來了,你得讓它繼續;或者遇到報錯卡住了,你得趕緊幫它看看。

這就有點煩,自己成了一個寸步不離的監工...

而且,跟 AI 聊久了,上下文窗口一旦爆滿,它就會開始胡言亂語,忘了前面寫過什么。

然后,我最近看了 Anthropic 官方發布的一篇關于解決長時 AI 任務的博客。

https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents


核心思想是:建立一套標準的交接班機制。一個負責初始化的 Agent 把大任務拆成一個個小任務清單,然后負責寫代碼的 Agent 每次只領一個小任務去開發,寫完、測試通過、提交 Git,然后再領下一個。這樣每次的上下文都很干凈。

我把這套機制的規則發給了接入GLM-5-Turbo的Claude Code。

它理解得很好,并生成了一套規則文件,如下:


工作流程是這樣的(如圖):



然后我跟claude code進行了多輪對話,把我要開發的一個 API 中轉站項目(基于new-api做二次開發)需求對齊了,然后讓它寫了詳細的需求文檔和開發計劃。

并根據上面的全自動規則文件,幫我把任務,拆解成了詳細的feature_list.json任務清單。


但是,問題又來了。每次執行完一個小任務,還是得我手動去敲回車,讓它繼續去領下一個任務。

這不還是得當監工嗎?

這時候,龍蝦就派上用場了,讓龍蝦來當這個監工!去監督 Claude Code 干活~

我先讓龍蝦去學習了那套全自動管理的規則

然后我給龍蝦里的 GLM-5-Turbo 下達了指令,設置了定時任務:

每隔 5 分鐘去檢查一下任務清單里的任務狀態,如果發現上一個任務完成了,就自動通過命令行去喚醒 Claude Code 執行下一個任務。


確認計劃沒問題之后,它就開始了。

這下,徹底解放雙手了~


第一次測試是在凌晨 1 點 55 分,我把這倆 AI 掛在Mac Mini上,自己睡覺去了。


第二天早上醒來一看日志,凌晨 3點5分 的時候,第一版的 API中轉站二開任務已經全部執行完畢,并且測試通過。

后來,我又用同樣的方法,如法炮制,全自動重構了第二版

這個方案是每開發、驗證完一個小任務,就會提交一次commit到Github,所以有完整的git記錄,整個過程的完成情況都可追溯,有跡可循。


由于new-api已經是一個成熟的開源項目了,所以我對它的都是一些細小的改動,但即便經過這么多次的修改,功能也沒有任何影響,還是非常穩的。



GLM-5-Turbo 操控著龍蝦,龍蝦監督著 接入GLM-5-Turbo的Claude Code。真就是左腳踩右腳,直接螺旋升天...

那種徹底把重復性勞動甩給AI的爽快感,無法用語言形容。

目前我已經讓GLM-5-Turbo把這套全自動管理任務的方案開發成了Skills,叫task-harness


并讓它幫我上傳到了github、和clawhub,有需要的朋友可以自取。

如果覺得有幫助的話,記得點個星標哦,非常感謝~

https://clawhub.ai/kangarooking/task-harness

https://github.com/kangarooking/kangarooking-skills

「最后」

體驗下來,智譜這次發布的 GLM-5-Turbo干活能力非常強,而且很穩定,確實是專為龍蝦優化的模型。

畢竟,我們養龍蝦就是為了讓它幫忙干活的。

另外,智譜還推出了基于GLM-5-Turbo的龍蝦Claw套餐,包含個人版和Team版。

面向嚴肅的企業和個人辦公場景,這個套餐有嚴格的數據保護機制,配合國內合規環境和企業級API,敏感數據全程可控,適合企業內部AI系統無縫接入使用。

我作為coding plan深度體驗者,我想說,Agent時代,還得是套餐劃算啊。

這是我最近一個月在智譜花費的token,是2.15億(而且并不是天天用)。

Max套餐是按次來的,我用了2個月,就只觸發過一次限制。我買的是一個季度,算下來一個月160左右。


如果按照API的正常價格來算,2億多的token,感覺得上千了。


在大模型剛剛興起的時候,大家都在打價格戰,那時候覺得幾塊錢/100萬token的價格,簡直就是白菜價。但那時候的模型是玩具,你用它寫寫詩、聊聊天,免費的也湊合。

現在我們進入了 Agent 時代,各家又開始卷模型套餐價格了,雖然還沒到白菜價,但也就是你平時出去吃一頓的價格。并且你買的不再是那些虛無縹緲的 Token 數量,你是在雇傭一個 24 小時不知疲倦、不鬧情緒、還能不斷自我學習、進化的數字員工。

一個能幫你通宵寫完一個商業級應用,或者每天雷打不動幫你盯盤、做競品分析的員工,你愿意給他開多少工資?

我相信,在接下來的幾個月里,能用好龍蝦等Agent工具的人,將會和還在用手敲鍵盤的人,拉開難以逾越的效率鴻溝。

以及不管有沒有養上龍蝦,都可以去智譜領養一只澳龍體驗一下,一鍵安裝,開箱即用,而且非常強大。以下是來自朋友的肯定~


我是袋鼠帝,一個致力于幫你把AI變成生產力的博主。我們下期見~

能看到這里的都是鳳毛麟角的存在!

如果覺得不錯,隨手點個贊、在看、轉發三連吧~

如果想第一時間收到推送,也可以給我個星標?

謝謝你耐心看完我的文章~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
公安部緊急提醒:AI詐騙席卷全國,幾分鐘騙光一輩子積蓄

公安部緊急提醒:AI詐騙席卷全國,幾分鐘騙光一輩子積蓄

娛樂圈見解說
2026-04-23 06:50:17
神秘消失數月后突然現身!美國最頭疼的人,悄悄到了巴格達

神秘消失數月后突然現身!美國最頭疼的人,悄悄到了巴格達

混沌錄
2026-04-20 17:21:17
5月1日新規落地!煙酒禮品全面管控,公職人員迎來全面約束

5月1日新規落地!煙酒禮品全面管控,公職人員迎來全面約束

混沌錄
2026-04-23 17:12:08
中組部人社部規定:公職人員違紀后待遇一文講清

中組部人社部規定:公職人員違紀后待遇一文講清

笑熬漿糊111
2026-04-23 00:05:18
人民日報發文,揭張桂梅真實現狀,卸任華坪女高校長傳聞早有真相

人民日報發文,揭張桂梅真實現狀,卸任華坪女高校長傳聞早有真相

歲暮的歸南山
2026-04-23 16:31:58
醪糟再次被關注!醫生發現:高血脂患者喝醪糟,不用多久4大變化

醪糟再次被關注!醫生發現:高血脂患者喝醪糟,不用多久4大變化

芹姐說生活
2026-04-19 15:52:53
女子破廟避雨,見兩黑蛇纏綿不休,她一把扯掉自己紅肚兜

女子破廟避雨,見兩黑蛇纏綿不休,她一把扯掉自己紅肚兜

夢飛故事會
2024-08-03 21:13:29
陳曉反擊陳妍希!回應未出席前岳父喪禮,否認冷暴力陳妍希和孩子

陳曉反擊陳妍希!回應未出席前岳父喪禮,否認冷暴力陳妍希和孩子

萌神木木
2026-04-23 12:33:24
76歲的萬科創始人王石,最近徹底成了全網焦點。

76歲的萬科創始人王石,最近徹底成了全網焦點。

夢錄的西方史話
2026-04-23 14:36:39
至今,還有13個國家和中國沒有建交,他們都是誰?

至今,還有13個國家和中國沒有建交,他們都是誰?

深度報
2026-04-22 22:30:57
高德全自主具身機器人炸場亦莊馬拉松,拿下「導盲」這道硬核考題

高德全自主具身機器人炸場亦莊馬拉松,拿下「導盲」這道硬核考題

機器之心Pro
2026-04-19 19:53:28
地下捐精有多亂:女子被約到賓館,捐精者:直接發生關系只收800

地下捐精有多亂:女子被約到賓館,捐精者:直接發生關系只收800

芭比衣櫥
2026-04-23 08:24:21
王會民,非法收受他人財物,數額特別巨大

王會民,非法收受他人財物,數額特別巨大

新京報
2026-04-23 10:21:20
張婉婷疑曾介入高云翔董璇婚姻,懷了對方的孩子,也太狗血了

張婉婷疑曾介入高云翔董璇婚姻,懷了對方的孩子,也太狗血了

話娛論影
2026-04-23 09:58:53
比亞迪在馬來西亞的東盟首個整車基地已全面停工,項目陷入僵局

比亞迪在馬來西亞的東盟首個整車基地已全面停工,項目陷入僵局

流蘇晚晴
2026-04-22 19:05:45
2013年,江青拍攝的照片以34萬元的高價拍出,毛澤東曾稱贊并題詞

2013年,江青拍攝的照片以34萬元的高價拍出,毛澤東曾稱贊并題詞

南書房
2026-04-21 07:25:06
迪麗熱巴上學時無人追求,看到她早期照片,網友:這誰敢追啊

迪麗熱巴上學時無人追求,看到她早期照片,網友:這誰敢追啊

喬話
2026-04-22 20:36:30
女子被扇耳光后續:保安先動手 他不是學校保安 黑料被扒不是善茬

女子被扇耳光后續:保安先動手 他不是學校保安 黑料被扒不是善茬

小鋭有話說
2026-04-23 10:54:05
51歲徐靜蕾美國超市被拍,胖到不敢認!旁邊黃立行頭發花白?

51歲徐靜蕾美國超市被拍,胖到不敢認!旁邊黃立行頭發花白?

老吳教育課堂
2026-04-23 14:11:28
10萬元不翼而飛!上海老夫妻放在洗衣機里的現金沒了,護工堅稱自己清白,真相竟是→

10萬元不翼而飛!上海老夫妻放在洗衣機里的現金沒了,護工堅稱自己清白,真相竟是→

環球網資訊
2026-04-23 19:39:20
2026-04-23 21:24:49
袋鼠帝 incentive-icons
袋鼠帝
持續分享AI實踐干貨,走超級個體崛起之路
72文章數 71關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

特朗普"狂怒"稱滅掉了伊朗軍隊 美國官員:不 并沒有

頭條要聞

特朗普"狂怒"稱滅掉了伊朗軍隊 美國官員:不 并沒有

體育要聞

萊斯特城降入英甲,一場虧麻了的豪賭

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

關于AI算力鏈"瓶頸" 這是高盛的最新看法

汽車要聞

令人驚艷的奇瑞車 風云A9可不只是樣子貨

態度原創

教育
親子
本地
旅游
軍事航空

教育要聞

藏不住了!海淀這所名校附中憑啥成為“大贏家”

親子要聞

我宣布:我再也不怕喝牛奶了!

本地新聞

SAGA GIRLS 2026女團選秀

旅游要聞

渝見遵義!遵義文旅在重慶“一會一節”發出“清涼邀請函”

軍事要聞

人民海軍成立77周年 主力艦艇亮相上海

無障礙瀏覽 進入關懷版