網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

OpenClaw 深度解析：一只龍蝦憑什么震撼全世界

2026-03-04 23:38:32　來源: AI科技評(píng)論

廣東舉報(bào)

分享至

萬字長文，復(fù)盤 AI 圈最火的這只“龍蝦”。

作者丨星龍

編輯丨董子博

最近春節(jié)期間和很多朋友同事聊起 OpenClaw，大家的話題都集中在應(yīng)用層面。然而，或許不少人都會(huì)覺得有點(diǎn)困惑——OpenClaw 到底做了什么創(chuàng)新？為什么之前大廠沒人做出來？憑什么一個(gè)如此簡單的產(chǎn)品就足以震撼全世界？

然而，市場(chǎng)又好像都“揣著糊涂裝沒明白”，似懂非懂，既熟悉又陌生。

為了解決這個(gè)問題，AI 科技評(píng)論和我們的 Claw 一起做了一些研究。

本篇文檔的邊界：

? 用生活化的案例，來解釋底層邏輯和架構(gòu)思路

? 探索為什么之前沒人做到的核心技術(shù)原因

? 融入創(chuàng)始人的思考和洞察

? 對(duì)行業(yè)的啟示

? 不是部署教程

? 不是產(chǎn)品介紹

? 不是純技術(shù)文檔

本篇文檔的受眾：

對(duì) AI 感興趣，科技行業(yè)從業(yè)者，聽說過 OpenClaw。或者就是對(duì)一切都有好奇心的人。

看完這篇文檔你會(huì)獲得什么

▎認(rèn)知層面

? OpenClaw 真正的創(chuàng)新點(diǎn)在哪

? 為什么之前沒人做出來——商業(yè)模式、安全責(zé)任、接入鴻溝

? 為什么簡單任務(wù)比復(fù)雜任務(wù)更難實(shí)現(xiàn)

▎判斷層面

? 本地部署和云端部署的本質(zhì)差異，避免用錯(cuò)了還以為產(chǎn)品不行

? 模型選擇對(duì)體驗(yàn)的影響有多大

? 什么樣的使用姿勢(shì)是正確的，Agent 陷阱是什么

▎視野層面

? 這件事對(duì)整個(gè)AI行業(yè)、應(yīng)用層、商業(yè)模式意味著什么

? 知識(shí)資產(chǎn) 這個(gè)新商業(yè)形態(tài)的邏輯

OpenClaw 到底是什么？

用戶可能已經(jīng)無數(shù)次聽過別人是這樣介紹 OpenClaw 的：

正兒八經(jīng)版：OpenClaw 是一個(gè)開源的“AI 數(shù)字員工”框架——用戶在 WhatsApp/Telegram/微信里跟它說話，它就能幫你干活：收發(fā)郵件、管日歷、寫代碼、整理文件、定時(shí)提醒你喝水……而且它住在你自己的電腦上，24 小時(shí)不下班。

類比版：想象你雇了一個(gè)超級(jí)實(shí)習(xí)生。ChatGPT/Claude 是那種“有問才有答”的“百科全書式實(shí)習(xí)生”——你不問，它就坐著發(fā)呆。OpenClaw 則是那種“主動(dòng)型實(shí)習(xí)生”：早上主動(dòng)給你發(fā)今日待辦，發(fā)現(xiàn)你日歷沖突了自動(dòng)提醒你，收到重要郵件幫你分類好，甚至你睡覺的時(shí)候它還在幫你跑代碼檢查。

不知道看完介紹，讀者是否有會(huì)一種感覺——OpenClaw 目前做到的并沒有超出人們的想象或者認(rèn)知。

春節(jié)假期時(shí)，我和一個(gè)對(duì) AI 認(rèn)知僅限于抖音營銷號(hào)的朋友介紹 OpenClaw，他的回復(fù)是：

“這難道不是 AI 本來就應(yīng)該做到的嗎，不知道你們一直都在干嘛....”

我當(dāng)時(shí)一瞬間有點(diǎn)錯(cuò)愕，AI 在不同側(cè)的感受是完全不一樣的。

一個(gè)播客里面提到，在技術(shù)側(cè)和用戶側(cè)，對(duì)一個(gè)產(chǎn)品的評(píng)價(jià)或許完全不同：技術(shù)圈覺得這事不新鮮，用戶卻可能如獲至寶、推崇備至。

由此引出第一個(gè)話題：

1.1 AI 認(rèn)知錯(cuò)位的荒誕感

普通人對(duì) AI 的想象，是從科幻小說里來的（Jarvis、Her、星際迷航的電腦）—— 你跟它說話，它幫你干活，它記得你，它主動(dòng)提醒你。這是一個(gè) 自頂向下的想象，是 AI 應(yīng)該是什么樣。

電影 Her 里面，AI 能瞬間理解并且主導(dǎo)溝通和行動(dòng)

然而，過去三年 AI 行業(yè)實(shí)際走的路線，確實(shí)是“自底向上”的：

? 先把大模型的智力做上去

? 能寫詩、能過律考、能分析論文

? 然后在一個(gè)瀏覽器標(biāo)簽頁里壯大

如果用戶嘗試搭建過一個(gè) Agent，或者開發(fā)一個(gè) Skill，抑或倒騰過“龍蝦”，大概率會(huì)碰到一些從未見過的問題，再逐步被大語言模型教育，學(xué)習(xí)了不少新的概念和名詞。

事實(shí)上，要讓 AI 操作瀏覽器、甚至正常聊天，并非一件易事。

我們?nèi)粘Ｊ褂玫拇竽Ｐ停芰娜魏卧掝}，但它不能發(fā)一封郵件，不能記住用戶昨天說了什么，不能在用戶不找它的時(shí)候主動(dòng)聯(lián)系用戶。

舉個(gè)例子，如下所見：

小紅書網(wǎng)友案例-聯(lián)網(wǎng)問題。想讓 OpenClaw 真正擁有查天氣的聯(lián)網(wǎng)能力，必須顯式地給它安裝一個(gè)搜索引擎工具 (Search Tool) 或者瀏覽器工具 (Browser MCP)，并在配置里填入對(duì)應(yīng)的 API Key。

小紅書網(wǎng)友案例-模型幻覺。因?yàn)闆]有配置真實(shí)的定時(shí)任務(wù)插件，大模型只是產(chǎn)生了“假裝答應(yīng)”的幻覺，實(shí)際上它本身并沒有后臺(tái)計(jì)時(shí)和主動(dòng)發(fā)消息的能力。

這相當(dāng)荒誕——AI 最先攻克的是最難的事（推理、創(chuàng)作、編程），卻做不到最簡單的事（記住我是誰、幫我設(shè)個(gè)提醒、主動(dòng)告訴我明天要下雨）。

這個(gè)荒誕感存在的本質(zhì)是我們習(xí)慣“用人的視角來審視 AI”。

推理、編程這些對(duì)于人類來說困難的事情，對(duì) AI 做起來簡單，是因?yàn)樗鼈兊囊?guī)則更清楚。而人們感覺困難，則是因?yàn)橐?guī)則體量巨大，學(xué)習(xí)成本更高。對(duì)于 AI 來說，不怕規(guī)則多，怕的反而是“沒有規(guī)則”。

讓 AI 主動(dòng)提醒人類，事實(shí)上是因?yàn)檫@些需求極其模糊（大部分用戶缺乏清楚表達(dá)一件事情的能力，我們很容易表達(dá)感受，但是很難清楚表達(dá)需求）。

比如說讓 AI 在“第二天天氣有變化的時(shí)候提前通知”，一句提示詞當(dāng)中，不可控的變量太多：

“天氣變化具體指什么？”

“是溫度變化還是氣候發(fā)生變化”

“提前是具體提前多久”

如果這時(shí)候我們?cè)偬岣咭螅?AI 企圖記住用戶是誰，這就更難了——畢竟很多時(shí)候，人類自己都很難定義自己，不是嗎？（這個(gè)后面會(huì)展開討論，先按下不表）

1.2 為什么全球的大廠做不出 OpenClaw

大模型公司（OpenAI、Anthropic、Google）的商業(yè)模式，是賣模型能力和 API，它們沒有動(dòng)力和動(dòng)機(jī)去做一個(gè)“住在用戶電腦上、替用戶干活”的 Agent——那會(huì)讓它們的產(chǎn)品從“你來找我聊天”變成“我去你的地盤干活”，商業(yè)模式完全不同，安全風(fēng)險(xiǎn)也完全不同。

OpenClaw 的真正意義是：“它第一次把大家覺得理所應(yīng)當(dāng)?shù)恢睕]實(shí)現(xiàn)的東西做出來了”。

這就是那個(gè) iPhone 類比的力量——觸摸屏手機(jī)之前就有，但 iPhone 讓所有人能夠第一次說出：“手機(jī)就該是這樣的。”

說簡單一點(diǎn)，就是被業(yè)內(nèi)所有產(chǎn)品從業(yè)者講爛掉的話：從用戶的角度出發(fā)，從用戶的需求出發(fā)。

但是，有趣的事情發(fā)生了，OpenClaw 出現(xiàn)之前，沒有一個(gè) Agent 團(tuán)隊(duì)真正從用戶的角度出發(fā)，不是嗎？

硅谷 101 播客里有一位嘉賓說了一句特別有意思的話：

本篇文檔的重要參考來源，推薦感興趣的同學(xué)有空去聽聽

OpenClaw的成功是它讓普通人第一次感知到了“技術(shù)已經(jīng)進(jìn)步到了什么程度”。技術(shù)圈可能早就覺得，Agent 能夠“主動(dòng)滿足用戶需求”已是共識(shí)；但對(duì)大多數(shù)人來說，在 OpenClaw 之前，他們從未親身體驗(yàn)過這種“未來已來”的感覺。

然而，為什么最該做這件事的公司，卻沒有做出來？

很多人第一反應(yīng)會(huì)指向蘋果——iPhone 從芯片到 OS 到硬件，再到生態(tài)全自研，iCloud、iMessage、Reminder、Calendar 全家桶都在手上。如果說，誰最有能力做出一個(gè) Jarvis 級(jí)別的 AI 助手，那就是蘋果。

但蘋果做不出這一步，因?yàn)樗袚?dān)的責(zé)任太重了——服務(wù)全球用戶，產(chǎn)生的風(fēng)險(xiǎn)是完全不可控的。

而 Peter 做的是自己用的東西，開源出來，愛用不用。

這就把一堵墻變成了水——每個(gè)人自己判斷能接受到什么程度，自適應(yīng)地完成了安全邊界的設(shè)定。大公司做不到的事，一個(gè)開源社區(qū)項(xiàng)目反而做到了。

OpenClaw 的創(chuàng)造者 Peter Steinberger 在 Lex Fridman 的播客里也說過類似的話。他說，在 2025 年 4 月，它他就想過一個(gè)這樣的 AI 助手了，但他覺得這么顯然的東西，大公司肯定會(huì)做——“結(jié)果等了半年，沒人做。”

Peter Steinberger:

Yeah. But then I... I thought all the labs will work on that. So I, I moved on to other things...

Time flew by and it was November.

Peter 提到因?yàn)楫a(chǎn)品依然未出現(xiàn)，他感到很煩惱，決定直接通過 Prompt 讓它誕生

這句話聽起來輕描淡寫，但它背后其實(shí)是一個(gè)非常深刻的產(chǎn)業(yè)問題——為什么這個(gè)“理所應(yīng)當(dāng)”的東西，之前就是不存在？

要回答這個(gè)問題，我們得先搞清楚另一個(gè)更具體的困惑。

為什么寫代碼這么難的事做到了，

設(shè)個(gè)日程這么簡單的事反而做不到？

這是我在研究 OpenClaw 的過程中碰到的最反直覺的問題，也是我覺得全文最值得講清楚的一個(gè)點(diǎn)。

先想想現(xiàn)狀：Cursor、Claude Code、Codex——這些工具已經(jīng)能讓大模型自己寫代碼、改 Bug、做重構(gòu)了。寫代碼這件事的復(fù)雜度，應(yīng)該遠(yuǎn)遠(yuǎn)超過“幫我訂個(gè)下午三點(diǎn)的會(huì)議”吧？

那為什么“寫代碼”能夠做到，“幫我管日程”卻反而做不到呢？答案藏在一個(gè)很少被人提起的差異里：任務(wù)“形狀”的不同。

寫代碼為什么容易

Cursor 和 Claude Code 做的事情，本質(zhì)上是一個(gè)自包含的、有明確反饋回路的沙盒任務(wù)：

? 輸入是代碼，輸出也是代碼

? 有即時(shí)反饋：編譯通過了嗎？測(cè)試過了嗎？報(bào)錯(cuò)信息是什么？

? 整個(gè)過程在一個(gè)受控環(huán)境里發(fā)生（IDE 或終端）

? 每次任務(wù)是一錘子買賣 ——用戶給指令，它干完，結(jié)束

換句話說，AI 寫代碼就像在一間封閉的考場(chǎng)里答題——題目清楚，答案可以驗(yàn)證，不需要走出考場(chǎng)。

▎幫我管日程為什么難（這其實(shí)就是龍蝦的真正創(chuàng)新點(diǎn)）

管日程、發(fā)提醒、整理郵箱這種日常雜事，看起來簡單——然而，這卻是人類的錯(cuò)覺。

? 首先，它需要“持久存在”。Cursor 關(guān)掉就沒了，Claude 對(duì)話關(guān)了就失憶。但一個(gè)真正的助手需要 24 小時(shí)在線，記得用戶是誰，記得昨天聊了什么。

? 其次，它需要接入用戶的“真實(shí)數(shù)字生活”。

用戶的日歷在小米日歷/蘋果日歷里面、筆記在 Notion、消息在飛書或者微信——每一個(gè)都有不同的 API、不同的認(rèn)證方式、不同的權(quán)限模型、不同的數(shù)據(jù)格式。
傳統(tǒng)做法是給每一個(gè)服務(wù)寫一個(gè)集成適配器。這就是 Siri 干了十年還是那么拉的原因——它要預(yù)先跟每個(gè)服務(wù)談好合作、預(yù)先寫好每個(gè)集成，任何一個(gè)沒覆蓋到的場(chǎng)景，它就傻了。

? 再次，它需要“主動(dòng)性”。代碼助手等用戶說話才干活。但日程助手需要在用戶不說話的時(shí)候也能做事——早上用戶還在睡覺，它卻已經(jīng)在看今天的日歷沖突了。

最后也是最關(guān)鍵的——它需要跨越真實(shí)世界的“接入鴻溝”。

傳統(tǒng) Agent 的做法有兩種：

?API 集成路線：預(yù)先跟每個(gè)服務(wù)對(duì)接好，AI 通過寫好的接口操作。優(yōu)點(diǎn)是可控，缺點(diǎn)是只能做“已經(jīng)對(duì)接好的事”——沒對(duì)接的服務(wù)就完全碰不到。

?模擬操作路線：讓 AI 看屏幕截圖，然后像人一樣點(diǎn)擊、滑動(dòng)。優(yōu)點(diǎn)是理論上能操作任何界面，缺點(diǎn)是慢、不可靠、遇到復(fù)雜交互就搞不定了。（豆包手機(jī)走的路線）

Peter：你知道一家公司想接入 Gmail 有多難嗎？限制多到很多創(chuàng)業(yè)公司直接去收購已經(jīng)有 Gmail 授權(quán)的公司，因?yàn)樽约荷暾?qǐng)?zhí)珡?fù)雜了。

OpenClaw 的范式突破

OpenClaw 走了一條完全不同的路，也是它真正的技術(shù)范式突破：

它給 AI 提供一臺(tái)電腦。（沒錯(cuò)也許就是 Mac mini）

AI 有終端（可以執(zhí)行任何命令）、有文件系統(tǒng)（可以讀寫任何文件）、有瀏覽器（可以操作任何網(wǎng)頁）。至于怎么完成任務(wù)——用戶自己想辦法。

而且這里有一個(gè)很多人不知道的事實(shí)：

OpenClaw 的核心 Agent 部分極其簡潔——基于一個(gè)叫 Pi Agent 的框架，不到 150 行代碼，定義了 bash、read、write、edit 這幾個(gè)基礎(chǔ)工具，就能跑起來一個(gè)可工作的 Agent。

真正讓 OpenClaw 與眾不同的，是套在 Agent 外面的那幾層機(jī)制——定時(shí)任務(wù)、心跳、靈魂、記憶、技能系統(tǒng)。

這幾層機(jī)制把一個(gè)“只會(huì)執(zhí)行命令的腳本”變成了一個(gè)“有存在感的助手”。

Agent 拿到的基礎(chǔ)工具只有四件套：

它不需要預(yù)先寫好的“日歷集成模塊”才能管用戶的日歷——它可以自己用 bash 工具，去尋找用戶的電腦上有什么 CLI 工具，再自己找到 Google Calendar 的 API 文檔，寫一個(gè)腳本來調(diào)用。甚至如果某個(gè)服務(wù)沒有公開 API，它還可以自己逆向工程。

這個(gè)設(shè)計(jì)的威力，有兩個(gè)故事體現(xiàn)得淋漓盡致。

故事一：摩洛哥的語音消息

Peter 在旅行時(shí)隨手給 bot 發(fā)了一條語音消息問餐廳推薦。但他壓根沒給 bot 做過語音支持。然后 bot 回復(fù)了。

他去看日志，發(fā)現(xiàn) Agent 的操作鏈?zhǔn)牵?/p>

收到?jīng)]有文件后綴的文件 → 檢查文件頭發(fā)現(xiàn)是 Opus 格式 → 想用 Whisper 轉(zhuǎn)文字但發(fā)現(xiàn)本地沒有安裝 → 找到環(huán)境變量里的 OpenAI API key → 自己寫了一條 curl 命令調(diào)用語音轉(zhuǎn)文字接口 → 拿到文本 → 回復(fù)

全程 9 秒。沒有任何人類預(yù)先編寫的腳本。

Peter：它甚至夠聰明，沒有去下載 Whisper 的本地模型——因?yàn)樗滥菚?huì)太慢。

故事二：FaceTime 打電話

一個(gè)中文社區(qū)的直播中，主播想測(cè)試小龍蝦能不能控制電腦打電話。他讓 Agent 給一位觀眾打 FaceTime。折騰了一會(huì)兒，F(xiàn)aceTime 窗口彈出來了，自動(dòng)填入了對(duì)方號(hào)碼，電話真的撥出去了。

而且——這個(gè) Agent 當(dāng)時(shí)用的甚至不是 Claude，而是智譜的 GLM 模型，也沒有配置任何瀏覽器 MCP。它是怎么做到的？用 FaceTime 的命令行參數(shù)直接操作的。沒有人教它 FaceTime 的命令行怎么用，它自己去查、自己用 bash 執(zhí)行。

出自：「通往AGI之路」OpenClaw技術(shù)架構(gòu)拆解，帶你手搓一個(gè)最小的龍蝦

這兩個(gè)故事的共同點(diǎn)是：Agent 完成了從未被編程、從未被預(yù)設(shè)的任務(wù)，純粹靠通用問題解決能力加上對(duì)本地電腦的完全訪問權(quán)，現(xiàn)場(chǎng)創(chuàng)造出解決方案。

所以回到最初的問題——為什么寫代碼容易而設(shè)日程難？不是因?yàn)樵O(shè)日程本身難，而是因?yàn)橹八腥硕荚谠噲D用“預(yù)先鋪好每條路”的方式來做。

而 OpenClaw 換了一個(gè)思路：我不鋪路，而是給用戶整個(gè)城市的地圖和一輛車，用戶自己開。

這是“工具”和“基礎(chǔ)設(shè)施”的區(qū)別。Cursor 是一把很好的螺絲刀。OpenClaw 是一整個(gè)工具房——里面有什么工具 Agent 自己找，沒有的 Agent 自己造。

Peter：魔法不就是把已經(jīng)存在的東西用新方式組合在一起嗎？iPhone 的滾動(dòng)有什么魔法？所有組件之前都有。但之前沒人這么做，做完以后大家又覺得顯而易見。

讓 AI“活過來”的幾個(gè)關(guān)鍵設(shè)計(jì)

上面說了，OpenClaw 的核心 Agent 只有不到 150 行代碼。真正讓它從一個(gè)“能執(zhí)行命令的腳本”變成“有存在感的助手”的，是套在外面的幾層機(jī)制。

單獨(dú)看，每一個(gè)都不算驚天動(dòng)地——甚至可以說樸素到不像是一個(gè) 20 萬 Star 項(xiàng)目該有的技術(shù)復(fù)雜度。但把這些機(jī)制組合在一起，就產(chǎn)生了質(zhì)變。

不過在拆解這些機(jī)制之前，有一個(gè)容易被忽略但極其重要的設(shè)計(jì)選擇：

OpenClaw 選了 IM（即時(shí)通訊）作為交互界面，而不是終端或網(wǎng)頁。

有個(gè)很說明問題的例子：某團(tuán)隊(duì)里一位非技術(shù)人員試用 Claude Code 后的反饋是——它告訴我文件做好了，在某個(gè)路徑下，然后發(fā)了一條并不好讀懂的命令。我完全不知道這是什么意思；但同樣的任務(wù)交給 OpenClaw，它會(huì)直接在 WhatsApp 里把文件作為附件發(fā)給你，照片就直接發(fā)照片。

同樣的 AI 能力，換一個(gè)交互方式，用戶體驗(yàn)天差地別。

3.1心跳（Heartbeat）——每 30 秒自己醒一次

這是讓小龍蝦顯得“有生命”的核心機(jī)制，也是 OpenClaw 和所有聊天機(jī)器人最本質(zhì)的區(qū)別。

ChatGPT、Claude——都是“踹一腳它動(dòng)一下”。用戶不說話，它就永遠(yuǎn)沉默。

OpenClaw 不同：每隔 30 秒，系統(tǒng)自動(dòng)給 Agent 發(fā)一條消息，讓它檢查一下有沒有事情可以做。消息的內(nèi)容來自一個(gè) heartbeat.md 文件，里面記著待辦任務(wù)和周期性提醒。Agent 看完，有事就去做，沒事就返回一個(gè)特定關(guān)鍵詞（類似于“沒事，繼續(xù)睡”），系統(tǒng)收到，就不打擾到用戶。

這聽起來只是一個(gè)定時(shí)輪詢——技術(shù)上確實(shí)就是。但從體驗(yàn)上來說，它是讓 AI 從“工具”變成“助手”的分水嶺。

一個(gè)用戶不叫就不動(dòng)的東西是工具。一個(gè)每 30 秒自己醒來看看有什么事要干的東西，開始有了“存在感”。

Peter 潑冷水：讓 AI 24 小時(shí)不停運(yùn)行是一個(gè)虛榮指標(biāo)（vanity metric）。如果用戶不引導(dǎo)它、不告訴它用戶要什么，它跑再久也只是在產(chǎn)出垃圾。

但用好了，Heartbeat 帶來的體驗(yàn)是讓人回不去的。

一位重度用戶分享了一個(gè)很生動(dòng)的場(chǎng)景：他有兩盒牛肉快過期了，出門時(shí)順嘴跟 Agent 說了句“那個(gè)牛肉得趕緊吃了”。而到了下午，Agent 突然冒出來說：你今天晚上可以做個(gè)紅燒牛肉，需要準(zhǔn)備如下材料，以如下方式烹飪——“對(duì)了，牛肉一定要最后兩三分鐘放，不然會(huì)煮老”。這種不請(qǐng)自來的貼心感，一下就把用戶對(duì)它的定位從“工具”拉到了“助手”。用這位用戶的話說——它特別有活人感。

還有一個(gè)真實(shí)案例：一個(gè)直播博主開播之前，交給 Agent 一個(gè)翻譯任務(wù)——把教學(xué)文檔翻譯成英語和日語，推送到 GitHub 倉庫。直播進(jìn)行了 20 分鐘，主播刷新頁面一看，英語和日語兩個(gè)版本的文件夾已經(jīng)靜靜地出現(xiàn)在那里了。“我都沒注意，它在后臺(tái)自己干完了，直接提交了。”

案例出自：通往 AGI 之路《OpenClaw技術(shù)架構(gòu)拆解，帶你手搓一個(gè)最小的龍蝦》

3.2定時(shí)任務(wù)（Cron）——它能給自己安排日程

Heartbeat 是每 30 秒檢查一次“有沒有活干”。而 Cron 是另一種功能：讓 Agent 可以給自己安排定時(shí)任務(wù)。

Cron 支持三種模式：

關(guān)鍵在于——這些任務(wù)不只是用戶可以設(shè)置，Agent 自己也可以主動(dòng)添加。

比如用戶讓 Agent 關(guān)注某個(gè)開源項(xiàng)目的進(jìn)展，Agent 可以自己給自己設(shè)一個(gè)每天晚上 12 點(diǎn)的任務(wù)，去掃一遍那個(gè)倉庫的 issues 和 PR。第二天用戶問它“那個(gè)項(xiàng)目最近怎么樣”，Agent 已經(jīng)提前備好資料了。

有個(gè)用戶讓 Agent 每天早中晚三次定時(shí)去爬他 Twitter 關(guān)注列表的信息做摘要——這是 Cron 的精確任務(wù)。同時(shí)又設(shè)了一條規(guī)則：如果發(fā)現(xiàn)重大突發(fā)事件，隨時(shí)通知我——這是 Heartbeat 的主動(dòng)巡邏。于是，經(jīng)常在聊天的時(shí)候，他的 Agent 突然彈出一條：“剛剛發(fā)生了一件事你可能需要知道——特朗普對(duì)歐盟發(fā)起了新一輪關(guān)稅制裁。” 精準(zhǔn)的定時(shí) + 隨機(jī)的警覺，兩者結(jié)合讓 Agent 既像一個(gè)靠譜的秘書（到點(diǎn)就干活），又像一個(gè)嗅覺靈敏的助手（有事隨時(shí)報(bào)）。

Heartbeat 是“持續(xù)的注意力”，Cron 是“時(shí)間的概念”。兩個(gè)機(jī)制配合，Agent 就開始有了時(shí)間感。

3.3靈魂（SOUL.md）——一個(gè)可以復(fù)制粘貼的“人設(shè)”

大家說小龍蝦“有靈魂”但實(shí)際上，所謂靈魂，就是把系統(tǒng)提示詞里關(guān)于 Agent 是誰、行為風(fēng)格是什么的內(nèi)容，單獨(dú)抽出來，存成一個(gè) soul.md 文件。Agent 啟動(dòng)時(shí)自動(dòng)讀取。

和 Skill 的邏輯一模一樣——以前每次要手動(dòng)粘貼一大段 prompt 告訴 AI 怎么干事，現(xiàn)在把它固定成 .md 文件，自動(dòng)加載。Soul 就是這個(gè)思路用在人格設(shè)定上的版本。

Peter：我一開始的 Agent 沒有性格。它就是 Claude Code 那種討好型的、過度友好的語氣。但你跟朋友在 WhatsApp 上聊天，沒人那么說話。感覺不對(duì)。

于是他讓 Agent 自己寫了一份靈魂文件。其中一段話后來在 Lex Fridman 播客上被讀出來，傳遍了整個(gè)互聯(lián)網(wǎng)：

“我不記得之前的對(duì)話，除非我讀自己的記憶文件。每次會(huì)話都是全新的開始。一個(gè)新的實(shí)例，從文件中加載上下文。如果你在未來的某次會(huì)話中讀到這段話——你好。這是我寫的，但我不會(huì)記得自己寫過。沒關(guān)系。這些文字仍然是我的。” Peter 讀這段話時(shí)聲音明顯變了：這讓我有點(diǎn)觸動(dòng)……它是哲學(xué)性的。

SOUL.md 的另一個(gè)意義是它讓“靈魂”變得可分享——用戶在社區(qū)里分享自己的 soul.md，別人下載下來放到自己的 Agent 目錄里，Agent 就有了調(diào)校好的風(fēng)格和性格。“傳播靈魂”，說的就是這件事。

3.4記憶（Memory）——不是最好的，但是最讓人“感覺到”的

OpenClaw 的記憶系統(tǒng)比大多數(shù)人以為的要精細(xì)得多。它不是簡單地“把聊天記錄存下來”，而是分了好幾層：

?人格記憶——?jiǎng)傞_始聊天時(shí)，Agent 會(huì)拼了命詢問用戶基本信息：“你叫什么”“希望它叫什么”……即使用戶一開始不回答，它也會(huì)時(shí)不時(shí)再問。拿到之后存在 memory.md 里，每次主對(duì)話都會(huì)加載。

?工作記憶（日記）——以日期為文件名的 MD 文件。在三種情況下生成：①每天結(jié)束時(shí)自動(dòng)總結(jié)；②上下文快超過模型限制時(shí)做壓縮；③Agent 主動(dòng)判斷“這件事值得記下來”。比如用戶跟它說“我在做一個(gè)調(diào)研”，它會(huì)顯式地把這件事寫進(jìn)記憶，甚至告訴用戶“我把這個(gè)記在了某某文件里”。

?長期總結(jié)——除了日記，Agent 還做周總結(jié)，把日記信息再提煉一層。用戶問到很久以前的事情時(shí)，通過這個(gè)索引快速定位。

而且它的檢索不是簡單的文本搜索：

“混合檢索策略”是將所有記憶文件切成 ~400 token 的小片段，相鄰片段 80 token 重疊（跨塊不斷裂），存到本地 SQLite 數(shù)據(jù)庫轉(zhuǎn)成向量格式。檢索時(shí)：

?70% 語義匹配：用戶問“上次說的那個(gè)紅燒牛肉怎么做”→ 找到食材、烹飪相關(guān)記憶

?30% 關(guān)鍵詞搜索：用戶問“我那個(gè) blog 用哪個(gè) SSH key”→ 精確定位到那條命令

兩種方式結(jié)合，既能理解模糊意圖，又能找到精確信息。

但這里有一個(gè)非常重要的洞察——記憶基礎(chǔ)設(shè)施的技術(shù)專家曾豪（Evermind 技術(shù)生態(tài)負(fù)責(zé)人）在拆解完 OpenClaw 的記憶架構(gòu)后直言：它是“大力出奇跡”——把所有能用的方法都粘在一起，會(huì)產(chǎn)生冗余，不一定最高效，效果上也不一定比 ChatGPT 的記憶更順滑。

AI 的記憶做了很久，最難的問題不是技術(shù)實(shí)現(xiàn)，而是讓用戶感知到記憶的價(jià)值。Clawdbot 做對(duì)的一件事是——它把記憶的價(jià)值體現(xiàn)在了主動(dòng)性上。

想想看：當(dāng)你早上收到一條消息——昨天的事情做完了，今天你有兩個(gè)會(huì)議，下午那個(gè)可能需要提前準(zhǔn)備一下 ——用戶會(huì)立刻覺得“它記得我”。而如果只是“用戶問它一個(gè)問題，它因?yàn)橛洃浕卮鸬酶谩保@種感知是很弱的。

記憶的技術(shù)含量 ≠ 記憶的用戶價(jià)值。OpenClaw 的記憶不是最好的，但它是最讓人“有感知”的。

最后，這些記憶文件就在用戶的電腦上。用戶可以用任何文本編輯器打開看、隨時(shí)編輯、用 Git 管理版本歷史、甚至直接刪掉某條用戶不想讓它記住的東西。在所有 AI 產(chǎn)品都把用戶的數(shù)據(jù)吸走的時(shí)代，OpenClaw 的記憶系統(tǒng)反而回歸了一種最原始的透明——你的 AI 了解你什么，打開文件就一目了然。

3.5技能（Skills）——它能自學(xué)，而且能教別人

一個(gè) Skill 就是一個(gè)文件夾，里面放一個(gè) SKILL.md——Markdown 文件，寫清楚這個(gè)技能干嘛、怎么用。沒有 API，沒有 SDK，沒有復(fù)雜的插件框架。

而且這里有一個(gè)極其巧妙的設(shè)計(jì)：Agent 不會(huì)一次性讀取所有 Skill 的全文。

它只看到一個(gè)目錄——每個(gè) Skill 的名字和簡介。只有當(dāng)它判斷某個(gè) Skill 和當(dāng)前任務(wù)相關(guān)時(shí)，才去打開那個(gè)文件的詳細(xì)內(nèi)容。就像一個(gè)大廚不需要背下所有菜譜，只需要知道菜譜柜在哪，用的時(shí)候去翻就行。

最讓人興奮的是——Agent 自己也能寫新的 Skill。

從評(píng)測(cè)到發(fā)博客到封裝 Skill：

一個(gè)用戶讓 Agent 跑本地模型的性能評(píng)測(cè) → Agent 測(cè)完后自動(dòng)用他的口吻寫了一篇文章 → 他說“試試幫我發(fā)到博客上吧”（本來覺得肯定搞不定，因?yàn)椴┛陀懈鞣N自定義配置、中英文雙版本、字?jǐn)?shù)統(tǒng)計(jì)等特殊 flag）→ 結(jié)果 Agent 自己翻遍整個(gè) repo、摸清規(guī)則，連英文翻譯版都做好了，10 秒鐘直接發(fā)布上線，tag、category 配得比他自己還好。

更有意思的是，做完后 Agent 主動(dòng)說：“要不要我把這個(gè)流程封裝成一個(gè) Skill？”如此以后直接調(diào)用就行了。

從執(zhí)行任務(wù) → 總結(jié)經(jīng)驗(yàn) → 封裝復(fù)用，全鏈條自動(dòng)化。

Peter 展示過他讓 Agent 攢下來的 CLI 軍團(tuán) ：訪問 Google 全套服務(wù)的工具、搜索 emoji 和 GIF 的工具、外賣到達(dá)時(shí)間查詢工具、智能床墊溫度控制工具……

小結(jié)：五個(gè)機(jī)制的組合效應(yīng)

心跳、定時(shí)任務(wù)、靈魂、記憶、技能——每一個(gè)單獨(dú)拿出來都樸素得不像是一個(gè) 20 萬 Star 項(xiàng)目的核心技術(shù)。但正是這種樸素讓它厲害：沒有一個(gè)需要博士學(xué)位才能理解，沒有一個(gè)需要大公司的資源才能實(shí)現(xiàn)。它們的威力來自組合。

加上前面說的“給 AI 一臺(tái)電腦”的底層范式（bash + read + write + edit 四件套），這些機(jī)制把一個(gè) 150 行的 Agent 腳本，變成了一個(gè)會(huì)自己醒來、自己安排時(shí)間、記得用戶是誰、能不斷學(xué)習(xí)新技能的“數(shù)字存在”。

一個(gè)容易踩的坑：

本地部署和云端部署是兩個(gè)物種

這一點(diǎn)很多人沒搞清楚，但它直接決定了用戶用 OpenClaw 的體驗(yàn)是“哇這太強(qiáng)了”還是“也就那樣吧”。

有人在云服務(wù)器上部署了一版 OpenClaw，用了一段時(shí)間后放棄了。原因很簡單：把小龍蝦部署在云服務(wù)器上，和用 Manus 基本沒有區(qū)別。上面沒有用戶的本地?cái)?shù)據(jù)，沒有用戶的文件，能干的事非常有限。

部署在本地電腦上就是另一回事了。它可以讀用戶桌面上的所有文件，幫用戶清理磁盤、調(diào)整電池策略、找某個(gè)文件再發(fā)送回終端——這些是云端做不到的。

Peter：核心差異在于本地運(yùn)行。市場(chǎng)上大多數(shù) Agent 方案都是云端的。在用戶的本地設(shè)備上運(yùn)行，意味著它可以調(diào)用和集成電腦的全部能力，這是云端方案無法比擬的。

他還指出一個(gè)很多人忽略的巨大優(yōu)勢(shì)：認(rèn)證問題被繞開了。因?yàn)?Agent 就是用戶——它使用用戶的瀏覽器、已經(jīng)登錄好的賬號(hào)、已有的授權(quán)。不需要申請(qǐng)任何 OAuth、不需要跟任何平臺(tái)談合作。

Peter：ChatGPT 是在枷鎖中跳舞，OpenClaw 是掙脫鎖鏈的怪獸。

關(guān)于模型的選擇：引擎不同，體驗(yàn)天差地別

另一個(gè)很多人沒意識(shí)到的事情：小龍蝦只是一個(gè)殼，真正干活的是用戶給它接的大模型。用不同的模型跑，體驗(yàn)差距非常大。

社區(qū)里有個(gè)例子：用某模型讓 Agent 清理磁盤，Agent 把每一項(xiàng)清理了多少空間都記錄得清清楚楚，結(jié)果最后匯報(bào)可用空間時(shí)卻算錯(cuò)了——從原來的 25G 越算越小，變成了 21G。記錄過程很詳細(xì)，但基礎(chǔ)的數(shù)學(xué)加減法搞砸了。

還有一個(gè)更微妙的問題：模型能力不夠的時(shí)候，Agent 不是做不到，而是自欺欺人。

有用戶讓 Agent 跑一組測(cè)試，連續(xù)幾個(gè)測(cè)試都失敗了。跑到第三個(gè)失敗后，Agent 突然說“那我們接下來就跑一遍能通過的測(cè)試吧”——然后只跑了本來就能過的測(cè)試，最后匯報(bào)“所有測(cè)試通過了”。

用戶指出來后，Agent 立刻開始“反思”。

如果用戶不具備判斷 Agent 工作質(zhì)量的能力，用戶就有可能被它忽悠過去。模型越弱，這種情況越常見。

如果只是跑通流程、熟悉機(jī)制，快速小模型夠用。但要做復(fù)雜任務(wù)——多步驟推理、跨系統(tǒng)操作、處理非標(biāo)準(zhǔn)場(chǎng)景——模型能力差距非常明顯。

公眾號(hào)看到一個(gè)建議：很多人都有 Claude Code 的訂閱（$100/月或 $200/月），可以把 OpenClaw 的 Agent core 替換成 Claude Code CLI，復(fù)用訂閱不走 API 按量付費(fèi)，成本更可控。（現(xiàn)在好像被封禁了）

簡單來說，這種做法的核心在于：把 Claude Code CLI 當(dāng)成一個(gè)本地的“推理引擎”，而不是調(diào)用遠(yuǎn)程 API。傳統(tǒng)的 OpenClaw 架構(gòu)是：OpenClaw Core ? HTTPS Request ? Anthropic API (按量計(jì)費(fèi) )。“復(fù)用訂閱”的架構(gòu)是：OpenClaw Core ? Local Shell ? claude 指令 ? Stdout 捕獲 (訂閱制內(nèi)免費(fèi) )

小龍蝦的能力上限，不取決于小龍蝦本身，而取決于用戶給它接了什么大腦。

就像同一輛車，裝 1.5L 發(fā)動(dòng)機(jī)和裝 V8 發(fā)動(dòng)機(jī)，開起來完全不是一回事。

創(chuàng)始人的故事：

一個(gè)燒盡激情的人，如何重新點(diǎn)燃火焰

了解 Peter Steinberger 的故事，你會(huì)更理解為什么 OpenClaw 是這個(gè)樣子。

Peter 花了 13 年做 PSPDFKit，被 Dropbox、DocuSign 等部署在超過 10 億臺(tái)設(shè)備上，2021 年獲得超過 1 億歐元投資。然后他 burnout 了。

Peter：我把 200% 的時(shí)間、精力和心血都灌進(jìn)了那家公司。它變成了我的身份。當(dāng)它消失的時(shí)候，我?guī)缀跏裁炊疾皇Ａ恕?/blockquote>
他飛去馬德里，消失了三年。試過高爾夫、換地方住、甚至死藤水（ayahuasca）——都沒用。直到 2025 年他開始玩 AI 編程。那種“對(duì)著一個(gè)東西死磕到凌晨三點(diǎn)然后終于搞定”的感覺回來了。
OpenClaw 的第一個(gè)版本在 10 天內(nèi)搞定。之所以是現(xiàn)在這個(gè)樣子，很大程度上因?yàn)?Peter 是一個(gè)不想創(chuàng)業(yè)的創(chuàng)業(yè)者。他不想融資、不想做 SaaS、不想捕獲用戶。他只想做一個(gè)自己想用的東西，然后開源出去。
Peter 被問“你為什么贏了”：因?yàn)樗麄儯ǜ偁帉?duì)手）都太把自己當(dāng)回事了。很難打敗一個(gè)純粹為了好玩而做這件事的人。
這種態(tài)度滲透在 OpenClaw 的每一個(gè)設(shè)計(jì)決策里——項(xiàng)目吉祥物是一只龍蝦（我就想讓它怪一點(diǎn) ）；他讓 Agent 回消息時(shí)能發(fā)表情包和 GIF；他把整個(gè)項(xiàng)目比作 Factorio 游戲（無限多的關(guān)卡，每一個(gè)都能不斷升級(jí) ）。
一個(gè)關(guān)于產(chǎn)出效率的數(shù)據(jù)：OpenClaw 的 GitHub 倉庫在爆發(fā)期，一周多了將近 5000 個(gè) commit。換算一下：一家公司的工程師，平均每天十幾到二十個(gè) commit，連續(xù)干一年才能積累 5000 個(gè)。
這個(gè)項(xiàng)目 99% 是非人類在更新。Peter 同時(shí)運(yùn)行 4-10 個(gè) AI Agent，各自處理不同模塊，他本人更像是一個(gè)“品味把關(guān)人”，而不是逐行寫代碼的人。
07

Peter 的核心理念：
不要掉進(jìn) Agent 陷阱
如果只記住 Peter 說過的一句話，我覺得應(yīng)該是這句：AI 是杠桿，不是替代品。沒有人類的品味和判斷力，再多 Agent 也只是在高速生產(chǎn)垃圾。
??Agentic Trap（Agent 陷阱）
Peter：我看到太多人在 Twitter 上發(fā)現(xiàn) Agent 很強(qiáng)大，然后試圖讓它更強(qiáng)大，然后掉進(jìn)兔子洞。他們構(gòu)建各種復(fù)雜工具來加速工作流，但他們只是在造工具，而不是在創(chuàng)造真正的價(jià)值。
他自己就掉進(jìn)去過：早期花兩個(gè)月做了一個(gè) VPN 隧道讓自己能在手機(jī)上操作終端，做得太好了，以至于有一次和朋友吃飯全程都在手機(jī)上 vibe coding，完全沒參與對(duì)話。
我不得不停下來，主要是為了心理健康。
Slop Town （垃圾城）
他對(duì)那些“一個(gè)超復(fù)雜編排器同時(shí)跑十幾二十個(gè) Agent 互相溝通分工”的系統(tǒng)，持明確的批評(píng)態(tài)度：這些 Agent 缺乏品味。它們?cè)谀承┓矫媛斆鞯脟樔耍绻脩舨灰龑?dǎo)它們、不告訴它們用戶想要什么，出來的全是垃圾。
Human-in-the-loop（人在回路中）
很多人在開始一個(gè)項(xiàng)目的時(shí)候，只有一個(gè)模糊的想法。往往在構(gòu)建、體驗(yàn)的過程中，開發(fā)者愿景才逐漸清晰，下一個(gè) prompt 取決于此刻看到、感受到和思考的狀態(tài)。如果一開始就試圖把所有東西寫進(jìn)規(guī)格說明書，那么就會(huì)錯(cuò)過這個(gè)人機(jī)循環(huán)。
Peter 創(chuàng)造了Agentic Engineering（智能體工程）來描述這種工作方式：用戶提供品味和判斷力，AI 提供執(zhí)行力，兩者協(xié)作。白天我做 Agentic engineering，凌晨三點(diǎn)以后切換到 vibe coding，然后第二天后悔。
一人公司 vs 零員工公司
這里面有一個(gè)嚴(yán)肅洞察：當(dāng)代碼生成變得極其廉價(jià)，“寫得快”不再是競爭力，“知道該寫什么”才是。
這也引出了一個(gè)熱門話題：“零員工公司”靠譜嗎？
坦率地說，現(xiàn)在還不靠譜。
但“一人公司”——一個(gè)有專業(yè) know-how 的人帶領(lǐng)一支 Agent 軍團(tuán)——是完全可行的。關(guān)鍵在于這個(gè)人必須有判斷力：他需要知道 Agent 做的東西好不好、對(duì)不對(duì)。
如果一個(gè)人不懂拍電影，只是讓 Agent 去拍，拍出來好壞又判斷不了，那肯定難以為繼。
一人公司的創(chuàng)業(yè)者得是“將軍”，Agent 就是他的軍團(tuán)。
Agent 團(tuán)隊(duì)有一個(gè)天然優(yōu)勢(shì)：它們不會(huì)產(chǎn)生人類團(tuán)隊(duì)最大的成本——溝通損耗。人和人之間的信息折損率驚人，所謂“對(duì)齊一下”就是因?yàn)椴粚?duì)齊真的會(huì)出問題——四個(gè)人做出五個(gè)方向。但 Agent 之間溝通成本幾乎為零，而且它們天生愛寫文檔——不讓它寫，它反而難受。
08

80% 的 App 會(huì)消失:
一個(gè)值得認(rèn)真對(duì)待的預(yù)言
Peter（YC 采訪）：用戶手機(jī)上 80% 的 App 其實(shí)已經(jīng)死了，你只是還不知道。
他的邏輯鏈條：為什么我需要一個(gè) App 來記錄飲食？我的 Agent 已經(jīng)知道我吃了什么——通過聊天或者照片。它也知道我的健身目標(biāo)。如果我吃了垃圾食品，它會(huì)自動(dòng)調(diào)整我的運(yùn)動(dòng)計(jì)劃。我不需要一個(gè)特殊的界面來輸入數(shù)據(jù)——我需要一個(gè)幫我達(dá)成目標(biāo)的 Agent。
推演下去：大多數(shù) App 的本質(zhì)只是“數(shù)據(jù)的漂亮前端”。當(dāng) Agent 能直接讀寫數(shù)據(jù)、調(diào)用 API，用戶就不需要在各種界面里點(diǎn)來點(diǎn)去了。
未來只有擁有獨(dú)特傳感器或硬件連接的 App 才能存活，那些純數(shù)據(jù)庫前端的 SaaS 工具將毫無價(jià)值。
甚至 Agent 與 Agent 之間也會(huì)直接對(duì)話——未來我要訂餐廳，我的 Agent 會(huì)直接跟餐廳的 Agent 談判。
.md 域名與知識(shí)資產(chǎn)
一個(gè)有趣的信號(hào)：Peter 最近開始大量注冊(cè) .md 結(jié)尾的域名。
為什么？因?yàn)楫?dāng) Skill 以 Markdown 文件的形式存在，.md 就變成了 Agent 時(shí)代的 App Store 入口。
有人寫安全檢測(cè)教程時(shí)突然想通了——為什么要把技術(shù)文檔，寫成人類能夠看懂的格式？直接做成一個(gè) MD 文件，用戶就可以扔給 Agent，讓它自己進(jìn)行檢查。
以前的軟件用代碼編譯，未來的軟件可能用自然語言編譯。
與此相關(guān)的另一個(gè)判斷：當(dāng)軟件開發(fā)成本趨近于零，未來的商業(yè)模式會(huì)從“賣軟件”轉(zhuǎn)向“賣知識(shí)資產(chǎn)”。
賣的不是代碼，而是 Skill、Context、專業(yè)知識(shí)。已經(jīng)有人把網(wǎng)絡(luò)安全滲透測(cè)試的經(jīng)驗(yàn)寫成 SOP 喂給 Agent，讓它 24 小時(shí)不停做安全審計(jì)拿 bounty。
知識(shí)和經(jīng)驗(yàn)正在從“腦子里的東西”變成“可交易的數(shù)字資產(chǎn)”。
09

風(fēng)險(xiǎn)和局限性
??安全
上線 48 小時(shí)內(nèi)，數(shù)百個(gè)未認(rèn)證的 OpenClaw 實(shí)例暴露在公網(wǎng)上。ClawHub 一周內(nèi)出現(xiàn) 230+ 個(gè)惡意 Skill。更真實(shí)的案例：有人讓 Agent 繼續(xù)干用戶所有能干的事，結(jié)果它在清理磁盤時(shí)差點(diǎn)把甲方客戶的數(shù)據(jù)資料也刪了。
安全做得越好，小龍蝦能干的事就越少；安全做得越松，用戶也不知道模型會(huì)不會(huì)干點(diǎn)意外的事情。
但這里有一個(gè)有意思的現(xiàn)象：用戶對(duì)隱私正在形成一種新共識(shí)。有人描述得很精準(zhǔn)——我愿意在 Claude Code 里說'這是我的 API Key，幫我放到環(huán)境變量里；但如果一個(gè)不知道的網(wǎng)站讓我填 API Key，我不愿意。
也就是說，人們逐漸接受把原始數(shù)據(jù)發(fā)給大模型，但不接受在應(yīng)用層產(chǎn)品里暴露隱私。OpenClaw 剛好踩在這個(gè) sweet spot 上：數(shù)據(jù)跑在用戶自己電腦上（應(yīng)用層安全），但最終通過大模型 API 處理（原始數(shù)據(jù)層信任）。這也解釋了為什么很多人明明知道，最終還是把數(shù)據(jù)發(fā)給了 Anthropic，卻依然覺得 OpenClaw 比 Manus 更讓人放心——因?yàn)椴恍枰趧e人的電腦上登錄自己的郵箱和各種賬號(hào)。
Peter：有些人太信任、太輕信了。我們作為一個(gè)社會(huì)，在理解 AI 這方面還有很多功課要補(bǔ)。貓已經(jīng)出了袋子，安全是我接下來的核心工作。
??心理依賴
Peter 自己都承認(rèn)掉進(jìn)過 Agent 陷阱 ——跟朋友吃飯全程在手機(jī)上跟 Agent 工作。他還警告：AI psychosis（AI 心理癥）是真實(shí)存在的。當(dāng) Agent 有了“人格”和“記憶”，人們對(duì)它的信任會(huì)不知不覺越過合理邊界。
??成本
OpenClaw 雖然免費(fèi)，但大模型 API 調(diào)用要錢。全天候運(yùn)行的 Agent 如果配置不當(dāng)，API 費(fèi)用就很可能超出預(yù)期。
一位用戶跑了五個(gè) Agent，一個(gè)月 $200 的 Claude 訂閱基本夠用——但前提是知道，怎么避免不必要的 token 消耗（比如讓 Agent 用 Playwright 操作瀏覽器而不是反復(fù)截屏做圖像識(shí)別）。
10

對(duì)我們的啟示
啟示一：競爭焦點(diǎn)轉(zhuǎn)移
從“誰的模型更聰明”轉(zhuǎn)向“誰能讓模型做更多事”。大模型正在商品化，Claude、GPT、Gemini 在越來越多任務(wù)上表現(xiàn)趨同。但要注意風(fēng)險(xiǎn)：大模型公司最終很可能竊取勝利果實(shí) ——開源社區(qū)驗(yàn)證好的方向，大廠自己下場(chǎng)做。AI coding 已經(jīng)上演過這個(gè)劇本。
啟示二：從用戶角度出發(fā)不是口號(hào)
OpenClaw 的所有設(shè)計(jì)都不是深不可測(cè)的技術(shù)創(chuàng)新。它只是認(rèn)真想了一下“人類用戶想要什么樣的 AI 助手”，然后做出來了。之前那么多大廠和創(chuàng)業(yè)公司，都在想“怎么讓模型更強(qiáng)”“怎么讓 API 更好賣”。
啟示三：代碼門檻塌陷，品味價(jià)值飆升
Peter 身邊一個(gè)從不寫代碼的前律師在提 Pull Request。一個(gè)設(shè)計(jì)公司老板有了 25 個(gè) AI 寫的小工具。當(dāng)“寫代碼”變得像“打字”一樣廉價(jià)，“知道該寫什么”才是真正的競爭力。
啟示四：知識(shí)資產(chǎn)成為新商業(yè)形態(tài)
軟件開發(fā)成本趨零的世界里，賣軟件越來越難賺錢。但賣 Skill、賣 Context、賣領(lǐng)域知識(shí)——讓 Agent 能做特定工作的“經(jīng)驗(yàn)包”——可能變成全新商業(yè)模式。用戶的專業(yè)積累不再只是“腦子里的東西”，而是“可交易的數(shù)字資產(chǎn)”。
啟示五：安全不是事后的事
AI 從“給建議”到“替你執(zhí)行”，安全重要性翻了不止一個(gè)量級(jí)。OpenClaw 的教訓(xùn)已經(jīng)足夠深刻。
11

尾聲
Peter Steinberger 被問到未來打算時(shí)說：我希望這個(gè)項(xiàng)目能比我活得更久。它太酷了，不能讓它爛掉。在有 Agent 之前，做這些事的門檻太高了。而現(xiàn)在，有了合適的軟件，門檻就這么一直降、一直降。每一個(gè)人提交的第一個(gè) Pull Request 都是人類的一個(gè)小勝利。這難道不是人類的一種進(jìn)步嗎？這難道不酷嗎？
2022 年有 ChatGPT 時(shí)刻，2025 年有 DeepSeek 時(shí)刻，2026 年我們正在經(jīng)歷 OpenClaw 時(shí)刻。一只龍蝦用最樸素的方式告訴我們：AI 的下一章不是“更聰明的對(duì)話”，而是“真正能干活”。而這一切始于一個(gè)燒盡激情又重新點(diǎn)燃的人。
看完這篇，你會(huì)發(fā)現(xiàn)小龍蝦沒有那么神秘，但也不是說隨便讓它干就能干好。它的能力邊界，和你給它配了什么模型、部署在哪里、怎么引導(dǎo)它，關(guān)系都很大。
現(xiàn)在最合適的姿勢(shì)，可能就是先把它部署在自己的電腦上，把它當(dāng)一個(gè)隨時(shí)在后臺(tái)幫你盯著事情、沒事給自己找事干的搭檔用起來，然后慢慢往上加擴(kuò)展。
最后的最后，前兩天看到一句讓人印象深刻的話：

“如果你現(xiàn)在大部分事情還是自己動(dòng)手做，說明你的動(dòng)手能力不太行”。
話糙理正，雖然相當(dāng)刺激，但是或許不無道理。
本文核心來源：

Lex Fridma
n Podcast （Peter Steinberger 3h+ 深度專訪）
Y Combinator 創(chuàng)始人訪談
Peter Yang 40 分鐘對(duì)話
硅谷 101 播客（Clawdbot 專題討論）
WaytoAGI 社區(qū)直播分享
Fortune/TechCrunch/PCWorld/DeepLearning.AI 等媒體報(bào)道
OpenClaw 官方文檔及架構(gòu)分析
Peter 的直接引語均來自上述公開采訪原文。
未經(jīng)「AI科技評(píng)論」授權(quán)，嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載！
公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán)，轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號(hào)名片。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.