![]()
1
今天釘釘發布了悟空,我也是第一時間試用了一下,想聊聊幾句。
![]()
OpenClaw 火了之后,國內大廠跟進的速度很快,以 BAT 為代表。
字節的火山引擎做了 ArkClaw,本質是把 OpenClaw 搬到云端,網頁打開就能用;騰訊做了 WorkBuddy,自研一套桌面 Agent,3 月 12 號全量開放還打通了微信直連。兩家的邏輯都很清晰:先讓個人用戶用起來,門檻越低越好,跑起來再說。
而悟空不是這個思路。
我翻了一圈資料,發現悟空做了這么幾件事:
- 四層 Skill 體系(釘釘原生的、阿里集團商業操作系統的、企業私有的、開源兼容的)
- Skill 全生命周期管理(從創建到審核到發布到下架到監控)
- 一套從零寫的 AI 原生文件系統叫 RealDoc
- 一個塞了 1 塊 PC 主板加 5 塊手機主板的專用硬件 Realbox。
說實話,第一反應是倆字:太重。
2
先說我的疑慮。
OpenClaw 全球爆發也就這幾個月的事,大多數企業連 Agent 到底能干嘛都還沒搞明白,在這個時間點這么大力推,是不是有點不合時宜?
像悟空推的是雙層安全規則體系、獨立沙箱、三級網絡管控、全鏈路審計日志。甚至細到群聊場景里,悟空的數據權限取「用戶權限」和「提問人權限」的交集——哪怕悟空理論上能訪問某些數據,提問的人沒權限,它也不返回。
這些功能每一條拿出來都是對的。甚至可以說是必要的。
但問題在于:這是現在企業最急迫的需求嗎?
打個不太恰當的比方。智能手機剛出來的時候,你不先賣手機,先賣 MDM(移動設備管理)。邏輯上完全說得通,但市場還沒走到那一步。大部分中小企業老板對 Agent 的理解可能還停留在「幫我寫個周報」的階段,你跟他講全鏈路審計和風險熔斷,他大概率會問一句:這跟我有什么關系?
釘釘在國內 SaaS 平臺從來都是以比較能做落地的決策著稱的,為什么這一次反而不太一樣了?
另外,從路徑看,的確是在模仿 Anthropic 走企業級路線。而 Claude 走出了 Claude Code 的路線,悟空走的是什么路線呢?
3
用戶到底是誰。
悟空的定位寫的是「中小企業、企業開發者、行業客戶」。但看它展示的核心能力——四層 Skill 體系、全生命周期管理、集群部署、多人共用 Realbox——全部指向中大型組織。
有意思的是,悟空同時推了一個叫 OPT(One Person Team,一人團隊)的概念,感覺是在響應國家的 OPC(One Person Company)的號召。覆蓋十個行業:一人電商、跨境電商、知識博主、一人門店、一人律師團隊、一人設計團隊、一人制造團隊、一人財務團隊、一人獵頭團隊、一人開發團隊。
![]()
這中間的挑戰就很大了。
一邊是企業級架構——權限管控、集群部署、操作審計;一邊是超級個體——一個人運營一家電商,一個人管一家門店。這兩類人的需求差距實在太大了。
拿「一人門店」這個場景來說。素材里有個案例叫杭工匠車身修復,開在停車場三樓,線下自然客流幾乎為零,全靠線上引流活。這個老板需要的是什么?大概就是幫我在小紅書上自動回評論、自動發爆款筆記、別讓咨詢消息過夜。
他需要全生命周期 Skill 管理嗎?需要企業級權限管控嗎?估計不需要。他需要的是五分鐘上手,立刻見效。
目前悟空的企業級架構和 OPT 超級個體之間,還少了一個清晰的分層入口。輕量用戶怎么進來?重度用戶怎么升級?這條路徑現在還不夠清晰。
4
不過上面說了這么多疑慮和挑戰,有一件事改變了我的看法。
悟空整場發布里有一個看似不太重要的信息,但我覺得是最硬核的東西——釘釘全產品 CLI 化。
CLI 是最近科技領域非常關注的一個產品形態,它很可能會在一段時間后替代掉圖形界面。像我近期用 Claude Code 和 Codex 就非常過癮,他們不光能解決代碼的問題,其實是解決了讓大模型長出手腳的問題,也是 OpenClaw 的精神父親。
![]()
釘釘把過去 11 年做的所有產品——AI 表格、AI 聽記、視頻會議、文檔、知識庫、審批、OA,還有各類 SaaS 應用——全部重寫為 CLI(命令行接口),AI 可以理解、調用、操作釘釘的產品能力。
注意,這不是「在釘釘上面加了一個 AI 助手」。官方自己說的原話是:這不是在老產品上加 AI 功能,而是為 AI 造了一套原生的操作語言。
這件事為什么重要?因為它回答了一個根本性的問題:Agent 操作企業軟件的方式到底應該是什么。
OpenClaw 和市面上絕大多數 Agent 的方式是屏幕操作——AI 看著你的電腦屏幕,模擬鼠標鍵盤點來點去。正如之前豆包手機所面臨的問題一樣(豆包手機是靠屏幕不斷的截圖來實現的),這種方式的上限是低的:慢、不穩定、容易出錯,復雜的企業級權限更是處理不了。
悟空的方式是原生調用——AI 通過 CLI 直接操作釘釘的審批鏈、數據表、日程系統、通訊錄。
前者像是雇了個實習生坐在你電腦前幫你操作軟件,后者則是給了一個懂行的專家直接接入了公司的業務系統。這完全不是一個量級的事情。
而且 CLI 化還有一個更深遠的可能:
因為每一個釘釘功能都變成了標準化的命令行接口,意味著未來任何第三方 Agent 都可以調用這些能力。釘釘不只是在做一個 Agent 產品,它在把自己變成所有 Agent 的企業級技能包和武器庫。
當然,要打一個大大的問號。11 年的產品線,CLI 化到底完成到了什么程度?是全量覆蓋,還是重點場景的 demo?這個問題的答案,決定了上面這段話是預言還是吹牛。
但至少方向上,這是我目前看到的大廠做 Agent 里最有結構性壁壘的一步棋。
5
除了 CLI 化,還有兩個被忽視的細節。
第一個是 RealDoc。
解決的是一個所有 Agent 用戶都遇到過的痛點:
當前所有 AI Agent 操作文件的方式極其原始,改文檔里一個詞,AI 得先把整篇文檔讀進來,改完再整篇寫回去。像是改書里一個錯別字,卻要把整本書抄一遍。官方給了一個案例的數據:有用戶實測制作一個 PPT,消耗了 2.7 億 Token,約 500 美金。
RealDoc 讓 AI 可以按行號定位、按關鍵詞錨點、用正則表達式批量匹配,只動需要動的地方。每步操作自動保存快照,改壞了一條命令回退到任意版本。
這種「臟活」層面的創新很難體現在精彩的畫面上,但極其實用。說明團隊不是在畫 PPT,是在解決 Agent 落地過程中那些真正惡心人的工程問題。
第二個是 AI IM 的升級。
過去用 Agent 的方式是「人找 AI」——打開悟空、輸入指令、等結果、再搬回工作場景。中間有三層摩擦成本:切換、描述、搬運。
釘釘做的是在 IM 側邊欄嵌入一個 AI IDE,讓悟空實時讀取對話流、自動給出建議、直接執行任務。不是你問它答的 Copilot 模式,是主動發現任務并提建議的 Agent 模式。
這兩個細節加在一起說明一件事:悟空不是在堆功能清單,是真的想過了用戶體驗。
6
回頭再看悟空那些一開始覺得「太重」的設計,換個角度想想。
權限管控、操作審計、風險熔斷、Skill 全生命周期管理——這些不是錦上添花的東西,是 Agent 進入企業場景的必答題。只不過,大多數人還沒走到需要答題的階段。
OpenClaw 爆發后的幾個月里發生了什么?龍蝦刪郵件、敏感數據被 AI 讀取、文件散落在本地虛擬機無人管控、員工離職一鍵刪除企業資產。這些不是假設性風險,是真實發生過的事情。AI 有了操控電腦的能力,安全不是「有沒有」的問題,是「敢不敢放進企業」的問題。
從這個角度看,悟空從第一天把安全建進架構里而不是事后打補丁,就不是過度設計,而是唯一正確的做法。安全一直是紅線,相當于企業的地基。
再說生態位。阿里集團旗下淘寶、天貓、支付寶、阿里云的商家服務能力正在以 Skill 形式逐步接入悟空。一個跨境電商用戶通過悟空,未來可以在一個平臺里完成「亞馬遜選品→1688 找同款→供應商溝通→商品名優化→TikTok 視頻營銷」的完整鏈路。這不是創業公司能拼湊出來的能力密度。
悟空賭的不是「現在企業需要 Agent」。它賭的是「當企業需要 Agent 的時候,需要的一定是這種形態」。
7
說了這么多,最后聊聊「跟我們有什么關系」。
對大多數個人用戶來說,今天下載了悟空,也許還不是能興奮地干拔一個業務的時刻。OPT 十大行業方案里的一人門店、一人電商聽起來很誘人,但上手體驗到底如何,也還需要驗證。
但如果你是這么幾類人,可以現在就認真看一眼:
- 中小企業主,已經在讓員工用 Agent 處理工作,但擔心數據安全和管控的
- 開發者,想找一個能把 Skill 快速商業化變現的平臺
- 釘釘生態里的 ISV 或 SaaS 合作伙伴,在考慮下一步怎么接 AI 能力的
悟空不完美。時機可能偏早,功能架構也許還比較粗糙。但它做了一件大多數在追熱點的產品沒做的事——不是在簡單地關注「怎么讓更多人先用起來」,而是在問「當企業真正需要 Agent 的時候,它們需要什么」。
在一個所有人都在比誰跑得快的賽道里,有人愿意停下來回答一個更難的問題。我傾向于覺得,這件事本身值得被認真對待。
先說這么多。希望對各位有啟發。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.