![]()
越過從記憶到理解的鴻溝。
作者丨星龍
編輯丨馬曉寧 梁丙鑒
5 月 14 日,OpenHuman 登上 GitHub 榜單,并在這個月中旬經歷了爆發式增長。僅僅 6 天之內,它從 3,489 增長到 14,227 stars,日均增長 1,690 stars,連續霸榜第一約一周之久。截至研究日,更是已經突破 18,600 stars。
![]()
OpenHuman 是一款由開發者集體 TinyHumans AI 構建的開源桌面 AI Agent。它的自我定位是「Personal AI Super Intelligence」,即一個私有、簡單、極其強大的個人智能體。
從品類上看,OpenHuman 既不是 IDE(不寫代碼),也不是聊天機器人(有工具調用和自動化能力),也不是筆記軟件(雖然它生成 Obsidian 兼容的知識庫)。
它試圖成為一個桌面級的個人 AI 操作系統入口,把記憶、集成、語音、編碼工具、本地知識庫塞進同一個 Agent 框架里。
而在桌面級智能體助手迭出的今天,它的核心主張也可以用一句話概括:在用戶輸入第一個 prompt 之前,Agent 就已經了解你。
![]()
從制作者自己在 Product Hunt 上的評論中可以看到,這個項目的初衷其實很樸素。創始人想給自己的老爸配置一個 AI Agent,但發現市面上的智能體配置都太復雜了,從裝終端、配 API Key,到寫 YAML,一般人根本玩不轉。于是他想做一個,真正能一鍵開箱即用的產品。
![]()
這個出發點是真誠的。但 AI 產品或者 vibe coding 這事,往往夢想很龐大, 落地都一地雞毛。我們上手之后很快就發現,OpenHuman 的實際使用體驗和愿景,還有著不小的距離。
最明顯的問題是,「在第一個 prompt 之前就了解你」的主張,隱含著一個巨大的前提條件:
你必須主動、盡可能多地綁定第三方服務。
![]()
如果用戶不連接 Gmail、GitHub、YouTube 等賬號,這個 Agent 就會對你一無所知,它會退化成一個普通的聊天窗口,和免費的 ChatGPT 沒有本質區別。
所謂的“分鐘級了解”,完全建立在用戶綁定賬號的“分鐘級手速”之上。但誰會在接觸一款新產品的第一瞬間,就急頭白臉地交出幾乎所有權限?
這是 OpenHuman 給我們留下的第一印象,冒昧,而現實的骨感之處還有更多。
01
Agent 商業化,毛坯房開張
使用 OpenHuman 的過程中,一種很強烈的感受在于,這是一個商業化野心遠超產品完成度的項目。
這種洞察甚至先于真正上手使用,因為我們發現主界面已經高調加入了「獎勵」模塊。也就是說當產品還在 Early Beta,功能還有大量粗糙邊角的時候,推薦獎勵系統就已經就位了。這種對優先級的選擇,本身就傳遞了很多信號。
![]()
此外如果用戶不訂閱 OpenHuman 的付費計劃,而是配置自己的 API Key,那么得到的只會是一個聊天框。沒錯,連 tools 都無法使用。
免費情況下所有工具調用能力被鎖死,Agent 的手和腳被沒收了,核心功能完全不可用。此時的OpenHuman 只剩一張嘴,這意味著「一鍵開箱即用」的愿景,必須靠充值才能實現。
![]()
公平地說 OpenHuman 確實提供了一定的免費額度,但實測下來大概只支持三次簡單問答。甚至于用戶一句話都不說的情況下,如果 Agent 綁定了幾個第三方賬號,那么系統自動抓取數據消耗的 token,也足以把免費額度吃光。用戶還沒來得及輸入第一個 prompt,Agent 就死在了沒額度上。
![]()
![]()
產品的夢想是「在輸入第一個 prompt 之前 Agent 就足夠了解你」,但現實是「在輸入第一個 prompt 之前 Agent 就已經把你的免費額度花完了」。
可以看出,OpenHuman 宣稱的低成本、無摩擦使用,完全建立在充值之上。
細想之下 OpenHuman 其實展現出了相當魔幻的一面。
一方面,市場上已經有不少能夠一鍵開箱即用的免費 Agent 產品,甚至于 ChatGPT 某種程度上也可以歸于此列。另一方面,OpenHuman 選擇了「付費」作為用戶轉移學習成本的方式,但付費本身就是巨大的用戶使用成本,它和「簡單」的目標自相矛盾。
當然,這也不能全怪 OpenHuman。AI 的推理成本確實昂貴,對于一個需要每 20 分鐘自動抓取數據、持續構建記憶樹的系統,token 消耗更是普通聊天的數倍。
這或許也反映了 AI 創業的一個殘酷現實,如果沒有足夠充裕的啟動資金來補貼冷啟動期的用戶體驗,就會重現 OpenHuman 這種尷尬的劇本,產品還沒讓用戶感受到價值,就已經開始要錢了。
02
源碼層創新
拋開體驗層面的粗糙,這款產品在工程架構上確實有值得關注的設計。
OpenHuman 的核心架構是一條三階段管道:
? 連接:OAuth 接入 118+ 服務
? 抓取:每 20 分鐘自動輪詢
? 記憶:轉換為 Markdown,構建 Memory Tree
這種設計意圖很清晰,就是為了讓 Agent 能在后臺持續積累對用戶的了解,無需用戶主動投喂數據。當一眾 Agent 產品都在宣稱自己“越用越懂用戶”,OpenHuman 把這個過程的開端,拉低到了只要能在用戶的設備上跑起來即可。
為了實現這一點,OpenHuman 的技術棧選擇了 Tauri,即 Rust 后端加 WebView 前端。必須承認開發團隊確實非常細節,相比 Electron,Tauri 更輕量、更安全、更省內存,適合需要長期后臺運行的 Agent 應用。從這個選型就體現出了團隊對產品形態的思考,當它需要像一個系統服務一樣常駐后臺,Electron 的資源開銷在這個場景下就是不可接受的。
此外還有 Memory Tree,這是 OpenHuman 最有技術含量的部分。關注 Andrej Karpathy 的朋友或許有印象,他在今年 4 月提出了一個名為「LLM Wiki」的概念,也就是用 LLM 將原始數據編譯成結構化的 Markdown 知識庫。
OpenHuman 把這個手動過程完全自動化了,多源數據抓進來,經過標準化、分塊(≤3k token)、評分,最終形成層級摘要樹,分別存入SQLite(供機器檢索)與obsidian Vault(方便人工查閱)。
這里面最關鍵的設計決策是可檢視性,用戶終于可以直接打開、閱讀、編輯 Agent 的知識庫。這和傳統 RAG 的向量黑箱形成了鮮明對比,當你能看到 AI 到底「記住」了什么,才能談溯源和糾正。
![]()
這類工具調用 Agent,有一個通病是反復召回導致的上下文爆炸。OpenHuman 也考慮到了這一點,它的架構中有一層名為 TokenJuice,這是一個用于 token 壓縮的中間層。原理并不復雜,HTML 轉 Markdown、長 URL 縮短、噪聲清理、內容去重,同時保留 CJK 和 emoji 等多字節文本,但官方聲稱,就是這一套流程下來,可以降低高達 80% 的 token 消耗。
比起實現路徑,這種工程思路顯然更珍貴。在 Agent 系統中,真正昂貴的是后臺抓取和工具調用產生的 token,在數據進入模型前做清洗,一定比直接塞原始內容更經濟。
OpenHuman 另一處比較少見的設計,是提供了非常豐富的內置智能路由。推理密集任務走前沿大模型,常規任務走便宜模型,圖像走視覺模型,支持 Ollama 本地推理,成本控制更加合理。
![]()
03
上下文即產品
從 OpenClaw、Hermes 到 OpenHuman,短短半年間,已經有三代 Agent 在 GitHub 上各領風騷。有意思的是,你能看到三者之間在工程思路上存在著根本差異。
![]()
OpenClaw 特征最鮮明,它在試圖構建的是一個 Agent 控制平面,在此基礎上才有了多 Agent 團隊、跨通道路由和 Skill 市場,使用體驗很像是在管理一個公司的 Agent 組織。
Hermes 的關鍵詞則到了自進化。外部環境、腳手架……這些描述背后的共性在于,它們都看到了 Hermes 服務于單 Agent 持續改進的一面,這也是 Hermes 最核心的產品邏輯,即檢測重復模式,然后自動生成可復用技能,就像是訓練一個越來越聰明的助手。
沿著這條脈絡,就不難理解 OpenHuman 的宣言。在使用之前就開始了解用戶,也就是不需要等待用戶教,而是主動「認識」用戶。這是一種「上下文即產品」的 Agent 哲學,把用戶的個人數據積累變成結構化記憶,此時的 Agent ,像是一個從 Day 1 就認識了你的同事。
當然,為此帶來的風險也是結構性的,OpenHuman 的價值主張和安全風險本就一體兩面。
首當其沖的是 OAuth Token 聚合。
同時持有郵件、代碼、日歷、支付的 OAuth Token,本地 SQLite 數據庫就會成為高價值攻擊目標。2026 年已有前車之鑒,Context.ai/Vercel 事件中,攻擊者通過竊取 OAuth Token 橫向移動到 Vercel 內部系統,OpenClaw 的「Claw Chain」四漏洞鏈影響了 245,000 臺服務器。OpenHuman 面臨完全相同的結構性風險,且目前沒有任何獨立安全審計。
此外還有 curl | bash 安裝。對于一個即將獲得你郵件、代碼、日歷、支付信息訪問權限的工具,管道安裝是已知的供應鏈攻擊向量。2025 年 ClickFix 攻擊增長 517%,核心手法就是誘導用戶在終端執行遠程命令。
而在所有風險之上,更值得深思的是 OpenHuman 自身發布的,未經驗證的技術聲明。前文提到的 80% token 壓縮率、20 分鐘同步可靠性、Memory Tree 的規模行為都是項目自述,無第三方驗證。而壓縮層決定了哪些信息被保留、哪些被丟棄,對于敏感場景,這是不得不慎重的問題。
這些風險是 feature 的副作用。要做到「分鐘級了解你」,就必須同時獲取大量敏感數據,要「一鍵設置」,就必須簡化安全邊界,要「持續更新記憶」,就必須保持長期有效的 token。OpenHuman 的價值和風險,在架構層面就是綁定的。
04
第三代 Agent 產品哲學
盡管 OpenHuman 本身在完成度和商業化上有著諸般漏洞,但它提出的產品哲學仍然值得認真對待,甚至可以說,這正是 OpenHuman 最具價值的部分。
「上下文即產品」的核心主張是:當模型能力趨同后,產品的核心價值不在于它能做什么,在于它知道什么。同樣的模型,給它不同質量的上下文,產出的價值天差地別。
這項主張背后有一條清晰的邏輯鏈。當技術能力從稀缺走向充裕,Agent 能力真正商品化,競爭焦點就會從「我能做什么」上移到「我能幫你做什么」,此時對用戶的理解就變成了新的稀缺資源。
這個鏈條在從網絡帶寬到內容推薦,從相機像素到計算攝影,從CPU 主頻到用戶體驗等多個行業,已經被反復驗證過。
OpenHuman 的出現仍然是對這種歷史進程的重復,也就是在 Claude、GPT、Gemini 能力逐漸趨同的節點上,試圖卡住「更了解用戶」的身位。
但這里有一個關鍵的辨析,記住 ≠ 理解。
OpenHuman 目前做到的是「跨源記憶」,用戶授權之后從多個平臺拉取數據,壓縮存儲,被動檢索。這解決了從 0 到 1 的問題,也就是讓 Agent 有記憶。但是從「記住」到「理解」還有巨大的鴻溝,理解意味著關系推理、意圖預測、價值對齊,在諸多孤立的信息點之間,建立邏輯和圖景,描述未來和價值。
與此同時,「記住一切」也未必是正確答案。 記憶也有邊際遞減,真正有價值的不是記住更多,而是在關鍵時刻調用關鍵記憶。OpenHuman 「全量抓取 + 壓縮存儲」的路線,可能不如「少而精的關鍵記憶 + 強推理」更接近「理解」。
理解是記憶、推理、目標模型的乘積。 三者缺一,都只是更高級的搜索引擎。
這或許就是 AI 產品的下一個競爭維度,一個夾在模型和用戶之間的、負責積累和管理用戶上下文的「理解層」。OpenHuman 對此的洞察很可能是正確的,但全量抓取、壓縮存儲、被動檢索只是這個方向上最早期、最粗糙的一次嘗試。
因此如果你問我如何看待 OpenHuman。
我會說這是一個方向正確、時機精準、但執行粗糙、商業化過早的產品實驗。它最大的價值不在于做出了什么,而在于它定義了一個好問題:當模型能力面臨邊際遞減,如何越過從記憶到理解的鴻溝,會是構建護城河的關鍵。
這中間的差距,既是它的局限,也是整個行業的機會空間,反之亦然。
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.