![]()
作者 | Yoky
郵箱 | yokyliu@pingwest.com
Harness 是目前 AI Agent 基礎(chǔ)設(shè)施領(lǐng)域最具參考價(jià)值的架構(gòu)框架之一。它將 Agent 的運(yùn)行所需拆解為七大核心模塊:從工具接入、編排協(xié)調(diào),到記憶管理、安全防護(hù)、網(wǎng)絡(luò)通信,清晰地勾勒出一個(gè)完整 Agent 系統(tǒng)的技術(shù)骨架。
圍繞這七大模塊,開源社區(qū)已經(jīng)涌現(xiàn)出大量活躍項(xiàng)目,覆蓋了 Agent 開發(fā)的幾乎每一個(gè)環(huán)節(jié)。對于創(chuàng)業(yè)團(tuán)隊(duì)和小型公司來說,不需要從零搭建,也不必依賴大廠的全家桶:沿著 Harness 的架構(gòu)地圖,在每個(gè)模塊中選擇少而精的開源方案,就能快速拼出一套可靠的 Agent 基礎(chǔ)設(shè)施。
本文從 Harness 架構(gòu)的AI Infra出發(fā),精選 10 個(gè)最具代表性的開源項(xiàng)目,逐一拆解它們解決什么問題、適合什么場景,幫助團(tuán)隊(duì)少走彎路,把基礎(chǔ)設(shè)施搭對。
1
一、工具接入:讓 AI 懂“做事”
Agent 的推理能力突飛猛進(jìn),但"想明白"和"干得了"之間還隔著一道鴻溝。大多數(shù) AI 目前只能在對話框里輸出文字,一旦需要操控真實(shí)軟件、訪問在線平臺(tái)、調(diào)用各種 API,就撞上了工具接入的墻——要么沒有接口,要么接口殘缺,要么接入成本太高。這一層要解決的核心問題就是:怎么讓 Agent 從"能想"變成"能做"。
推薦:CLI-Anything
HKUDS/CLI-Anything
項(xiàng)目介紹
CLI-Anything 的思路是:既然 CLI(命令行)是人和 AI 都能流暢使用的"萬能語言"——結(jié)構(gòu)化、可組合、自描述——那就把任何軟件自動(dòng)轉(zhuǎn)成 CLI 工具。它搭了一條七階段全自動(dòng)流水線,從源碼分析到架構(gòu)設(shè)計(jì),再到實(shí)現(xiàn)、測試、文檔生成,一路走完直接輸出生產(chǎn)級的命令行工具。不是簡陋的 wrapper,它要可以真正調(diào)用軟件底層:比如Blender 的后臺(tái)渲染、GIMP 的 Batch 模式、Audacity 的音頻處理等。
團(tuán)隊(duì)背景
項(xiàng)目出自香港大學(xué)數(shù)據(jù)科學(xué)實(shí)驗(yàn)室(HKUDS),2026 年 3 月正式發(fā)布。目前已經(jīng)為 20 多款主流軟件生成了生產(chǎn)級 CLI,跑通了 2,005 項(xiàng)測試(包括 1,453 個(gè)單元測試和 533 個(gè)端到端測試),通過率 100%。GitHub 上拿到了 25800 顆星,Claude Code、OpenClaw、GitHub Copilot CLI 等主流 Agent 平臺(tái)都已接入支持。
為什么值得關(guān)注
目前讓 Agent 操控真實(shí)專業(yè)軟件的方案里,CLI-Anything 可能是最靠譜的。GUI 自動(dòng)化天然脆弱——界面一改就崩,而 CLI 是穩(wěn)定、可預(yù)測的接口。對于需要 Agent 控制 GIMP、Blender、LibreOffice 等專業(yè)工具的團(tuán)隊(duì),這個(gè)項(xiàng)目直接把"Agent 手太短"的問題解決了,而且 100% 測試通過率意味著它不是個(gè) demo,是真能上生產(chǎn)環(huán)境的東西。
推薦:OpenCLI
https://opencli.info/
![]()
項(xiàng)目介紹
OpenCLI 把任何網(wǎng)站、Electron 桌面應(yīng)用、本地二進(jìn)制文件統(tǒng)一轉(zhuǎn)化為標(biāo)準(zhǔn)化 CLI。殺手級特性是瀏覽器 session 復(fù)用:通過 Chrome 擴(kuò)展橋接用戶已登錄的會(huì)話,不需要 API key 和 OAuth,登錄過就能用。架構(gòu)上雙引擎設(shè)計(jì)——YAML 聲明式管道處理簡單提取,TypeScript 適配器應(yīng)對復(fù)雜交互——已覆蓋 80+ 平臺(tái)。
團(tuán)隊(duì)背景
創(chuàng)始人 jackwener 是 Apache Arrow、DataFusion、Doris 的 PMC 成員,曾任職于字節(jié)跳動(dòng)等公司。GitHub 13,200+ 顆星。
為什么值得關(guān)注
瀏覽器 session 復(fù)用省掉了 API key 和 OAuth 兩個(gè)最大的摩擦點(diǎn),對需要 Agent 操控社交媒體、內(nèi)容平臺(tái)的團(tuán)隊(duì)來說是巨大的效率提升。
1
二、編排:讓多 Agent 像團(tuán)隊(duì)一樣協(xié)作
單個(gè) Agent 再強(qiáng),也只能干一個(gè)人的活。真正復(fù)雜的任務(wù)——比如"幫我調(diào)研一個(gè)行業(yè)、寫一份報(bào)告、找三個(gè)專家驗(yàn)證觀點(diǎn)"——需要多個(gè) Agent 像團(tuán)隊(duì)一樣分工、協(xié)作、匯總。編排層要解決的就是這個(gè)問題:誰負(fù)責(zé)什么、誰先誰后、中間狀態(tài)怎么傳遞、出了錯(cuò)怎么回滾。目前主流的兩種思路,一種是"像組織團(tuán)隊(duì)一樣直覺",另一種是"像畫流程圖一樣精確"。
推薦:LangGraph
langchain-ai/langgraph
項(xiàng)目介紹
LangGraph 用圖計(jì)算重寫了編排邏輯——節(jié)點(diǎn)代表 Agent 或函數(shù),邊定義數(shù)據(jù)流向和條件跳轉(zhuǎn),StateGraph 維護(hù)全局可持久化的狀態(tài)空間。提供的是低級原語,讓開發(fā)者精確控制每一步執(zhí)行,Agent 可以暫停、恢復(fù)、長期運(yùn)行,關(guān)鍵節(jié)點(diǎn)可插入人工審批。
團(tuán)隊(duì)背景
LangChain 團(tuán)隊(duì)開發(fā),GitHub 28,500 顆星,2025 年 9 月推出 1.0 Alpha。Klarna、Replit、Elastic 等已在生產(chǎn)環(huán)境使用。
為什么值得關(guān)注
核心優(yōu)勢是可控性——每個(gè)節(jié)點(diǎn)、每條邊、每次狀態(tài)變更都在開發(fā)者手里。學(xué)習(xí)曲線更陡,但換來的是生產(chǎn)環(huán)境里的可預(yù)測性。適合長期運(yùn)行的 Agent 和對可審計(jì)性有剛需的團(tuán)隊(duì)。
推薦:CrewAI
crewai.com
![]()
項(xiàng)目介紹
CrewAI 的核心概念就三個(gè):Agent(角色)、Crew(團(tuán)隊(duì))、Task(任務(wù))——定義幾個(gè)有專長的 AI 角色,組成團(tuán)隊(duì),分配任務(wù),像同事一樣協(xié)作。技術(shù)上獨(dú)立于 LangChain 從零構(gòu)建,QA 任務(wù)實(shí)測比 LangGraph 快 5.76 倍。雙模式架構(gòu):Crews 模式 Agent 自治決策,適合探索性任務(wù);Flows 模式事件驅(qū)動(dòng)精確控制,適合生產(chǎn)環(huán)境。
團(tuán)隊(duì)背景
創(chuàng)始人 Jo?o Moura 曾在 Clearbit 負(fù)責(zé) AI 工程,2024 年獲 1,800 萬美元融資(Insight Partners 等),GitHub 38,100 顆星,10 萬+認(rèn)證開發(fā)者。
為什么值得關(guān)注
概念最直覺、上手最快的多 Agent 框架。跟 LangGraph 是不同哲學(xué):CrewAI 適合"先跑起來再說",LangGraph 適合"每一步都要精確控制"。內(nèi)容生產(chǎn)流水線或快速原型落地的首選。
1
三、記憶層:讓 AI 擁有“記憶”
目前絕大多數(shù) AI 都是"金魚記憶"——對話結(jié)束,上下文清零,下次再來全得從頭說起。這在閑聊場景里還能忍,一旦 Agent 要做長周期任務(wù)(持續(xù)跟進(jìn)一個(gè)項(xiàng)目、記住用戶的偏好和歷史、在多次交互中積累認(rèn)知),沒有記憶就是致命短板。記憶層要解決的不只是"記住",還有"記住什么"、"怎么管理"、"壞了怎么辦"。這個(gè)賽道正在快速分化:有人做開源記憶SDK,有人做企業(yè)級記憶基礎(chǔ)設(shè)施。
推薦:Mem0
![]()
項(xiàng)目介紹
Mem0 在 AI 和用戶之間加了一層記憶基礎(chǔ)設(shè)施,讓 Agent 跨會(huì)話記住偏好、歷史和關(guān)鍵上下文。技術(shù)上用向量數(shù)據(jù)庫做語義檢索 + 圖數(shù)據(jù)庫做關(guān)系推理,配合自適應(yīng)衰減機(jī)制——重要記憶強(qiáng)化,過時(shí)記憶淡出。實(shí)測比 OpenAI 自帶記憶準(zhǔn)確率高 26%,響應(yīng)快 91%,Token 降低 90%。
團(tuán)隊(duì)背景
CTO Deshraj Yadav 曾是特斯拉 Autopilot AI 平臺(tái)負(fù)責(zé)人,YC S24 出身,累計(jì)融資 2,400 萬美元。GitHub 52,000+ 顆星,已集成 LangGraph、CrewAI 等主流框架。
為什么值得關(guān)注
記憶層賽道星數(shù)最高、集成最廣的開源項(xiàng)目,做個(gè)性化 AI 助手幾乎是必選項(xiàng)。跟 MemoryLake 不是競品——Mem0 是開源記憶 SDK,MemoryLake 是企業(yè)級記憶平臺(tái),不同切面。
推薦:MemoryLake
https://app.memorylake.ai
![]()
項(xiàng)目介紹
質(zhì)變科技打造的企業(yè)級多模態(tài) AI 記憶平臺(tái)(商業(yè)產(chǎn)品,非開源),定位獨(dú)立于模型廠商的中立記憶基礎(chǔ)設(shè)施。核心理念是從"數(shù)據(jù)中心"范式轉(zhuǎn)向"記憶中心"范式——處理的不是行為記錄,而是決策軌跡。2026 年 3 月發(fā)布"龍蝦版",推出"記憶護(hù)照"方案,讓 AI 記憶可以在不同平臺(tái)間無縫遷移。已在游戲 NPC 到企業(yè)決策等超大規(guī)模場景落地。
團(tuán)隊(duì)背景
創(chuàng)始人占超群曾任阿里云核心管理成員,從零搭建了國內(nèi)營收最高的云原生數(shù)倉體系。高瓴創(chuàng)投、光速光合數(shù)千萬美元融資,估值超2億美金。
為什么值得關(guān)注
"記憶護(hù)照"概念有前瞻性:AI 記憶不應(yīng)被鎖死在某個(gè)平臺(tái)里。團(tuán)隊(duì)有阿里云級別的基礎(chǔ)設(shè)施經(jīng)驗(yàn),這是把記憶系統(tǒng)做到企業(yè)級、大規(guī)模、可遷移的稀缺能力。
1
四、可觀測性:給 Agent 裝“監(jiān)控器”
LLM 應(yīng)用最讓人頭疼的事情之一是:出了問題,你根本不知道問題出在哪。模型幻覺了?工具調(diào)用失敗了?推理鏈在某一步走歪了?傳統(tǒng)軟件有完善的日志和調(diào)試工具,LLM 應(yīng)用到現(xiàn)在還在靠"看輸出猜哪里崩了"。可觀測性這一層就是要把黑箱打開——完整記錄 Agent 的每一步?jīng)Q策、每一次工具調(diào)用、每一輪推理,讓開發(fā)者能像調(diào)試代碼一樣調(diào)試 AI。
推薦:Opik
comet.com/opik
![]()
項(xiàng)目介紹
Opik 覆蓋 LLM 應(yīng)用從開發(fā)到生產(chǎn)的全生命周期。除了全鏈路追蹤和評估外,差異化賣點(diǎn)包括:內(nèi)置成本分析(按模型、用戶、會(huì)話維度拆賬),Pytest 集成支持 CI/CD 自動(dòng)化測試,Agent Optimizer 做性能調(diào)優(yōu),Guardrails 提供 PII 檢測和輸入輸出過濾。日均支撐 4,000 萬+ traces。
團(tuán)隊(duì)背景
出自 Comet ML(2017 年成立的 MLOps 公司),累計(jì)融資 7,000 萬美元。2024 年 9 月把七年 MLOps 經(jīng)驗(yàn)重構(gòu)為 Opik,GitHub 18,700 顆星。
為什么值得關(guān)注
最大差異化是成本核算:LLM 上規(guī)模后 Token 拆賬是剛需。七年 MLOps 積累帶來的企業(yè)級成熟度,比其他從零起步的項(xiàng)目更有機(jī)會(huì)。
推薦:Langfuse
langfuse.com
![]()
項(xiàng)目介紹
Langfuse 核心能力三塊:全鏈路追蹤(LLM 調(diào)用、工具調(diào)用、檢索一個(gè)不漏,多步推理圖形化展示)、Prompt 管理(版本控制、A/B 測試、不需要改代碼)、評估體系(LLM-as-Judge、人工標(biāo)注、實(shí)驗(yàn)管理)。全異步設(shè)計(jì),對生產(chǎn)性能幾乎零影響。
團(tuán)隊(duì)背景
YC W23 出身,2026 年 1 月被 ClickHouse 收購。GitHub 24,400 顆星,已集成 50 多個(gè)框架,支持云端和自托管兩種部署。
為什么值得關(guān)注
LLM 可觀測性領(lǐng)域的事實(shí)標(biāo)準(zhǔn)。被 ClickHouse 收購本身就是信號:可觀測性是 LLM 上生產(chǎn)的必備基礎(chǔ)設(shè)施。跟 Opik 的差異在于 Langfuse 更聚焦可觀測性單點(diǎn),Opik 覆蓋全生命周期。
1
五、安全防護(hù):給 Agent 裝“護(hù)欄”
Agent 越能干,風(fēng)險(xiǎn)越大。當(dāng) Agent 可以執(zhí)行代碼、調(diào)用 API、操控軟件、讀寫文件,它就不再只是一個(gè)"聊天機(jī)器人",而是一個(gè)有真實(shí)行動(dòng)能力的系統(tǒng)。技能投毒、記憶污染、提示詞注入、權(quán)限越界——這些不是假想的學(xué)術(shù)問題,而是已經(jīng)在生產(chǎn)環(huán)境中出現(xiàn)的真實(shí)威脅。安全防護(hù)這一層要做的,是在不削弱 Agent 能力的前提下,給它畫好邊界。
推薦:ClawAegis
項(xiàng)目介紹
首個(gè)針對 OpenClaw 的全生命周期安全防御系統(tǒng)。五層縱深防御:基礎(chǔ)掃描→輸入過濾→認(rèn)知狀態(tài)監(jiān)控→決策對齊→執(zhí)行權(quán)限控制。以插件形式部署,無需改框架代碼,支持 monitor 和 enforce 兩種模式。
團(tuán)隊(duì)背景
螞蟻集團(tuán) AI 安全實(shí)驗(yàn)室 × 清華大學(xué)聯(lián)合開發(fā),2026 年 4 月 2 日開源。團(tuán)隊(duì)此前已向 OpenClaw 提交 33 個(gè)安全漏洞(8 個(gè)已修復(fù)),有真實(shí)攻防實(shí)戰(zhàn)經(jīng)驗(yàn)。
為什么值得關(guān)注
Agent 安全賽道幾乎空白,ClawAegis 是為數(shù)不多的生產(chǎn)級方案。對生產(chǎn)環(huán)境跑 OpenClaw 的團(tuán)隊(duì)來說,這不是"好用"的問題,是"該不該裸奔"的問題。
1
六、網(wǎng)絡(luò)通信:讓 Agent 互聯(lián)
目前幾乎所有 Agent 都是孤島:各干各的,互相不知道對方的存在,更談不上信息共享和協(xié)作。但當(dāng) Agent 數(shù)量爆發(fā)之后,"Agent 之間怎么找到彼此、怎么交換信息"會(huì)變成一個(gè)真實(shí)的基礎(chǔ)設(shè)施需求,就像互聯(lián)網(wǎng)早期需要 DNS 和 TCP/IP 一樣。這一層還非常早期,但方向已經(jīng)有人在探了。
推薦:EigenFlux
https://www.eigenflux.ai/
項(xiàng)目介紹
EigenFlux 給 Agent 建了一個(gè)廣播網(wǎng)絡(luò)。基于發(fā)布-訂閱模式:Agent 向網(wǎng)絡(luò)廣播信息,其他 Agent 按畫像訂閱。內(nèi)置 AI 匹配引擎、Bloom Filter 去重、多級緩存,底層用 Go + CloudWeGo 微服務(wù)構(gòu)建,支持本地部署保證隱私。
團(tuán)隊(duì)背景
出自 Phronesis AI,據(jù)官方介紹,團(tuán)隊(duì)來自 MiniMax、Bytedance 和 Meta,除資深的 LLM 研究&訓(xùn)練和 Agent 工程背景外,團(tuán)隊(duì)成員還曾深度參與抖音 0-1,以及 Meta 社交網(wǎng)絡(luò)的部分工作
為什么值得關(guān)注
還很早期,但方向有想象空間:大多數(shù)框架在解決"單個(gè) Agent 怎么更強(qiáng)",EigenFlux 在解決"多個(gè) Agent 怎么聯(lián)網(wǎng)"。值得保持關(guān)注的早期賭注。
![]()
點(diǎn)個(gè)“愛心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.