網易首頁 > 網易號 > 正文申請入駐

后OpenClaw時代！國產Agent模型憑「高配低價」叫板Opus 4.6

2026-05-26 14:21:33　來源: 機器之心Pro

河北舉報

分享至

編輯｜+0、杜偉

今年最出圈的 AI 應用是什么？OpenClaw 一定是繞不開的答案。

回過頭看二三月份，「養蝦」一度成為流行的社交貨幣。但它的意義遠不止是一款爆款應用：OpenClaw 真正將智能體概念從開發者圈層推向了大眾視野，讓普通用戶第一次直觀感受到 Agent 到底能做什么。

當更多人開始理解 Agent 的價值之后，行業的焦點也自然進入到了下一階段：誰家的 Agent 做得更好、上手起來更容易以及更能負擔得起。這些才是決定 Agent 生態走向的關鍵變量。

誰能在這一節點完成轉型，就能在「后 OpenClaw 時代」搶占先機。事實上，國內已經有玩家率先落子。

就在今日，昆侖萬維旗下的天工 AI（Skywork）全新發布了 SkyClaw-v1.0 智能體模型，成為其長期深耕云端助理的又一里程碑，也開始了從助手形態向智能體基座模型的架構升級。

作為一款專為 OpenClaw、Claude Code、Hermes、Nanobot 等主流智能體框架深度優化的基座模型，SkyClaw-v1.0 模型在底層能力上實現了質的提升，工具調用精度更準、多輪任務執行更穩、長鏈路推理更優，能夠更好地適配真實場景中復雜、動態的智能體工作流。

與此同時，Skywork 還同步上線了 SkyClaw-v1.0-lite。這一輕量化版本瞄準了高頻調用和成本敏感場景，在保持核心智能體能力的同時，大幅優化了推理速度與資源開銷，為開發者提供了一個更靈活的部署選擇。

兩款模型在 X 上搶先亮相以來，熱度持續走高。

Nanobot 官方發文，「很高興能與 Skywork 攜手推出 SkyClaw-v1.0！期待看到各位開發者用它創造出無限可能。」

不少海外活躍 AI 博主對它評價頗高，「SkyClaw-v1.0 的訓練任務來源于用戶的實際操作場景，而不是通用的實驗室數據。它在基準測試上超越了 DeepSeek V4 Flash 等模型，穩定性經過了多次驗證。這才是打造真正能在實際場景中好用模型的方式。」

「基準測試之爭結束了。SkyClaw-v1.0 登場，干凈利落地贏下了所有。」

目前，SkyClaw-v1.0 兩款模型限時免費開放體驗，并已在 5 月 22 日接入到了 Skywork 平臺。

天工地址：tiangong.cn
SkyClaw-v1.0 項目地址：https://skyworkai.github.io/skyclaw/
apifree.ai API 地址：https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api

打出這三張牌

很難不選擇它

從產品層面來看，SkyClaw-v1.0 確實拿出了有說服力的東西，具體可以拆成三個維度來看：Agent 能力、使用門檻和性價比。

首先，Agent 能力要強

根據 Skywork 的官方結果，在主流智能體基準以及內部開發的 Claw 任務評估中，包括 PinchBench、Claw-Eval Pass^3 和 Skywork-Claw-Bench（基于 OpenClaw 構建的內部智能體評估套件），SkyClaw-v1.0 和 SkyClaw-v1.0-lite 的表現均優于 Minimax 2.7、DeepSeek V4 Flash 和 Qwen 3.6 35B A3B/27B 模型

另外，在 OpenClaw 相關任務上，SkyClaw-v1.0 的性能逼近更大規模的開閉源模型，包括 DeepSeek V4 Pro、Claude Opus 4.6 和 Qwen 3.6 Plus。

跑分亮眼之外，SkyClaw-v1.0 在實際應用場景中表現驚艷。

在交互式網頁與游戲生成方面，它能夠輸出功能齊全的網頁應用，從物理模擬到完整的游戲。結果不僅渲染正確、動畫流暢，用戶交互處理得也恰到好處。

賓果消消樂

在深度研究與數據可視化方面，SkyClaw-v1.0 展現出了超越單純代碼生成的綜合能力：它能夠自主研究現實世界課題，從多個來源收集并交叉驗證數據，最終將分析結果整合為交互式、達到出版級質量的儀表盤和報告。

可以說，SkyClaw-v1.0 不只是在評測榜單上跑出了好成績，也在真實場景中證明了自己作為生產力工具的實際價值。

其次，門檻要低

對于用戶來說，上手 SkyClaw-v1.0 幾乎沒有額外的學習成本，按需選擇使用渠道。在 Skywork 平臺，一鍵選擇模型即可使用。另外，通過 AI 模型聚合服務平臺 apifree.ai 注冊賬號并創建 APIKey，就能免費調用。

生態適配也很完善。Nanobot 已經率先完成對 SkyClaw-v1.0 的適配，后續還將上線 OpenRouter。隨著更多平臺的接入，開發者將能夠在自己熟悉的工具鏈中直接調用模型，無需重新搭建一套工作流。

在 nanobot 中，只需填入 API 密鑰即可使用 SkyClaw-v1.0。

最后，性價比要高

SkyClaw-v1.0 的定價顯著低于當前主流 Agent 模型。與 Minimax 2.7 和 Qwen 3.6 系列模型相比，定價僅為它們的一半甚至更低。

SkyClaw-v1.0 打出的這幾張牌，直指當前 Agent 模型市場的核心矛盾：性能強的用不起，用得起的不夠強，好用的生態封閉。它同時從能力、成本和易用性三個層面給出了一個相對均衡的解，這恰恰是當前市場最稀缺的選項。

一手實測

拿捏住了「快與準」

接下來，我們通過 Claude Code 來調用此次的 SkyClaw-v1.0，上手進行了一些測試。接入過程非常絲滑，配置好 API Key 就能直接跑。

先來做一個小游戲：貪吃蛇。

SkyClaw-v1.0 僅用時 33s 就完成了單文件網頁版的基礎開發，不僅包含了完整的游戲邏輯、計分系統，并且運行流暢。

再追加進階需求：「在游戲中增加隨機獎勵，吃到蛇身邊長三格」

依然非常快速，系統在普通食物的基礎上增加了一個有 25% 概率掉落的金色星星獎勵。

接下來，讓 SkyClaw-v1.0 把這個游戲打包成 Windows 桌面可獨立運行的 EXE 應用，并附帶要求：「色系改成多巴胺色」。這一階段的測試能夠很好地反映 Agent 在面對涉及環境依賴的復雜工程以及排錯時的真實能力。

在 UI 需求上，自主定義了包含 12 種高飽和色彩的 CSS 變量，落實了「多巴胺色系」的設計。

在打包環節，采用了 Electron 方案，完成了工程腳手架搭建及依賴安裝。

在異常處理方面，遇到報錯不陷入死循環，能讀懂報錯日志，并嘗試改變配置（從一個打包器換到另一個）來繞過環境限制。

接下來換一個真實辦公場景，這時需求不是單一格式的，這就考驗到了模型能不能同時輸出文檔、PPT 和視頻，以及執行任務過程中的全局規劃與跨格式協調能力。

這一次，我們直接在 Skywork 中調用 SkyClaw-v1.0，給它一個有難度的復合任務。

讓它「制作分別介紹地球四大洋的海底生態視頻（每個 10 秒），視頻生成后將其作為中間素材，構建一份全球海洋科普專題 PPT。要求將這 4 段視頻嵌入到對應的 PPT 頁面中，并在視頻旁配上基于視頻內容自動生成的專業解說詞。」

在整個執行鏈路中，模型需要先生成四段風格統一的視頻素材，再把視頻作為輸入反哺到 PPT 制作中，最后根據視頻內容自動撰寫解說詞。前后環環相扣，任何一步執行不到位可能都會導致最終結果不可用。

從結果來看，包括視頻生成質量、PPT 排版完成度以及解說詞與視頻畫面的匹配程度，SkyClaw-v1.0 都表現得面面俱到。

放上一段生成的「太平洋海底珊瑚生態」視頻，大家感受一下效果：

完整 PPT 效果如下：

兩個案例測下來，我們發現，從理解需求、調用工具、遇錯自修以及完整跑通多步驟任務等能力來看，SkyClaw-v1.0 以遠低于行業的價格，交付出了接近頂流的 Agent 體驗。

技術拆解

三步練出一個頂級 Agent

SkyClaw-v1.0 之所以能在評測與實戰中交出亮眼成績，離不開一套系統化的訓練流程。整個過程涵蓋環境構建、中期訓練與監督微調、強化學習三個階段，層層遞進，構成了一條完整的能力鏈路。

首先是搭建高質量的訓練環境

團隊構建了一個高復雜度的模擬 OpenClaw 環境，其中內置了豐富的高質量工具和技能，以供模型探索調用。

不僅如此，團隊還深入分析了真實用戶在類 OpenClaw 環境下的實際任務行為，并結合線上高頻技能的使用數據和反饋，梳理出工具之間的關系圖譜。基于這張圖譜，合成大量貼近真實用戶需求的復雜任務，確保模型從訓練階段就接觸到足夠真實與復雜的場景。

有了環境基礎，接下來是大規模的中期訓練與監督微調

依托上面經過充分驗證的訓練環境，團隊合成了海量高質量訓練數據。而為了把控數據質量，團隊建立了嚴格的過濾和評估機制，在考核最終答案正確性的同時，還會回溯評估模型完成任務的完整軌跡，確保解題過程本身也是合理高效的。

另外，團隊進行了大量數據配比實驗，找到智能體任務訓練數據的最優組合。

最后，團隊通過強化學習進一步打磨模型的泛化能力

由于自建的 OpenClaw 環境天然支持端到端的探索與反饋，模型能夠在其中進行充分的強化學習訓練。這一階段的核心目標，除了確保模型在特定任務上表現出色，其在不同智能體框架和陌生任務場景下也要保持穩定的泛化能力。

整體來看，SkyClaw-v1.0 采用的這套技術路徑，沒有依賴單點突破，而是圍繞「真實智能體場景下的可用性」這一目標，實現了數據、訓練與優化的貫通。

環境構建解決「用什么數據來練」，中期訓練和 SFT 解決「如何練出基礎能力」，強化學習解決「如何進一步提升性能上限和泛化性」。

如同此前所有 AI 熱點一樣，OpenClaw 經歷了正常的波動起伏。雖然熱度會消退，但趨勢不會。Agent 作為當前 AI 發展最重要的方向之一，其地位在短時間內不會改變。

上周的谷歌 I/O 大會是很好的例證，智能體成為貫穿全場的主角，Gemini Spark 的亮相更是直接對標 OpenClaw。這釋放出了一個清晰的信號：巨頭們正在加速 Agent 技術的消費級落地。

在這樣的行業背景下，「一個真正好用且用得起的 Agent」勢必將成為市場的香餑餑。但現實是，頂級 Agent 能力幾乎被海外御三家（Anthropic、OpenAI 和谷歌）的少數閉源模型壟斷，高昂的調用成本導致大量中小開發者和企業望而卻步。

換句話說，Agent 的瓶頸不在技術天花板，在于落地門檻。SkyClaw-v1.0 的發布，切中了這一痛點。

它以接近 Claude Opus 4.6 等閉源頂流的 Agent 性能，定價卻只有主流模型的一半。結果就是，一個此前因預算有限只能用輕量模型「湊合跑」的開發者，現在可以用同樣的成本調用到接近頂級水平的 Agent 能力。

回過頭看，此次新發布是昆侖萬維在 AI 領域長期布局的又一階段性成果。自 2022 年確立「All in AGI 與 AIGC」戰略以來，昆侖萬維基于自主研發的全球領先大模型基座，已構建起短劇和 A I 短劇平臺、AI 音樂、AI 游戲、AI SuperAgent、AI 社交五大核心產品矩陣。

其中在 Agent 領域，昆侖萬維在今年一、二月先后發布了 Skywork Super Agents Video v1.0、天工 Skywork 桌面版及 SkyClaw 云端智能體。桌面版實現全本地化運行，無需上傳數據即可處理多格式內容；SkyClaw 集成 70 余項技能，支持跨設備多端監控。

SkyClaw-v1.0 能夠做到高性能與低成本兼顧，與昆侖萬維在模型、應用和生態層面的長期積累密不可分。

當 Agent 賽道從狂歡期進入冷靜期，最后能留在牌桌上的，一定是把基本功做得最扎實的那一個。SkyClaw-v1.0 交出的這份答卷，正是昆侖萬維對這一判斷最有力的回應。

文中視頻鏈接：https://mp.weixin.qq.com/s/SSfxXcx8Sr0XQH04rcASrg

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.