![]()
編輯|+0、杜偉
今年最出圈的 AI 應用是什么?OpenClaw 一定是繞不開的答案。
回過頭看二三月份,「養蝦」一度成為流行的社交貨幣。但它的意義遠不止是一款爆款應用:OpenClaw 真正將智能體概念從開發者圈層推向了大眾視野,讓普通用戶第一次直觀感受到 Agent 到底能做什么。
當更多人開始理解 Agent 的價值之后,行業的焦點也自然進入到了下一階段:誰家的 Agent 做得更好、上手起來更容易以及更能負擔得起。這些才是決定 Agent 生態走向的關鍵變量。
誰能在這一節點完成轉型,就能在「后 OpenClaw 時代」搶占先機。事實上,國內已經有玩家率先落子。
就在今日,昆侖萬維旗下的天工 AI(Skywork)全新發布了 SkyClaw-v1.0 智能體模型,成為其長期深耕云端助理的又一里程碑,也開始了從助手形態向智能體基座模型的架構升級。
作為一款專為 OpenClaw、Claude Code、Hermes、Nanobot 等主流智能體框架深度優化的基座模型,SkyClaw-v1.0 模型在底層能力上實現了質的提升,工具調用精度更準、多輪任務執行更穩、長鏈路推理更優,能夠更好地適配真實場景中復雜、動態的智能體工作流。
與此同時,Skywork 還同步上線了 SkyClaw-v1.0-lite。這一輕量化版本瞄準了高頻調用和成本敏感場景,在保持核心智能體能力的同時,大幅優化了推理速度與資源開銷,為開發者提供了一個更靈活的部署選擇。
兩款模型在 X 上搶先亮相以來,熱度持續走高。
![]()
Nanobot 官方發文,「很高興能與 Skywork 攜手推出 SkyClaw-v1.0!期待看到各位開發者用它創造出無限可能。」
![]()
不少海外活躍 AI 博主對它評價頗高,「SkyClaw-v1.0 的訓練任務來源于用戶的實際操作場景,而不是通用的實驗室數據。它在基準測試上超越了 DeepSeek V4 Flash 等模型,穩定性經過了多次驗證。這才是打造真正能在實際場景中好用模型的方式。」
![]()
「基準測試之爭結束了。SkyClaw-v1.0 登場,干凈利落地贏下了所有。」
![]()
目前,SkyClaw-v1.0 兩款模型限時免費開放體驗,并已在 5 月 22 日接入到了 Skywork 平臺。
![]()
- 天工地址:tiangong.cn
- SkyClaw-v1.0 項目地址:https://skyworkai.github.io/skyclaw/
- apifree.ai API 地址:https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api
打出這三張牌
很難不選擇它
從產品層面來看,SkyClaw-v1.0 確實拿出了有說服力的東西,具體可以拆成三個維度來看:Agent 能力、使用門檻和性價比。
首先,Agent 能力要強
根據 Skywork 的官方結果,在主流智能體基準以及內部開發的 Claw 任務評估中,包括 PinchBench、Claw-Eval Pass^3 和 Skywork-Claw-Bench(基于 OpenClaw 構建的內部智能體評估套件),SkyClaw-v1.0 和 SkyClaw-v1.0-lite 的表現均優于 Minimax 2.7、DeepSeek V4 Flash 和 Qwen 3.6 35B A3B/27B 模型
另外,在 OpenClaw 相關任務上,SkyClaw-v1.0 的性能逼近更大規模的開閉源模型,包括 DeepSeek V4 Pro、Claude Opus 4.6 和 Qwen 3.6 Plus。
![]()
跑分亮眼之外,SkyClaw-v1.0 在實際應用場景中表現驚艷。
在交互式網頁與游戲生成方面,它能夠輸出功能齊全的網頁應用,從物理模擬到完整的游戲。結果不僅渲染正確、動畫流暢,用戶交互處理得也恰到好處。
![]()
賓果消消樂
在深度研究與數據可視化方面,SkyClaw-v1.0 展現出了超越單純代碼生成的綜合能力:它能夠自主研究現實世界課題,從多個來源收集并交叉驗證數據,最終將分析結果整合為交互式、達到出版級質量的儀表盤和報告。
可以說,SkyClaw-v1.0 不只是在評測榜單上跑出了好成績,也在真實場景中證明了自己作為生產力工具的實際價值。
其次,門檻要低
對于用戶來說,上手 SkyClaw-v1.0 幾乎沒有額外的學習成本,按需選擇使用渠道。在 Skywork 平臺,一鍵選擇模型即可使用。另外,通過 AI 模型聚合服務平臺 apifree.ai 注冊賬號并創建 APIKey,就能免費調用。
生態適配也很完善。Nanobot 已經率先完成對 SkyClaw-v1.0 的適配,后續還將上線 OpenRouter。隨著更多平臺的接入,開發者將能夠在自己熟悉的工具鏈中直接調用模型,無需重新搭建一套工作流。
![]()
在 nanobot 中,只需填入 API 密鑰即可使用 SkyClaw-v1.0。
最后,性價比要高
SkyClaw-v1.0 的定價顯著低于當前主流 Agent 模型。與 Minimax 2.7 和 Qwen 3.6 系列模型相比,定價僅為它們的一半甚至更低。
![]()
SkyClaw-v1.0 打出的這幾張牌,直指當前 Agent 模型市場的核心矛盾:性能強的用不起,用得起的不夠強,好用的生態封閉。它同時從能力、成本和易用性三個層面給出了一個相對均衡的解,這恰恰是當前市場最稀缺的選項。
一手實測
拿捏住了「快與準」
接下來,我們通過 Claude Code 來調用此次的 SkyClaw-v1.0,上手進行了一些測試。接入過程非常絲滑,配置好 API Key 就能直接跑。
先來做一個小游戲:貪吃蛇。
![]()
SkyClaw-v1.0 僅用時 33s 就完成了單文件網頁版的基礎開發,不僅包含了完整的游戲邏輯、計分系統,并且運行流暢。
![]()
再追加進階需求:「在游戲中增加隨機獎勵,吃到蛇身邊長三格」
![]()
依然非常快速,系統在普通食物的基礎上增加了一個有 25% 概率掉落的金色星星獎勵。
接下來,讓 SkyClaw-v1.0 把這個游戲打包成 Windows 桌面可獨立運行的 EXE 應用,并附帶要求:「色系改成多巴胺色」。這一階段的測試能夠很好地反映 Agent 在面對涉及環境依賴的復雜工程以及排錯時的真實能力。
在 UI 需求上,自主定義了包含 12 種高飽和色彩的 CSS 變量,落實了「多巴胺色系」的設計。
在打包環節,采用了 Electron 方案,完成了工程腳手架搭建及依賴安裝。
在異常處理方面,遇到報錯不陷入死循環,能讀懂報錯日志,并嘗試改變配置(從一個打包器換到另一個)來繞過環境限制。
![]()
接下來換一個真實辦公場景,這時需求不是單一格式的,這就考驗到了模型能不能同時輸出文檔、PPT 和視頻,以及執行任務過程中的全局規劃與跨格式協調能力。
這一次,我們直接在 Skywork 中調用 SkyClaw-v1.0,給它一個有難度的復合任務。
讓它「制作分別介紹地球四大洋的海底生態視頻(每個 10 秒),視頻生成后將其作為中間素材,構建一份全球海洋科普專題 PPT。要求將這 4 段視頻嵌入到對應的 PPT 頁面中,并在視頻旁配上基于視頻內容自動生成的專業解說詞。」
在整個執行鏈路中,模型需要先生成四段風格統一的視頻素材,再把視頻作為輸入反哺到 PPT 制作中,最后根據視頻內容自動撰寫解說詞。前后環環相扣,任何一步執行不到位可能都會導致最終結果不可用。
![]()
從結果來看,包括視頻生成質量、PPT 排版完成度以及解說詞與視頻畫面的匹配程度,SkyClaw-v1.0 都表現得面面俱到。
放上一段生成的「太平洋海底珊瑚生態」視頻,大家感受一下效果:
![]()
完整 PPT 效果如下:
![]()
兩個案例測下來,我們發現,從理解需求、調用工具、遇錯自修以及完整跑通多步驟任務等能力來看,SkyClaw-v1.0 以遠低于行業的價格,交付出了接近頂流的 Agent 體驗。
技術拆解
三步練出一個頂級 Agent
SkyClaw-v1.0 之所以能在評測與實戰中交出亮眼成績,離不開一套系統化的訓練流程。整個過程涵蓋環境構建、中期訓練與監督微調、強化學習三個階段,層層遞進,構成了一條完整的能力鏈路。
首先是搭建高質量的訓練環境
團隊構建了一個高復雜度的模擬 OpenClaw 環境,其中內置了豐富的高質量工具和技能,以供模型探索調用。
不僅如此,團隊還深入分析了真實用戶在類 OpenClaw 環境下的實際任務行為,并結合線上高頻技能的使用數據和反饋,梳理出工具之間的關系圖譜。基于這張圖譜,合成大量貼近真實用戶需求的復雜任務,確保模型從訓練階段就接觸到足夠真實與復雜的場景。
有了環境基礎,接下來是大規模的中期訓練與監督微調
依托上面經過充分驗證的訓練環境,團隊合成了海量高質量訓練數據。而為了把控數據質量,團隊建立了嚴格的過濾和評估機制,在考核最終答案正確性的同時,還會回溯評估模型完成任務的完整軌跡,確保解題過程本身也是合理高效的。
另外,團隊進行了大量數據配比實驗,找到智能體任務訓練數據的最優組合。
最后,團隊通過強化學習進一步打磨模型的泛化能力
由于自建的 OpenClaw 環境天然支持端到端的探索與反饋,模型能夠在其中進行充分的強化學習訓練。這一階段的核心目標,除了確保模型在特定任務上表現出色,其在不同智能體框架和陌生任務場景下也要保持穩定的泛化能力。
整體來看,SkyClaw-v1.0 采用的這套技術路徑,沒有依賴單點突破,而是圍繞「真實智能體場景下的可用性」這一目標,實現了數據、訓練與優化的貫通。
環境構建解決「用什么數據來練」,中期訓練和 SFT 解決「如何練出基礎能力」,強化學習解決「如何進一步提升性能上限和泛化性」。
如同此前所有 AI 熱點一樣,OpenClaw 經歷了正常的波動起伏。雖然熱度會消退,但趨勢不會。Agent 作為當前 AI 發展最重要的方向之一,其地位在短時間內不會改變。
上周的谷歌 I/O 大會是很好的例證,智能體成為貫穿全場的主角,Gemini Spark 的亮相更是直接對標 OpenClaw。這釋放出了一個清晰的信號:巨頭們正在加速 Agent 技術的消費級落地。
在這樣的行業背景下,「一個真正好用且用得起的 Agent」勢必將成為市場的香餑餑。但現實是,頂級 Agent 能力幾乎被海外御三家(Anthropic、OpenAI 和谷歌)的少數閉源模型壟斷,高昂的調用成本導致大量中小開發者和企業望而卻步。
換句話說,Agent 的瓶頸不在技術天花板,在于落地門檻。SkyClaw-v1.0 的發布,切中了這一痛點。
它以接近 Claude Opus 4.6 等閉源頂流的 Agent 性能,定價卻只有主流模型的一半。結果就是,一個此前因預算有限只能用輕量模型「湊合跑」的開發者,現在可以用同樣的成本調用到接近頂級水平的 Agent 能力。
回過頭看,此次新發布是昆侖萬維在 AI 領域長期布局的又一階段性成果。自 2022 年確立「All in AGI 與 AIGC」戰略以來,昆侖萬維基于自主研發的全球領先大模型基座,已構建起短劇和 A I 短劇平臺、AI 音樂、AI 游戲、AI SuperAgent、AI 社交五大核心產品矩陣。
其中在 Agent 領域,昆侖萬維在今年一、二月先后發布了 Skywork Super Agents Video v1.0、天工 Skywork 桌面版及 SkyClaw 云端智能體。桌面版實現全本地化運行,無需上傳數據即可處理多格式內容;SkyClaw 集成 70 余項技能,支持跨設備多端監控。
SkyClaw-v1.0 能夠做到高性能與低成本兼顧,與昆侖萬維在模型、應用和生態層面的長期積累密不可分。
當 Agent 賽道從狂歡期進入冷靜期,最后能留在牌桌上的,一定是把基本功做得最扎實的那一個。SkyClaw-v1.0 交出的這份答卷,正是昆侖萬維對這一判斷最有力的回應。
文中視頻鏈接:https://mp.weixin.qq.com/s/SSfxXcx8Sr0XQH04rcASrg
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.