![]()
新智元報道
![]()
【新智元導讀】4個月燒光全年AI預算,天價Token賬單正在屠殺硅谷!今天,高性能Agent模型SkyClaw-v1.0出世,性能直逼Opus 4.6、DeepSeek V4 Pro,百萬上下文性價比拉滿。
鐵打的Token,流水的賬單!
在這場狂飆的AI浪潮中,有一個真相正在被嚴重低估——
Token,已經成為AI時代的「電力消耗」。
一份最新報告顯示,從2022年-2026年,短短四年的時間,Token處理量暴增17000倍。
如今,這種驚人的Token消耗,正讓企業賬單變得不堪重負。
![]()
即便是「財大氣粗」的微軟也直呼吃不消,干脆砍掉了Claude Code授權許可。
![]()
Uber的燒錢速度,更是令人震驚。
CTO Praveen Neppalli在內部備忘錄中直言,「僅僅四個月,5000名工程師花光了整個2026年的AI預算」。
不僅如此,AI獨角獸Harvey曬出的一張數據圖,徹底將這種「焦慮」具象化:
公司2026年月度Token消耗量,從1T向12T一路狂奔。
![]()
毫無疑問,Token已然成為AI時代最昂貴的「電力」。
Token
是AI時代的「電力消耗」
這件事的邏輯,其實很簡單。
過去兩年,大模型賽道瘋狂內卷參數、榜單排名,全行業都在比拼誰的「大腦」更聰明。
2026年,AI Agent迎來了真正爆發的元年。
從Claude Code到OpenClaw,各種明星級Agent如雨后春筍般涌現。
當它們真正進入「企業級生產流程」,每天需進行高頻的工具調用、數十輪復雜推理,甚至跑通一整條業務閉環時,一個最現實的拷問冒了出來——
你燒得起這個Token嗎?
![]()
普通人用AI聊聊天,一個月消耗百萬級Token。
而那些真正用AI做項目的重度開發者,月消耗量是大多數人的數千倍,甚至是數萬倍。
就比如,Meta在內部搞了一個「claudeonomics」排行榜,有員工一個月直接干掉了超2100億Token。
谷歌I/O大會上,CEO劈柴透露了幾個令人瞠目結舌的數字:
「今天,谷歌每個月的Token處理量,飆升到了3200萬億。2024年,9.7萬億;2025年,480萬億」。
![]()
Tokenmaxxing,成為了當下最熱詞。
工業時代,電力成本決定了工廠開在哪、產能做到多大、利潤空間有多厚。
AI時代,Token消耗量決定了企業的Agent能跑多復雜的任務、能服務多大規模的用戶、能不能從「技術驗證」邁進「商業閉環」。
對Token成本的駕馭能力,正在加速企業間的分化與洗牌。
敏銳的先行者已然察覺——
在Token經濟時代,尋找更具性價比的Agent模型,絕非單純的降本增效,而是一項決勝未來的核心戰略。
換句話說,人和人之間的生產力差距,正在被Token消耗量撕裂。
SkyClaw來了
百萬上下文+超低成本
洞察到這一結構性需求后,昆侖萬維給出了一種破局之法。
今天,高性能Agent模型SkyClaw-v1.0正式發布。同步上線的,還有輕量化版本SkyClaw-v1.0-lite。
SkyClaw主打一個:頂級Agent能力+極致性價比+低門檻落地「三位一體」。
多項測試中,SkyClaw-v1.0性能超越Minimax 2.7、DeepSeek V4 Flash等多款主流開源模型,逼近DeepSeek V4 Pro、Claude Opus 4.6、Qwen 3.6 Plus等閉源頂流。
![]()
性能拉滿的同時,SkyClaw-v1.0在定價上給了行業一個意外:
價格低至行業主流的一半,甚至更低。
相較于DeepSeek V4 Pro,SkyClaw-v1.0輸入成本僅為其1/24,輸出價格僅1/6。
![]()
另外,目前公認的在復雜邏輯、Agent 編排和代碼生成上「智商與價格平衡得最好」的模型是Sonnet 4.6 。
SkyClaw-v1.0的輸入價格只有Sonnet 4.6的約1/43,輸出價格只有其約1/27。
更不用提,SkyClaw-v1.0-lite的價格優勢更加明顯。
![]()
更重要的是,限時免費開放體驗。
這一次,「高性能Agent」和「低成本落地」之間的墻,被正式推倒了。
一手實測來了
再好的評測數據,也不如真實Demo有說服力。
為了榨出SkyClaw-v1.0的最大能力,我們把它裝進了最近最火的Hermes Agent里進行實測。
![]()
一份深度研報,全流程AI包圓
如今,AI編程工具五花八門,各有千秋。
幾個月前,Claude Code還是大多數開發者首選。而現在,OpenAI Codex勢頭猛超CC。
![]()
對于一位企業決策者而言,若要挑選出最契合自身業務的利器,還需全面掌握當前的市場競爭格局。
但現實情況是,想要做一份嚴謹的工具選型調研,實在是一件「脫層皮」的苦差事。
你需要挨個去查閱技術文檔,梳理出一堆繁雜的指標。
而且,純靠人工去搜集、對比數據,不僅耗時耗力,而且極易滯后。
![]()
既然是評估AI工具,為什么不用AI來代勞?
接下來,直接呼叫「超級外腦」——接入Hermes Agent的SkyClaw-v1.0。
![]()
給到一段提示,SkyClaw-v1.0憑借其強大數據整合能力,自動游走于各大官網、各大技術社區、評測榜單之間。
最終,它生成了一份深度、客觀、多維度的《2026年AI編程工具全景競品分析報告》。
![]()
可以看到,AI輸出了一份深度的、直觀的HTML商業洞察。
從產品能力到定價策略,再到用戶口碑和企業級適用性,多維橫評一應俱全。
特別是,文末提煉的核心結論與行動指南,直接把復雜問題極簡化,一針見血,干脆利落。
![]()
為了更直觀了解三款工具的能力,還可以讓SkyClaw-v1.0生成可視化的圖表。
![]()
而且,它直接畫出了決策流程圖,再復雜的邏輯也是瞬間就理順了。
![]()
有了全面了解之后,接下來還需要向上級匯報,做PPT才是真正的「重頭戲」。
現在,可以把這活兒直接「甩」給性價比超高的SkyClaw-v1.0。
只需簡單交代幾句需求,下樓去買杯咖啡。
等再回到工位的時候,一份排版精美、內容完整的PPT,已經「躺在」個人文件夾里了。
![]()
![]()
最后一步,讓AI順手生成一個執行方案,以及審批郵件。
![]()
從拋出「該選什么工具」,到把「請BOSS簽字」的方案擺上桌面——
過去,這需要數人耗費1周調研,再熬2天打磨PPT。現在,只需1個人 + 1個Agent,一小時內高質量交付。
劃重點,接入SkyClaw-v1.0的Agent,真正將「超高效率」與「極致性價比」一次拉滿!
一鍵生成PPT,打工人救星
借著剛剛SkyClaw-v1.0做PPT的實操案例,真的「墻裂」推薦它做PPT的超凡能力。
不如現在,再來看個硬核測試——
假設要為大家做一場讀書分享會,需要準備一份PPT,主題是「從《百年孤獨》看魔幻現實主義的敘事密碼」。
![]()
放在以前,光是全網搜羅高顏值模板、查閱各種文學賞析資料、梳理大綱,可能就得熬幾個大夜。
但現在,這些活兒AI已經可以全盤接管!
輸入一段的提示詞,接下來,就讓接入Hermes的 SkyClaw-v1.0一鍵執行。
![]()
不一會兒功夫,AI直接把一份精美的PPT存進了文件夾。打開成品的瞬間,瞬間被震撼到了。
這個視覺風格,精準捕捉到了我想要的「拉美魔幻感」,神秘、復古又有文學厚度。
更令人拍案叫絕的,它生成的這套內容脈絡,堪稱大師級的策劃大綱。
![]()
前半部分,它深度剖析了拉美「文學爆炸」的浪潮,以及馬爾克斯的記者生涯,是如何為其獨特的敘事風格注入靈魂的。
下面這一頁的視覺解構,非常重要。
原著中,最讓人頭疼的「布恩迪亞家族七代人百年族譜」,AI用極具視覺沖擊力的時間線理清了。
![]()
最值得一提的,在收尾部分,它還為這場讀書會量身定制了3個極具延展性的開放式問題。
![]()
從引人入勝的開場,到硬核的結構拆解,再到升華主題的互動收尾,AI真的在「策劃」一場高質量的活動。
毫無疑問,SkyClaw的PPT生成能力堪稱頂尖。
而這份驚艷的背后,離不開去年5月火爆出圈的Skywork Super Agents的強大技術支撐。
正是海量的高質量PPT數據與專項模型訓練,造就了這一核心能力。
經過無數次高頻實測驗證:它生成的PPT質量高,懂邏輯、懂排版,是一款不可多得的辦公利器。
手搓超級App,小紅書也能復刻
簡單一句話,讓它做一個小紅書App出來。
創建一個小紅書風格的社交應用網頁,包含雙列瀑布流圖文筆記信息流、發現/探索頁、點贊收藏交互,以及個人主頁(含已發布和已收藏筆記)。
![]()
不得不說,接了SkyClaw-v1.0的Hermes寫代碼是真快,簡直就是往外「噴射」代碼一樣。
如果對生成效果不滿意,可以直接對話修改。
經過幾輪修改完善后,最終得到了這個小紅書App網頁。
一句prompt扔進去,直接「吐」出一個高仿小紅書——雙列瀑布流、推薦/關注/附近三個Tab、底部導航欄、點贊數、用戶頭像,連那個標志性的紅色「+」發布按鈕都沒落下。
說實話,要不是少了開屏廣告,我差點以為手機自己偷偷下載了小紅書。放在以前壓根不敢想象。
![]()
一句話,直出中國象棋游戲
創建一個中國象棋網頁游戲,包含傳統木質棋盤、紅黑雙方漢字棋子、人機對戰模式、合法落子高亮提示和回合制邏輯。
我們讓它做一個比較難點的游戲——中國象棋,可以對弈的那種。
![]()
一句prompt扔過去,等幾分鐘SkyClaw直接搓出了一個完整的中國象棋,一次完成——
木紋棋盤、楚河漢界、紅黑雙方漢字棋子全到位,點擊棋子還有綠色落點提示、吃子紅圈高亮。
最夸張的是,游戲還內置了一個AI對手,這你受得了嗎——不是擺著看的棋盤,是真能跟你殺幾盤的。
還貼心地加了悔棋按鈕,畢竟被AI將死了總得給人留點面子。
![]()
簡易上手
即日起,SkyClaw-v1.0及SkyClaw-v1.0-lite,將開放2-4周免費試用。
目前,SkyClaw-v1.0通過apifree.ai提供OpenAI兼容API接口。
免費注冊apifree賬號,拿到API Key就能開始調用,支持流式輸出、工具調用、多輪對話等核心功能。
![]()
API文檔(兼容OpenAI接口,快速調用):
SkyClaw-v1:https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api
SkyClaw-v1.0-lite:https://www.apifree.ai/model/skywork-ai/skyclaw-v1-lite?tab=api
技術殺手锏:
三階段訓練,為Agent原生打造
不論在基準測試,還是demo實測中,SkyClaw-v1.0展現出的硬核實力并非偶然。
其背后是一套扎實的三階段訓練體系,從底層訓練伊始,它便精準錨定了「Agent原生場景」。
![]()
第一階段:環境構建,讓模型在「真實世界」里學干活
SkyClaw的訓練并非依賴靜態的數據集,而是構建了一個高質量、高復雜度的OpenClaw模擬環境。
在這個環境中,團隊配置了大量高頻使用的工具和技能,讓模型自主探索和調用。
更關鍵的一步是:研發團隊深入分析了真實用戶在OpenClaw類環境中的任務分布,結合線上高頻技能的使用統計和反饋,構建了一張工具關系圖譜。
基于這張圖譜,他們合成了更貼近真實用戶需求的復雜任務。
這意味著SkyClaw見過的訓練數據不是「理想化的教科書」,而是「開發者每天真正會遇到的麻煩事」。
第二階段:Mid-Training+SFT,不只看結果,更看過程
在高質量的OpenClaw模擬環境基礎上,團隊為Mid-Training和SFT合成了大量訓練數據。
但SkyClaw的數據篩選機制有一個獨特之處:
不僅評估最終答案的正確性,還評估整個任務解決過程中軌跡的質量。
簡單來說,一個模型即使最終給出了正確結果,如果中間步驟「繞了遠路」或「碰了運氣」,在SkyClaw的訓練體系里也會被判定為低質量樣本。
這種嚴格的軌跡質量評估,確保模型學到的是「高效正確的做事方法」,而非「蒙對答案的僥幸路徑」。
此外,團隊還進行了大量數據配比實驗,精心確定Agent任務訓練數據的最優組合方式。
第三階段:強化學習,在真實環境中越練越強
最后一步是,端到端的Agent強化學習(RL)訓練。
SkyClaw自建的OpenClaw環境天然支持探索和強化學習。通過端到端的Agent強化學習訓練,模型在通用Agent任務上的泛化能力和穩定性得到了進一步提升。
這三個階段層層遞進,最終鍛造出一個「為Agent而生」的模型。
這套訓練方法論不僅顯著提升了模型在OpenClaw環境下主流任務中的表現,也增強了其在Hermes、Nanobot等不同Agent框架下的通用任務泛化能力。
換句話說,不是只在一個環境里跑分好看,而是換個賽道依然能打。
不止v1.0,還推出了輕量版lite
除了SkyClaw-v1.0這個「旗艦版」,昆侖萬維天工AI同步推出了SkyClaw-v1.0-lite。
這是一款速度更快、成本更低的模型,但依然繼承了強大的Agent能力,性能優于Minimax 2.7。
這意味著,即便是對成本極度敏感的基礎Agent任務場景,開發者也不用在「能力」和「預算」之間做痛苦的取舍。
lite版就能覆蓋大多數日常Agent需求,而成本只是主流模型的零頭。
這種「旗艦+輕量」的雙版本策略,實際上對應了Agent應用落地中兩種典型需求:
旗艦版SkyClaw-v1.0:面向企業級復雜任務,多步驟規劃、復雜工具鏈調用、長上下文多輪交互。適用于需要最高可靠性和執行準確率的場景。
輕量版SkyClaw-v1.0-lite:面向開發者的輕量化場景,日常Agent輔助、簡單工具調用、快速迭代,多次反復試錯。速度快、成本低,非常適合產品早期驗證和中小團隊日常使用。
兩個版本覆蓋了從「重型任務」到「輕量助手」的完整光譜。
Agent模型,不該是奢侈品
回看過去一年,AI Agent從概念走向現實的速度,遠超所有人預期。
但一個尷尬的現實是:最好用的Agent模型往往也是最貴的,而大多數開發者和中小企業,根本燒不起這個錢。
回到開頭那個判斷,Token就是「電力消耗」。
當Agent成為企業標配,當Token消耗躍升到生產級,誰能在保障性能的前提下,將Token成本打到極致,誰就能在這場新基建競賽中占據先機。
聰明的企業和開發者,已經學會用性價比思維,重新審視自己的AI基礎設施選型。
但長期以來,「好用」和「便宜」似乎總是一對矛盾體。
SkyClaw-v1.0的出現,某種程度上回答了一個行業級的問題:高性能Agent能力和低成本落地,真的不是非此即彼的關系。
性能超越Minimax 2.7、DeepSeek V4 Flash等主流開源模型,逼近DeepSeek V4 Pro、Claude Opus 4.6等更大規模旗艦模型——這是實力;
定價只有行業主流的一半甚至更低,限時免費開放——這是誠意。
昆侖萬維還透露,免費體驗期結束后,將逐步開源SkyClaw各版本模型。
未來開發者不僅能用得起,還能拿到源碼自己改、自己部署。
昆侖萬維在這個方向上的布局并非偶然。
從開源2000億稀疏大模型Skywork-MoE,到開源Deep Research Agent框架,再到今天發布SkyClaw-v1.0——
這家公司一直在用實際行動推動AI技術的普惠化,讓開源生態真正惠及每一個開發者。
今年3月,昆侖萬維正式發布2026 AGI戰略,全新升級「4+3戰略」,目標是通過打造AI經濟平臺,賦予每一個創作者匹敵一家公司的全棧生產力。
昆侖萬維董事長兼CEO方漢曾直言,「每月花100元訂閱AI就像交水電費,至少花100元在Token上才不會掉隊」。
這句話背后的邏輯,正是昆侖萬維的產品哲學。
伴隨「一人公司」成為時代趨勢,AGI不再是哲學命題,而是經濟學命題;而經濟學命題的核心,永遠是成本效率。
在這個愿景下,SkyClaw-v1.0的意義已經超越了一款Agent模型本身。
它是昆侖萬維服務千萬「超級個體」、構建AGI時代產業新繁榮的又一塊關鍵拼圖。
當每一個獨立開發者、每一家創業公司都能以極低的成本獲得頂級Agent能力,AI智能體的全民化時代,才真正到來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.