![]()
作者 | 錢德新
近期,Agnes AI(https://agnes-ai.com)旗下文本模型Agnes-2.0-Flash、圖片模型 Agnes-Image-2.0-Flash 以及視頻模型Agnes-Video-2.0連續進入多個國際評測榜單。在行業開始重新評估“真實AI能力”的階段,這家公司正在試圖用另一種方式進入市場:不是只強調模型參數,而是同時推進榜單能力、低成本API和真實Agent場景落地。
其中,文本模型Agnes-2.0-Flash進入了Agent評測體系 Claw-Eval 前列。與傳統數學、知識問答或代碼類 Benchmark不同,Claw-Eval 更關注模型在真實Agent場景中的執行能力,包括工具調用、多步驟規劃、復雜任務拆解以及自動化工作流完成率等能力。這類評測也被很多開發者視為目前最接近真實AI Agent能力的一類Benchmark。
![]()
與此同時,圖片模型Agnes-Image-2.0-Flash進入了 Artificial Analysis Image Editing Leaderboard前列。這個榜單最大的特點在于采用真實用戶盲評機制,參與評測的用戶并不知道圖片對應的模型來源,只根據最終生成質量進行主觀選擇和打分。因此,相比傳統自動化評分體系,這類榜單通常被認為更接近真實用戶體驗。
![]()
除了文本與圖片模型外,視頻模型Agnes-Video-2.0也已經進入Artificial Analysis的 Image-to-Video(With Audio)榜單。
![]()
從目前行業情況來看,能夠同時覆蓋文本、圖片、視頻三大模態,并持續在國際評測中進入前列的AI Lab并不多。Agnes目前的策略也開始逐漸清晰:通過多模態模型能力建立認知,再通過低成本API和開發者生態擴大使用規模。
相比榜單,更值得關注的是Agnes目前公布的API定價。
根據官方信息,Agnes-2.0-Flash輸入價格為$0.03/1M Tokens,輸出價格為 $0.15/1M Tokens。這一定價已經明顯低于目前市場上不少主流模型(價格僅為Claude Opus4.6的0.6%)。
在過去一年,越來越多開發者開始發現,真正消耗Token的并不是簡單聊天,而是Agent 工作流。尤其是在Browser Agent、Coding Agent多工具調用以及長鏈路任務執行場景中,一個任務往往會產生大量上下文、搜索請求和工具調用。模型能力提升的同時,Token成本也開始快速增長。
很多AI創業團隊現在面臨的問題已經不再只是“模型夠不夠強”,而是“產品是否還能負擔長期調用成本”。
而Agnes這次的方向很明確:進一步降低開發者使用AI的門檻。
除了文本模型外,圖片模型Agnes-Image-2.0-Flash的價格同樣非常低。目前官方價格為 $3/1000張圖片。在電商圖生成、營銷素材、多版本廣告圖以及批量圖片編輯場景下,這一定價已經可以支持較大規模調用。
視頻模型Agnes-Video-V2.0的定價則為$0.30/分鐘,同樣顯著低于當前行業平均水平。在AI視頻生成仍然普遍面臨高推理成本的背景下,這一定價已經開始具備大規模內容生產與商業化落地的可能性。
與此同時,Agnes的宣傳方向也開始明顯從“模型打榜”轉向“真實案例”。
目前已有開發者開始基于Agnes搭建游戲Agent、網頁操作Agent和自動化工作流系統。例如游戲場景中的任務執行、UI操作、多步驟策略執行,以及Browser Agent 場景中的網頁導航、表單填寫、信息整理和自動搜索等。
![]()
本案例基于 Agnes Harness 架構
并搭載自研文本模型 Agnes-2.0-Flash 實現
這些場景對于模型的要求并不僅僅是回答問題,而是要求模型具備更穩定的上下文記憶能力、更準確的工具調用能力以及更強的長鏈路執行能力。
而在圖片編輯領域,Agnes-Image-2.0-Flash已經支持通過自然語言直接完成復雜編輯任務,包括背景替換、風格遷移、多圖融合、字體修改以及商品圖編輯等。
![]()
提取女性角色并將其放置在一個新的背景中
![]()
高密度信息圖
這種方向本質上正在把傳統復雜圖片編輯流程,逐漸變成“自然語言 + 圖片”的統一交互方式。
目前,三款模型均已正式上架官網(https://agnes-ai.com),開發者已經可以直接通過Agnes AI Platform 進行API調用。
當前行業一個越來越明顯的問題是:模型能力持續提升,但 AI 的使用成本也在同步提升。尤其是在Codex、Agent Workflow、多Agent系統以及Browser Use等場景中,大規模調用已經成為很多團隊最核心的成本壓力。
因此,越來越多AI公司開始重新競爭“推理成本”與“開發者生態”。
從目前公開路徑來看,Agnes的策略與過去一年部分頭部模型公司的增長路線已經有一定相似之處:先通過國際榜單建立模型認知,再通過低價格API快速擴大開發者使用規模,最終推動Agent與多模態生態落地。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.