過去一年,大模型應用的開發門檻其實在同時變高和變低。
變低的是,開發者已經可以很快調用模型 API,做一個聊天助手、文檔總結工具、圖片生成 Demo,甚至搭一個簡單 Agent。變高的是,一旦項目進入真實工作流,就會遇到更具體的問題:上下文不夠長、Agent 多輪調用太消耗 token、圖片分辨率不夠用于海報和電商圖、文本、圖片、視頻能力分散在不同工具里,接入和試錯成本都不低。
這也是 Agnes AI 本次免費模型升級值得關注的地方。
從 6 月 1 日開始免費開放后,Agnes AI 的全模態模型傳播速度很快。文本模型支持 1M 上下文,圖片模型支持 4K 輸出,并繼續覆蓋圖片生成、編輯和視覺資產生產場景,目前已灰度上線,同時繼續提供文本、圖片、視頻全模態能力。對開發者來說,這次升級的重點不只是“免費”,而是這些能力是否能被接入到真實項目和日常開發工具鏈里。1M 上下文和 4K 圖片能力不是一次性同時放開,而是從今天開始分批開放,預計會在接下來幾天逐步覆蓋到全部用戶。短期內如果暫時不可用,屬于灰度過程中的正常情況。
官方 API 平臺地址:https://platform.agnes-ai.com/
先看一組官方披露的數據。Agnes AI 在 LinkedIn 上同步,Agnes 2.0 omni-model series 免費開放一周后已經達到一個重要里程碑:
- Agnes-2.0-Flash 調用 / 處理量超過 1T tokens;
- Agnes-Image-2.1-Flash 生成超過 200 萬張圖片;
- Agnes-Video-V2.0 生成超過 200 萬秒視頻。
![]()
LinkedIn 官方首周數據截圖
這個數據挺關鍵。因為它說明一件事,免費不是一個單純的營銷動作。真正有價值的是,當文本、圖片、視頻這三類能力都被放到一個開發者可以調用的平臺里,使用會很快從“試試看”變成“拿來做東西”。1T 級別的文本處理、百萬級圖片生成、百萬秒級視頻生成,背后對應的是開發者、創作者和團隊在真實工作流里不斷試錯。
所以這篇文章不只是聊參數,也想聊一下,這些參數放到開發場景里到底能干什么?
Agnes AI 的全模態模型矩陣
從開發者使用角度看,Agnes AI 這次免費開放的能力可以簡單分成三類。
文本模型是 Agnes-2.0-Flash,適合長文檔處理、知識問答、代碼生成、Agent 任務規劃、工具調用和前端 Demo 原型生成。圖片模型是 Agnes-Image-2.1-Flash,適合海報、電商圖、社媒封面、產品宣傳圖和原創 IP 視覺資產。視頻模型是 Agnes-Video-V2.0,適合動態海報、短視頻素材、廣告片段、萌寵視頻和人物口播。
這三類能力放在一起,重點不只是“模型多”,而是可以串成一條更完整的內容生產鏈路:文本模型寫腳本、拆需求、生成提示詞;圖片模型產出封面、角色和關鍵視覺;視頻模型再把靜態素材變成動態內容。對于 AI 內容工具、Agent 應用、前端 Demo 和多模態產品來說,這比單一模型更接近真實工作流。
文本模型支持 1M 上下文:不只是“能塞更多字”
本次升級中,文本模型支持 1M 上下文是開發者最容易感受到價值的能力之一。
很多人會把長上下文理解成“可以輸入更多文字”,但在真實開發里,它的意義更具體:減少文檔切片、摘要壓縮、上下文裁剪和多輪狀態管理帶來的工程負擔。
在項目中,開發者經常需要處理這些材料:很長的產品文檔;多個接口文檔;論文、研報、合同和需求文檔;多輪對話歷史;Agent 執行過程中的計劃、步驟和工具返回結果;多文件代碼項目;企業知識庫中的大量上下文......
如果上下文窗口較短,系統通常需要額外做檢索、分段、壓縮和狀態管理。這些工程手段當然可以解決一部分問題,但也會帶來新的風險,比如召回不完整、摘要遺漏關鍵信息、模型在后續步驟里忘記前面的約束。
1M 上下文更適合以下幾類場景:
1. 長文檔一次性分析
開發者可以把產品說明、技術文檔、會議材料、研報資料放進同一個上下文中,讓模型輸出摘要、關鍵結論、風險點和行動項。對于企業知識庫、合同分析、技術文檔助手來說,這能減少大量前置處理工作。
根據 Agnes-2.0-Flash API 文檔,Agnes-2.0-Flash 的 Context 已提升到 1M,Max Output 為 65.5K。也就是說,它不只是適合普通 Chat Completion,還可以承載更長的文檔、對話歷史、工具調用過程和多步驟 Agent 任務。
從使用方式看,開發者不需要額外修改代碼結構,只要繼續通過https://apihub.agnes-ai.com/v1/chat/completions調用agnes-2.0-flash,并把 messages 內容控制在 1M Token 以內即可。對于長文檔處理、代碼庫分析和復雜 Agent 工作流來說,這個升級的重點是降低前置切片、壓縮摘要和狀態管理的成本。
此外,Agnes-2.0-Flash 支持圖片 URL 輸入、圖片理解、工具調用、流式輸出和 OpenAI Chat Completions 兼容結構。這一點比較關鍵,因為長上下文不是孤立能力。它可以和圖片理解、工具調用一起用,例如把一份包含圖表、截圖和文字說明的長篇產品文檔交給模型,讓它同時理解圖文信息,再輸出結構化結論。
2. 代碼項目理解
在代碼開發場景中,模型往往需要同時理解多個文件、接口說明、業務背景和歷史修改記錄。更長上下文可以讓模型看到更多項目背景,適合用于代碼解釋、接口文檔生成、Bug 定位和改造方案輸出。
3. Agent 多步驟任務
Agent 場景里,模型不只是回答問題,還要規劃任務、調用工具、閱讀工具返回結果、修正計劃并繼續執行。上下文越短,越容易出現任務歷史丟失或約束漂移。1M 上下文可以幫助模型在更長任務鏈中保留更多狀態。
4. 前端頁面和小游戲原型
用文本模型生成應用和小游戲,通常不是一句簡單提示詞,而是包含大量功能約束、交互規則和視覺要求。下面幾組案例,可以更直觀看到文本模型在復雜需求里的組織能力。
在高德地圖類 APP/UI 案例中,文本模型把一段自然語言需求轉成移動端應用原型的能力。同時輸入包含起點、目的地輸入、地圖縮放、移動端豎屏、分層 UI、圓角布局、衛星實景地圖底圖、道路路網、建筑標記、地點文字標簽和定位控件等要求,輸出結果是一個偏地圖導航類的手機界面,能直觀看到模型對復雜 UI 約束的組織能力。
案例鏈接:https://agnes-test-gcp.kiwiar.com/share/preview/317613078237835264?event_id=evt_f648a5753935c8e3
![]()
高德地圖類 APP/UI 生成案例圖
旋轉小球網頁小游戲的案例更適合展示交互邏輯。它的需求不只是生成一個靜態頁面,而是包含旋轉木框、小球重力、碰撞反彈、拖拽投擲、掉出計分,以及重力檔位、旋轉速度檔位、小球數量和重新開始按鈕。對開發者來說,這類案例可以說明 Agnes-2.0-Flash 不只是在寫頁面樣式,而是在把規則、狀態和交互一起組織進一個可運行 Demo。
預覽鏈接: https://storage.googleapis.com/agnes-default-test/user_51f8883a-e63a-4c58-8b8f-6cc48f315a66/20260527/af5221da-35e9-45c0-9cda-506de4eb5016.html
![]()
旋轉小球網頁小游戲案例圖
深色終端風財經網頁案例則展現了信息組織能力。輸入要求里包含分欄布局、頂部搜索框、新聞信息流、實時指數、數據面板、熒光綠代碼文字和專業金融界面風格。它和小游戲案例剛好形成對照,一個偏交互執行,一個偏信息收集、結構化組織和專業頁面生成。
預覽鏈接:https://agnes-test-gcp.kiwiar.com/share/preview/317873248977080320?event_id=evt_9e4ae3e349a7468c
![]()
深色終端風財經網頁案例圖
圖片模型支持 4K:海報、IP 與視覺資產生成
圖片模型支持 4K 輸出,是本次升級中面向內容生產的另一個重點。
對海報、電商主圖、產品宣傳圖和社媒封面來說,分辨率會直接影響后續裁切、排版和多渠道復用。4K 輸出的意義不是簡單“更大”,而是讓生成圖更接近可交付素材,保留更多細節和后期編輯空間。
Agnes-Image-2.1-Flash 可以通過 size 參數控制清晰度,支持 1K、2K、3K、4K 四個檔位;也可以通過 ratio 參數控制畫幅比例,包括 1:1、3:4、4:3、16:9、9:16、2:3、3:2、21:9。
圖片模型的價值主要體現在幾個方面:
- 海報和封面圖更適合裁切和二次排版;
- 電商主圖可以保留更多商品邊緣、材質和光影細節;
- 廣告素材可以在不同尺寸和渠道中復用;
- 角色和 IP 形象更容易保持細節,方便后續做視頻或衍生素材;
- 內容工具開發者可以把圖片生成和編輯能力接入自己的產品。
Agnes-Image-2.1-Flash 的核心能力包括自然語言驅動編輯、背景替換、局部修改、多圖融合、角色和 IP 生成、風格化海報生成、產品圖增強、圖片文字編輯和圖像修復。下面看幾組圖片案例,直觀地展示了圖片模型在海報、IP 和視覺資產生成里的價值。
電影海報案例展示了復雜視覺元素的統一能力。賽博驚悚海報里同時出現了人物群像、機械角色、冷暖光影、霓虹氛圍、電影節標識、片名排版和底部演職員信息,并不是單一主體生成,而是海報級構圖、人物層次和排版氛圍的整體控制。
![]()
賽博驚悚電影海報生成案例圖
奇幻史詩海報案例展示出了大場景和風格化能力。畫面包含東方武士、巨大神獸、發光蘑菇、遠古濕地、神話圖騰和電影海報排版,詮釋了圖片模型在復雜構圖、風格一致性和商業海報視覺上的表現。
![]()
奇幻史詩電影海報生成案例圖
擬人化食物 / 動物 IP 系列則展示了系列資產生成能力。比如資料中的擬人白鵝案例,將 2D 卡通線稿轉成 3D 毛絨玩偶渲染圖,保留頭盔、連體服、輪滑鞋和站姿設定,同時強化材質、毛絨和玩具感。對內容工具開發者來說,這類案例比單張圖更有產品意義,因為它可以繼續用于角色庫、短視頻 IP 和營銷素材。
![]()
擬人化白鵝 IP 生成案例圖
Agnes-Image-2.1-Flash 的圖片生成接口為:https://apihub.agnes-ai.com/v1/images/generations。
請求方式為 POST,模型名稱為 agnes-image-2.1-flash。開發者可以結合提示詞、比例和編輯能力完成海報、IP 形象、產品圖和視覺資產生成。具體規格以官方接口文檔更新為準。
這也解釋了為什么圖片模型對海報、電商圖、封面圖和廣告素材有意義。開發者可以把圖片生成能力放進內容生產流程里,用于快速出圖、二次編輯、局部修改和多渠道素材復用。
視頻模型:把靜態創意變成動態內容
除了文本和圖片,Agnes-Video-V2.0 補足的是動態內容生成能力。
它支持文生視頻、圖生視頻、首幀生視頻、首尾幀生視頻、多幀生視頻和原生音畫同出。對于內容生產工具來說,視頻模型可以作為最后一環,把腳本、分鏡、圖片和角色轉成可傳播的視頻素材。下面來看幾個案例:
動態海報案例展示出了圖生視頻能力。它的重點不是把整張圖改掉,而是在保持海報構圖、產品主體、品牌文字和排版穩定的前提下,讓光影、液體、氣泡或背景元素產生細微變化。對品牌海報、飲品廣告和電商素材來說,圖生視頻最重要的其實不是炫技,而是穩定。文字不能糊,Logo 不能變,瓶身不能飄,構圖不能亂。
動態海報視頻案例:https://live.csdn.net/v/530753
萌寵 Vlog 案例展示了輕量短視頻內容生產。比如小貓早餐、小貓起床、揉臉、眨眼、慢慢吃東西這類內容,本身不需要復雜敘事,但非常依賴動作自然、節奏柔和和畫面穩定。對短視頻工具和內容創作者來說,這類素材的價值在于,可以快速生成適合傳播的治愈型片段。
貓咪 / 萌寵 Vlog 視頻案例:https://live.csdn.net/v/530756
虛擬人播報 / 口播視頻則展示了文本模型和視頻模型的結合。文本模型先生成產品講解腳本,視頻模型再把人物表情、口型、鏡頭和聲音組織成一段可發布的視頻。對于企業介紹、產品發布、知識類短視頻和開發者教程來說,這類能力可以直接進入內容生產鏈路。
虛擬人播報 / 口播視頻案例:https://live.csdn.net/v/530755
如果再結合前面官方披露的數據,Agnes-Video-V2.0 首周生成超過 200 萬秒視頻,說明視頻模型并不是一個“看看效果”的展示功能,而是已經開始被大量用于真實創作場景。
接入教程:從 API Key 到常用工具配置
Agnes AI 的接入方式可以分成兩類:直接通過 API 接入,以及通過常用開發工具或 AI 工具接入。
1. 獲取 API Key
基礎步驟如下:
- 訪問官網:https://agnes-ai.com/
- 進入 Platform:https://platform.agnes-ai.com/
- 注冊并登錄賬號;
- 創建 API Key;
- 在第三方工具或代碼中填寫 API 地址、模型名稱和 API Key。
*API Key 屬于敏感信息,不建議直接寫進前端頁面或公開倉庫。
2. WorkBuddy 接入 Agnes
WorkBuddy 的接入配置相對直接。核心配置:
- API 地址:https://apihub.agnes-ai.com/v1
- 模型名稱:agnes-2.0-flash
- API Key:使用 Agnes AI Platform 創建的密鑰
接入步驟:
- 打開 WorkBuddy 的模型配置入口;
- 提供商選擇“其他 / 自定義”;
- 添加模型;
- 填寫 API 地址、API Key 和模型名稱;
- 保存配置;
- 在模型列表中選擇 agnes-2.0-flash 進行測試。
圖片和視頻模型可以通過 Skill 方式接入,將圖像生成、視頻生成能力封裝成可調用工具,再在對話或 Agent 工作流中使用。
3. Claude CLI / Claude Desktop 接入
如果開發者已經在使用 Claude CLI 或 Claude Desktop,可以通過 cc-switch 添加自定義供應商,再把 Agnes-2.0-Flash 映射到本地路由中。
基本步驟如下:
- 安裝 cc-switch;
- 添加自定義供應商;
- 填寫 API Key;
- 配置請求地址;
- 選擇 OpenAI Chat Completions 格式;
- 獲取模型列表并設置映射關系;
- 開啟本地路由;
- 測試文本和多模態能力。
這種方式適合已經形成 Claude CLI / Desktop 使用習慣的開發者,把 Agnes 作為可切換的模型供應商。
4. Cherry Studio 接入
Cherry Studio 適合在桌面端統一管理多個模型供應商。
接入步驟可以概括為:
- 添加提供商;
- 輸入 API Key;
- 填寫 API 地址;
- 獲取模型列表;
- 選擇文本模型;
- 圖片和視頻能力通過 Skill + 智能體綁定方式使用。
5. 其他兼容 OpenAI API 的工具
除 WorkBuddy、Claude CLI / Desktop、Cherry Studio 外,其他兼容 OpenAI API 格式的 Agent 框架或開發工具,也可以嘗試接入 Agnes 文本模型。
只要工具支持自定義 API Base URL、API Key 和模型名稱,就可以進行配置。圖片和視頻能力則取決于工具是否支持 Skill、插件或自定義 API 調用。
哪些場景最值得優先嘗試
如果只是普通聊天,1M 上下文未必能立刻體現優勢;但一旦進入長文檔、代碼項目、Agent、多模態內容生產,升級帶來的差異會更明顯。
可以優先嘗試這些場景:
文檔分析:用 1M 上下文處理產品文檔、接口文檔、論文、合同、會議紀要和行業研報。
Agent 應用:用 Agnes-2.0-Flash 做任務規劃、多步驟執行、工具調用和歷史狀態保留。
前端 Demo:用文本模型生成 HTML、React、Canvas、小程序或單文件網頁應用。
內容生產:用文本模型生成腳本和分鏡,用圖片模型生成封面和海報,用視頻模型生成動態素材。
電商和廣告素材:用圖片模型生成商品圖、主圖、廣告海報、多版本營銷素材和社媒封面。
短視頻工具:用視頻模型生成動態海報、IP 動作、萌寵視頻、廣告片段和風格化視頻。
結語:免費模型的重點不是體驗,而是降低試錯成本
Agnes AI 本次免費模型升級,把 1M 上下文、4K 圖片、視頻模型和全模態 API 接入放到了開發者可以嘗試的范圍內。
從能力上看,1M 上下文更適合長文檔、代碼項目和 Agent 場景;4K 圖片更適合海報、電商圖、廣告素材和內容生產工具;視頻模型則補足了從靜態視覺到動態內容生產的鏈路。
需要說明的是,1M 超長上下文和 4K 圖片能力目前已分批開放,接下來幾天逐步覆蓋到更多用戶,周末前基本完成全量上線。短時間內如果暫時不可用,屬于灰度過程中的正常情況,可以稍后再試。
對個人開發者和中小團隊來說,這類免費全模態 API 的意義不只是降低調用成本,更重要的是降低 AI 應用原型的試錯成本。開發者可以更快測試一個想法,驗證一個工作流,再決定是否投入更多工程資源。
首周超過 1T tokens、超過 200 萬張圖片、超過 200 萬秒視頻的使用量,某種程度上也說明了同一件事:當模型能力足夠容易接入,開發者和創作者的試錯速度會非常快。
如果你正在做長文檔處理、Agent 自動化、前端 Demo、內容生成工具或多模態創作應用,可以從 Agnes AI Platform 獲取 API Key 開始測試:https://platform.agnes-ai.com/
官網:https://agnes-ai.com/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.