網易首頁 > 網易號 > 正文申請入駐

開發者又多了一個免費全模態選擇：Agnes AI支持1M上下文和4K圖片

2026-06-12 11:53:37　來源: CSDN

湖南舉報

分享至

過去一年，大模型應用的開發門檻其實在同時變高和變低。

變低的是，開發者已經可以很快調用模型 API，做一個聊天助手、文檔總結工具、圖片生成 Demo，甚至搭一個簡單 Agent。變高的是，一旦項目進入真實工作流，就會遇到更具體的問題：上下文不夠長、Agent 多輪調用太消耗 token、圖片分辨率不夠用于海報和電商圖、文本、圖片、視頻能力分散在不同工具里，接入和試錯成本都不低。

這也是 Agnes AI 本次免費模型升級值得關注的地方。

從 6 月 1 日開始免費開放后，Agnes AI 的全模態模型傳播速度很快。文本模型支持 1M 上下文，圖片模型支持 4K 輸出，并繼續覆蓋圖片生成、編輯和視覺資產生產場景，目前已灰度上線，同時繼續提供文本、圖片、視頻全模態能力。對開發者來說，這次升級的重點不只是“免費”，而是這些能力是否能被接入到真實項目和日常開發工具鏈里。1M 上下文和 4K 圖片能力不是一次性同時放開，而是從今天開始分批開放，預計會在接下來幾天逐步覆蓋到全部用戶。短期內如果暫時不可用，屬于灰度過程中的正常情況。

官方 API 平臺地址：https://platform.agnes-ai.com/

先看一組官方披露的數據。Agnes AI 在 LinkedIn 上同步，Agnes 2.0 omni-model series 免費開放一周后已經達到一個重要里程碑：

Agnes-2.0-Flash 調用 / 處理量超過 1T tokens；
Agnes-Image-2.1-Flash 生成超過 200 萬張圖片；
Agnes-Video-V2.0 生成超過 200 萬秒視頻。

LinkedIn 官方首周數據截圖

這個數據挺關鍵。因為它說明一件事，免費不是一個單純的營銷動作。真正有價值的是，當文本、圖片、視頻這三類能力都被放到一個開發者可以調用的平臺里，使用會很快從“試試看”變成“拿來做東西”。1T 級別的文本處理、百萬級圖片生成、百萬秒級視頻生成，背后對應的是開發者、創作者和團隊在真實工作流里不斷試錯。

所以這篇文章不只是聊參數，也想聊一下，這些參數放到開發場景里到底能干什么？

Agnes AI 的全模態模型矩陣

從開發者使用角度看，Agnes AI 這次免費開放的能力可以簡單分成三類。

文本模型是 Agnes-2.0-Flash，適合長文檔處理、知識問答、代碼生成、Agent 任務規劃、工具調用和前端 Demo 原型生成。圖片模型是 Agnes-Image-2.1-Flash，適合海報、電商圖、社媒封面、產品宣傳圖和原創 IP 視覺資產。視頻模型是 Agnes-Video-V2.0，適合動態海報、短視頻素材、廣告片段、萌寵視頻和人物口播。

這三類能力放在一起，重點不只是“模型多”，而是可以串成一條更完整的內容生產鏈路：文本模型寫腳本、拆需求、生成提示詞；圖片模型產出封面、角色和關鍵視覺；視頻模型再把靜態素材變成動態內容。對于 AI 內容工具、Agent 應用、前端 Demo 和多模態產品來說，這比單一模型更接近真實工作流。

文本模型支持 1M 上下文：不只是“能塞更多字”

本次升級中，文本模型支持 1M 上下文是開發者最容易感受到價值的能力之一。

很多人會把長上下文理解成“可以輸入更多文字”，但在真實開發里，它的意義更具體：減少文檔切片、摘要壓縮、上下文裁剪和多輪狀態管理帶來的工程負擔。

在項目中，開發者經常需要處理這些材料：很長的產品文檔；多個接口文檔；論文、研報、合同和需求文檔；多輪對話歷史；Agent 執行過程中的計劃、步驟和工具返回結果；多文件代碼項目；企業知識庫中的大量上下文......

如果上下文窗口較短，系統通常需要額外做檢索、分段、壓縮和狀態管理。這些工程手段當然可以解決一部分問題，但也會帶來新的風險，比如召回不完整、摘要遺漏關鍵信息、模型在后續步驟里忘記前面的約束。

1M 上下文更適合以下幾類場景:

1. 長文檔一次性分析

開發者可以把產品說明、技術文檔、會議材料、研報資料放進同一個上下文中，讓模型輸出摘要、關鍵結論、風險點和行動項。對于企業知識庫、合同分析、技術文檔助手來說，這能減少大量前置處理工作。

根據 Agnes-2.0-Flash API 文檔，Agnes-2.0-Flash 的 Context 已提升到 1M，Max Output 為 65.5K。也就是說，它不只是適合普通 Chat Completion，還可以承載更長的文檔、對話歷史、工具調用過程和多步驟 Agent 任務。

從使用方式看，開發者不需要額外修改代碼結構，只要繼續通過https://apihub.agnes-ai.com/v1/chat/completions調用agnes-2.0-flash，并把 messages 內容控制在 1M Token 以內即可。對于長文檔處理、代碼庫分析和復雜 Agent 工作流來說，這個升級的重點是降低前置切片、壓縮摘要和狀態管理的成本。

此外，Agnes-2.0-Flash 支持圖片 URL 輸入、圖片理解、工具調用、流式輸出和 OpenAI Chat Completions 兼容結構。這一點比較關鍵，因為長上下文不是孤立能力。它可以和圖片理解、工具調用一起用，例如把一份包含圖表、截圖和文字說明的長篇產品文檔交給模型，讓它同時理解圖文信息，再輸出結構化結論。

2. 代碼項目理解

在代碼開發場景中，模型往往需要同時理解多個文件、接口說明、業務背景和歷史修改記錄。更長上下文可以讓模型看到更多項目背景，適合用于代碼解釋、接口文檔生成、Bug 定位和改造方案輸出。

3. Agent 多步驟任務

Agent 場景里，模型不只是回答問題，還要規劃任務、調用工具、閱讀工具返回結果、修正計劃并繼續執行。上下文越短，越容易出現任務歷史丟失或約束漂移。1M 上下文可以幫助模型在更長任務鏈中保留更多狀態。

4. 前端頁面和小游戲原型

用文本模型生成應用和小游戲，通常不是一句簡單提示詞，而是包含大量功能約束、交互規則和視覺要求。下面幾組案例，可以更直觀看到文本模型在復雜需求里的組織能力。

在高德地圖類 APP/UI 案例中，文本模型把一段自然語言需求轉成移動端應用原型的能力。同時輸入包含起點、目的地輸入、地圖縮放、移動端豎屏、分層 UI、圓角布局、衛星實景地圖底圖、道路路網、建筑標記、地點文字標簽和定位控件等要求，輸出結果是一個偏地圖導航類的手機界面，能直觀看到模型對復雜 UI 約束的組織能力。

案例鏈接：https://agnes-test-gcp.kiwiar.com/share/preview/317613078237835264?event_id=evt_f648a5753935c8e3

高德地圖類 APP/UI 生成案例圖

旋轉小球網頁小游戲的案例更適合展示交互邏輯。它的需求不只是生成一個靜態頁面，而是包含旋轉木框、小球重力、碰撞反彈、拖拽投擲、掉出計分，以及重力檔位、旋轉速度檔位、小球數量和重新開始按鈕。對開發者來說，這類案例可以說明 Agnes-2.0-Flash 不只是在寫頁面樣式，而是在把規則、狀態和交互一起組織進一個可運行 Demo。

預覽鏈接： https://storage.googleapis.com/agnes-default-test/user_51f8883a-e63a-4c58-8b8f-6cc48f315a66/20260527/af5221da-35e9-45c0-9cda-506de4eb5016.html

旋轉小球網頁小游戲案例圖

深色終端風財經網頁案例則展現了信息組織能力。輸入要求里包含分欄布局、頂部搜索框、新聞信息流、實時指數、數據面板、熒光綠代碼文字和專業金融界面風格。它和小游戲案例剛好形成對照，一個偏交互執行，一個偏信息收集、結構化組織和專業頁面生成。

預覽鏈接：https://agnes-test-gcp.kiwiar.com/share/preview/317873248977080320?event_id=evt_9e4ae3e349a7468c

深色終端風財經網頁案例圖

圖片模型支持 4K：海報、IP 與視覺資產生成

圖片模型支持 4K 輸出，是本次升級中面向內容生產的另一個重點。

對海報、電商主圖、產品宣傳圖和社媒封面來說，分辨率會直接影響后續裁切、排版和多渠道復用。4K 輸出的意義不是簡單“更大”，而是讓生成圖更接近可交付素材，保留更多細節和后期編輯空間。

Agnes-Image-2.1-Flash 可以通過 size 參數控制清晰度，支持 1K、2K、3K、4K 四個檔位；也可以通過 ratio 參數控制畫幅比例，包括 1:1、3:4、4:3、16:9、9:16、2:3、3:2、21:9。

圖片模型的價值主要體現在幾個方面：

海報和封面圖更適合裁切和二次排版；
電商主圖可以保留更多商品邊緣、材質和光影細節；
廣告素材可以在不同尺寸和渠道中復用；
角色和 IP 形象更容易保持細節，方便后續做視頻或衍生素材；
內容工具開發者可以把圖片生成和編輯能力接入自己的產品。

Agnes-Image-2.1-Flash 的核心能力包括自然語言驅動編輯、背景替換、局部修改、多圖融合、角色和 IP 生成、風格化海報生成、產品圖增強、圖片文字編輯和圖像修復。下面看幾組圖片案例，直觀地展示了圖片模型在海報、IP 和視覺資產生成里的價值。

電影海報案例展示了復雜視覺元素的統一能力。賽博驚悚海報里同時出現了人物群像、機械角色、冷暖光影、霓虹氛圍、電影節標識、片名排版和底部演職員信息，并不是單一主體生成，而是海報級構圖、人物層次和排版氛圍的整體控制。

賽博驚悚電影海報生成案例圖

奇幻史詩海報案例展示出了大場景和風格化能力。畫面包含東方武士、巨大神獸、發光蘑菇、遠古濕地、神話圖騰和電影海報排版，詮釋了圖片模型在復雜構圖、風格一致性和商業海報視覺上的表現。

奇幻史詩電影海報生成案例圖

擬人化食物 / 動物 IP 系列則展示了系列資產生成能力。比如資料中的擬人白鵝案例，將 2D 卡通線稿轉成 3D 毛絨玩偶渲染圖，保留頭盔、連體服、輪滑鞋和站姿設定，同時強化材質、毛絨和玩具感。對內容工具開發者來說，這類案例比單張圖更有產品意義，因為它可以繼續用于角色庫、短視頻 IP 和營銷素材。

擬人化白鵝 IP 生成案例圖

Agnes-Image-2.1-Flash 的圖片生成接口為：https://apihub.agnes-ai.com/v1/images/generations。

請求方式為 POST，模型名稱為 agnes-image-2.1-flash。開發者可以結合提示詞、比例和編輯能力完成海報、IP 形象、產品圖和視覺資產生成。具體規格以官方接口文檔更新為準。

這也解釋了為什么圖片模型對海報、電商圖、封面圖和廣告素材有意義。開發者可以把圖片生成能力放進內容生產流程里，用于快速出圖、二次編輯、局部修改和多渠道素材復用。

視頻模型：把靜態創意變成動態內容

除了文本和圖片，Agnes-Video-V2.0 補足的是動態內容生成能力。

它支持文生視頻、圖生視頻、首幀生視頻、首尾幀生視頻、多幀生視頻和原生音畫同出。對于內容生產工具來說，視頻模型可以作為最后一環，把腳本、分鏡、圖片和角色轉成可傳播的視頻素材。下面來看幾個案例：

動態海報案例展示出了圖生視頻能力。它的重點不是把整張圖改掉，而是在保持海報構圖、產品主體、品牌文字和排版穩定的前提下，讓光影、液體、氣泡或背景元素產生細微變化。對品牌海報、飲品廣告和電商素材來說，圖生視頻最重要的其實不是炫技，而是穩定。文字不能糊，Logo 不能變，瓶身不能飄，構圖不能亂。

動態海報視頻案例：https://live.csdn.net/v/530753

萌寵 Vlog 案例展示了輕量短視頻內容生產。比如小貓早餐、小貓起床、揉臉、眨眼、慢慢吃東西這類內容，本身不需要復雜敘事，但非常依賴動作自然、節奏柔和和畫面穩定。對短視頻工具和內容創作者來說，這類素材的價值在于，可以快速生成適合傳播的治愈型片段。

貓咪 / 萌寵 Vlog 視頻案例：https://live.csdn.net/v/530756

虛擬人播報 / 口播視頻則展示了文本模型和視頻模型的結合。文本模型先生成產品講解腳本，視頻模型再把人物表情、口型、鏡頭和聲音組織成一段可發布的視頻。對于企業介紹、產品發布、知識類短視頻和開發者教程來說，這類能力可以直接進入內容生產鏈路。

虛擬人播報 / 口播視頻案例：https://live.csdn.net/v/530755

如果再結合前面官方披露的數據，Agnes-Video-V2.0 首周生成超過 200 萬秒視頻，說明視頻模型并不是一個“看看效果”的展示功能，而是已經開始被大量用于真實創作場景。

接入教程：從 API Key 到常用工具配置

Agnes AI 的接入方式可以分成兩類：直接通過 API 接入，以及通過常用開發工具或 AI 工具接入。

1. 獲取 API Key

基礎步驟如下：

訪問官網：https://agnes-ai.com/
進入 Platform：https://platform.agnes-ai.com/
注冊并登錄賬號；
創建 API Key；
在第三方工具或代碼中填寫 API 地址、模型名稱和 API Key。

*API Key 屬于敏感信息，不建議直接寫進前端頁面或公開倉庫。

2. WorkBuddy 接入 Agnes

WorkBuddy 的接入配置相對直接。核心配置：

API 地址：https://apihub.agnes-ai.com/v1
模型名稱：agnes-2.0-flash
API Key：使用 Agnes AI Platform 創建的密鑰

接入步驟：

打開 WorkBuddy 的模型配置入口；
提供商選擇“其他 / 自定義”；
添加模型；
填寫 API 地址、API Key 和模型名稱；
保存配置；
在模型列表中選擇 agnes-2.0-flash 進行測試。

圖片和視頻模型可以通過 Skill 方式接入，將圖像生成、視頻生成能力封裝成可調用工具，再在對話或 Agent 工作流中使用。

3. Claude CLI / Claude Desktop 接入

如果開發者已經在使用 Claude CLI 或 Claude Desktop，可以通過 cc-switch 添加自定義供應商，再把 Agnes-2.0-Flash 映射到本地路由中。

基本步驟如下：

安裝 cc-switch；
添加自定義供應商；
填寫 API Key；
配置請求地址；
選擇 OpenAI Chat Completions 格式；
獲取模型列表并設置映射關系；
開啟本地路由；
測試文本和多模態能力。

這種方式適合已經形成 Claude CLI / Desktop 使用習慣的開發者，把 Agnes 作為可切換的模型供應商。

4. Cherry Studio 接入

Cherry Studio 適合在桌面端統一管理多個模型供應商。

接入步驟可以概括為：

添加提供商；
輸入 API Key；
填寫 API 地址；
獲取模型列表；
選擇文本模型；
圖片和視頻能力通過 Skill + 智能體綁定方式使用。

5. 其他兼容 OpenAI API 的工具

除 WorkBuddy、Claude CLI / Desktop、Cherry Studio 外，其他兼容 OpenAI API 格式的 Agent 框架或開發工具，也可以嘗試接入 Agnes 文本模型。

只要工具支持自定義 API Base URL、API Key 和模型名稱，就可以進行配置。圖片和視頻能力則取決于工具是否支持 Skill、插件或自定義 API 調用。

哪些場景最值得優先嘗試

如果只是普通聊天，1M 上下文未必能立刻體現優勢；但一旦進入長文檔、代碼項目、Agent、多模態內容生產，升級帶來的差異會更明顯。

可以優先嘗試這些場景：

文檔分析：用 1M 上下文處理產品文檔、接口文檔、論文、合同、會議紀要和行業研報。

Agent 應用：用 Agnes-2.0-Flash 做任務規劃、多步驟執行、工具調用和歷史狀態保留。

前端 Demo：用文本模型生成 HTML、React、Canvas、小程序或單文件網頁應用。

內容生產：用文本模型生成腳本和分鏡，用圖片模型生成封面和海報，用視頻模型生成動態素材。

電商和廣告素材：用圖片模型生成商品圖、主圖、廣告海報、多版本營銷素材和社媒封面。

短視頻工具：用視頻模型生成動態海報、IP 動作、萌寵視頻、廣告片段和風格化視頻。

結語：免費模型的重點不是體驗，而是降低試錯成本

Agnes AI 本次免費模型升級，把 1M 上下文、4K 圖片、視頻模型和全模態 API 接入放到了開發者可以嘗試的范圍內。

從能力上看，1M 上下文更適合長文檔、代碼項目和 Agent 場景；4K 圖片更適合海報、電商圖、廣告素材和內容生產工具；視頻模型則補足了從靜態視覺到動態內容生產的鏈路。

需要說明的是，1M 超長上下文和 4K 圖片能力目前已分批開放，接下來幾天逐步覆蓋到更多用戶，周末前基本完成全量上線。短時間內如果暫時不可用，屬于灰度過程中的正常情況，可以稍后再試。

對個人開發者和中小團隊來說，這類免費全模態 API 的意義不只是降低調用成本，更重要的是降低 AI 應用原型的試錯成本。開發者可以更快測試一個想法，驗證一個工作流，再決定是否投入更多工程資源。

首周超過 1T tokens、超過 200 萬張圖片、超過 200 萬秒視頻的使用量，某種程度上也說明了同一件事：當模型能力足夠容易接入，開發者和創作者的試錯速度會非常快。

如果你正在做長文檔處理、Agent 自動化、前端 Demo、內容生成工具或多模態創作應用，可以從 Agnes AI Platform 獲取 API Key 開始測試：https://platform.agnes-ai.com/

官網：https://agnes-ai.com/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.