文|梁鍵強
編輯|王毓嬋
一句話介紹
Anijam是一款面向動畫創作場景的AI Video Agent,目的是以更低成本提升動畫內容生產效率。用戶只需輸入自然語言提示,即可自動完成角色生成、分鏡設計等關鍵環節的自動生成。
團隊介紹
創始人兼CTO王玨,先后獲得清華大學學士、碩士學位及美國華盛頓大學博士學位。曾于2020至2023年擔任騰訊杰出科學家、AI Lab視覺計算中心總監,擁有IEEE Fellow頭銜,2017至2019年任曠視美國研究院院長,2007至2017年任Adobe首席科學家。
CEO 方晨,博士畢業于美國常春藤院校達特茅斯學院,曾先后任職于 Adobe Research 、字節跳動北美 AI Lab 及騰訊,具備從技術研發到產品落地的完整經驗,其成果已廣泛應用于Photoshop、Lightroom、抖音、微信等產品。
融資進展
已累計完成千萬美金級別的融資,投資方包括奇績創壇、Atypical Ventures和元璟資本。
產品及業務
Anijam的核心定位,是打造一款面向視頻創作者的AI Video Agent,類似于視頻領域的“Cursor”。就像Cursor這類AI編程工具能夠理解需求、協助完成開發任務一樣,Anijam也希望推動視頻創作走向“AI驅動生成”,幫助創作者完成角色生成、分鏡設計等關鍵環節。
視頻創作本質上是一項高門檻、長流程的專業工作。一個完整的視頻,從前期的腳本構思、角色設定、分鏡拆解,到中期的鏡頭設計、動作銜接、畫面風格統一,再到后期的剪輯、配音和節奏調整,背后需要系統的創作方法和專業能力。
AI雖然讓視頻生成變得更容易,但對大多數普通人來說,真正的難點并不在于生成,而在于如何搭建敘事、設計鏡頭語言,并組裝成一支表達清晰的好視頻。
方晨認為,AI大模型會由頭部公司主導,而機會點在于解決生成內容不可控、難修改的問題。
基于這一判斷,產品將視頻創作流程進行了重新拆解。Anijam通過AI,將原本割裂、復雜的創作流程進行整合,讓用戶通過更簡單的交互完成完整的視頻生產。
Anijam在后臺整合了多個第三方大模型,并在Agent流程編排、后編輯算法及用戶體驗優化上進行了優化。
用戶只需輸入一句自然語言,例如“制作一段孫悟空三打白骨精的視頻”,系統就會自動完成從故事大綱生成、視覺概念設計,到分鏡腳本拆解、關鍵幀生成、視頻片段制作及最終合成的完整流程。
![]()
整個過程以畫布為載體形式,用戶可以在任意環節介入修改。例如調整畫風、增刪角色設定,或對鏡頭細節進行優化。
在這一過程中,系統會自動識別故事中的關鍵元素,包括角色、場景、道具及風格,并基于此生成完整的分鏡鏡頭。每一個鏡頭都會包含場景描述、角色狀態、鏡頭語言等信息。
創作者不僅可以看到每個分鏡的大致效果,還可以通過自然語言進行修改,例如調整鏡頭視角、改變構圖,或者替換局部元素等。同時,系統會自動生成每個分鏡的關鍵幀,并支持逐鏡頭預覽與修改。
![]()
這也是Anijam的關鍵能力之一,即從抽卡式生成視頻走向“可控編輯”。
![]()
傳統AI視頻生成往往依賴反復生成整段內容,一旦某一幀不滿意,需要整體重來。而Anijam強調“局部可編輯”,例如只修改角色表情,而不影響動作或背景。
Anijam正在優化AI驅動的視頻編輯能力——不僅支持局部修改,還在嘗試構建AI的自反饋機制。在方晨的規劃中,Anijam未來會爭取讓AI自動評價視頻生成效果,扮演一個“第三方AI導演”,對AI工具生成的鏡頭質量打分,并反向優化生成過程,通過“AI指導AI”來減少人工調試的次數。
在產品形態上,Anijam同時提供桌面端與移動端。Web端承載更復雜的創作與編輯能力,適合長流程生產。移動端則以對話式交互為主,界面更輕量,適配高頻內容創作者。團隊還在構建創作者社區,將優質內容沉淀為模板,供用戶復用。
當前產品已支持最長5至10分鐘的視頻生成,具體耗時取決于內容復雜度。一條約2分鐘的視頻,生成過程可能需要數十分鐘至一小時。
在商業模式上,產品采用分層訂閱模式,覆蓋不同強度的創作需求,從25到60美元不等,價格區間的提升,本質上對應的是算力額度與生成能力的差異。
隨著用戶與Agent的持續交互,系統會積累大量與創作相關的數據,包括用戶偏好、風格選擇、修改路徑等。這些數據將被進一步結構化,轉化為“創作記憶”,并嵌入到Agent中,使其逐步具備個性化能力。
Anijam試圖實現的,是用一句話啟動創作,用AI完成生產,并對每一幀內容進行可控修改,同時在持續使用中不斷變得更高效。
Founder思考
- AI視頻賽道仍處于早期階段,時間窗口就是壁壘
視頻大模型的持續進步是確定的趨勢,這對所有入局的玩家來說都是紅利。真正的差異不在模型本身,而在模型之外的能力構建,例如后編輯能力、Agent流程編排,以及如何讓生成內容變得可用、可修改。相比單純調用模型,如何讓生成內容變得可用、可修改,才是產品競爭的核心。
這一賽道還處在早期階段,產品還不完美,仍需要用戶大量參與修改。在這個階段,最該擔心的不是競爭,而是效率。要盡快進入市場、獲取用戶,并在真實使用中積累數據與認知。
創業公司與大廠競爭的關鍵,是要更早跑起來,形成用戶留存與數據沉淀。
參考圖像生成市場的發展路徑,AI視頻領域未來也不會出現一家壟斷的格局,而是由多家廠商分占不同份額。市場結構可能更加均衡,每家占據一部分用戶與場景,而不是單一平臺占據絕大多數份額。
- 視頻Agent的核心不只是生成好視頻,而是“講好故事”
當前AI視頻的瓶頸,并不只是畫面生成能力,而是敘事能力。
讓模型在兩分鐘內清晰講述一個完整故事,本身就是一件難度極高的事情。這意味著,真正的挑戰不在于生成單個片段,而在于如何用導演語言組織內容,講述用戶的故事。
未來的創作者工具不再只是提供功能,而是成為用戶的創作伙伴。隨著創作者與Agent持續交互,系統會積累用戶在創作過程中的行為數據,包括偏好、修改邏輯與經驗。Agent可以逐漸理解用戶意圖,甚至提前完成部分創作決策,最終演化為一個具備記憶與進化能力的“數字分身”。
Anijam的目標并不只是做一個工具,而是成為類似Adobe的創作平臺。通過技術重塑創作流程,在提升效率、降低門檻的同時,承載更大規模的內容生產與創作者生態,從而讓更多人參與創作,并從中獲得價值。
- AI將推動創作平權,但注意力仍集中頭部
隨著Agent能力的進一步提升,視頻創作將逐漸從“人不斷參與反饋”的過程,轉變為更自動化的生產模式。未來甚至可能出現“Agent替人反饋”的情況。用戶只需提出需求,其余由系統自行完成迭代與優化。
AI正在降低創作門檻,讓更多人能夠參與內容生產。類似短視頻平臺的出現,使原本無法進入院線的創作者獲得了表達空間,這是一次創作平權的推進。
但與此同時,注意力分配并不會完全平均。院線與短視頻并非替代關系,而是新增渠道,頭部內容依然會集中流量與商業價值。因此,AI帶來的不是“平均化”,而是在擴大供給的同時,繼續強化頭部效應。
- 商業模式將從“賣算力”走向“按結果付費”
目前的視頻生成成本仍然很高昂,但隨著后續的需求增加和技術進步,價格會逐步下滑。
一方面,大規模的需求會持續壓低成本;另一方面,模型層面的優化與加速將顯著減少算力消耗,例如通過架構優化、硬件協同等方式,將原本需要大量token的生成過程大幅壓縮。這意味著,同樣一段視頻所需的計算資源可以實現數量級下降,從而帶動整體價格快速走低,進一步推動AI視頻應用的普及。
在商業模式上,當前以算力為核心的計費方式,本質上是階段性形態。隨著技術成熟與成本下降,未來更可能轉向“按結果付費”——即用戶在對AI視頻滿意并愿意下載時,才為最終產出買單,而非為生成過程中的token消耗付費。
這一模式的成立,依賴于產品在質量、成本與速度之間達到平衡,一旦生成結果足夠穩定且可控,用戶的付費邏輯也會隨之發生轉變。
- 從動畫創作者出發,撬動更廣泛的內容人群
Anijam選擇從動畫類型(animation)切入。原因在于,這一群體本身已經習慣數字化創作流程,對AI工具的接受度更高,相比實拍視頻創作者,遷移成本更低。同時,這類用戶往往具備較強的創作意愿,是早期最容易被激活的一批人。
在更廣泛的用戶層面,團隊觀察到,海外市場存在大量“輕創作用戶”——包括副業創作者、內容愛好者等,他們具備較強的內容生產意愿,并且已經在YouTube、Instagram等平臺實現初步商業化。
方晨認為,在B端專業內容公司之外,to C創作者同樣具備付費能力與增長潛力。
另外,動畫與真人視頻在技術難度上存在明顯差異。盡管兩者在生成時長上相近,但真人視頻對質量的要求更高,例如需要跨越“恐怖谷效應”,同時在細節、銜接與轉場上更接近真實,這使得整體實現難度顯著提升。相比之下,動畫在風格容錯與表達上更容易達到可用水平。
從長期來看,真人視頻仍然是更大的市場方向。隨著技術成熟與行業方案逐步完善,真人視頻的需求一定會釋放,我們未來也會進入這一領域。
封面來源|企業官方
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.