做視頻的「Cursor」，Anijam重寫動(dòng)畫創(chuàng)作流程丨涌現(xiàn)新項(xiàng)目

2026-05-12 15:58:04　來源: 36氪

山西舉報(bào)

分享至

文｜梁鍵強(qiáng)

編輯｜王毓嬋

一句話介紹

Anijam是一款面向動(dòng)畫創(chuàng)作場景的AI Video Agent，目的是以更低成本提升動(dòng)畫內(nèi)容生產(chǎn)效率。用戶只需輸入自然語言提示，即可自動(dòng)完成角色生成、分鏡設(shè)計(jì)等關(guān)鍵環(huán)節(jié)的自動(dòng)生成。

團(tuán)隊(duì)介紹

創(chuàng)始人兼CTO王玨，先后獲得清華大學(xué)學(xué)士、碩士學(xué)位及美國華盛頓大學(xué)博士學(xué)位。曾于2020至2023年擔(dān)任騰訊杰出科學(xué)家、AI Lab視覺計(jì)算中心總監(jiān)，擁有IEEE Fellow頭銜，2017至2019年任曠視美國研究院院長，2007至2017年任Adobe首席科學(xué)家。

CEO 方晨，博士畢業(yè)于美國常春藤院校達(dá)特茅斯學(xué)院，曾先后任職于 Adobe Research 、字節(jié)跳動(dòng)北美 AI Lab 及騰訊，具備從技術(shù)研發(fā)到產(chǎn)品落地的完整經(jīng)驗(yàn)，其成果已廣泛應(yīng)用于Photoshop、Lightroom、抖音、微信等產(chǎn)品。

融資進(jìn)展

已累計(jì)完成千萬美金級別的融資，投資方包括奇績創(chuàng)壇、Atypical Ventures和元璟資本。

產(chǎn)品及業(yè)務(wù)

Anijam的核心定位，是打造一款面向視頻創(chuàng)作者的AI Video Agent，類似于視頻領(lǐng)域的“Cursor”。就像Cursor這類AI編程工具能夠理解需求、協(xié)助完成開發(fā)任務(wù)一樣，Anijam也希望推動(dòng)視頻創(chuàng)作走向“AI驅(qū)動(dòng)生成”，幫助創(chuàng)作者完成角色生成、分鏡設(shè)計(jì)等關(guān)鍵環(huán)節(jié)。

視頻創(chuàng)作本質(zhì)上是一項(xiàng)高門檻、長流程的專業(yè)工作。一個(gè)完整的視頻，從前期的腳本構(gòu)思、角色設(shè)定、分鏡拆解，到中期的鏡頭設(shè)計(jì)、動(dòng)作銜接、畫面風(fēng)格統(tǒng)一，再到后期的剪輯、配音和節(jié)奏調(diào)整，背后需要系統(tǒng)的創(chuàng)作方法和專業(yè)能力。

AI雖然讓視頻生成變得更容易，但對大多數(shù)普通人來說，真正的難點(diǎn)并不在于生成，而在于如何搭建敘事、設(shè)計(jì)鏡頭語言，并組裝成一支表達(dá)清晰的好視頻。

方晨認(rèn)為，AI大模型會(huì)由頭部公司主導(dǎo)，而機(jī)會(huì)點(diǎn)在于解決生成內(nèi)容不可控、難修改的問題。

基于這一判斷，產(chǎn)品將視頻創(chuàng)作流程進(jìn)行了重新拆解。Anijam通過AI，將原本割裂、復(fù)雜的創(chuàng)作流程進(jìn)行整合，讓用戶通過更簡單的交互完成完整的視頻生產(chǎn)。

Anijam在后臺(tái)整合了多個(gè)第三方大模型，并在Agent流程編排、后編輯算法及用戶體驗(yàn)優(yōu)化上進(jìn)行了優(yōu)化。

用戶只需輸入一句自然語言，例如“制作一段孫悟空三打白骨精的視頻”，系統(tǒng)就會(huì)自動(dòng)完成從故事大綱生成、視覺概念設(shè)計(jì)，到分鏡腳本拆解、關(guān)鍵幀生成、視頻片段制作及最終合成的完整流程。

整個(gè)過程以畫布為載體形式，用戶可以在任意環(huán)節(jié)介入修改。例如調(diào)整畫風(fēng)、增刪角色設(shè)定，或?qū)︾R頭細(xì)節(jié)進(jìn)行優(yōu)化。

在這一過程中，系統(tǒng)會(huì)自動(dòng)識(shí)別故事中的關(guān)鍵元素，包括角色、場景、道具及風(fēng)格，并基于此生成完整的分鏡鏡頭。每一個(gè)鏡頭都會(huì)包含場景描述、角色狀態(tài)、鏡頭語言等信息。

創(chuàng)作者不僅可以看到每個(gè)分鏡的大致效果，還可以通過自然語言進(jìn)行修改，例如調(diào)整鏡頭視角、改變構(gòu)圖，或者替換局部元素等。同時(shí)，系統(tǒng)會(huì)自動(dòng)生成每個(gè)分鏡的關(guān)鍵幀，并支持逐鏡頭預(yù)覽與修改。

這也是Anijam的關(guān)鍵能力之一，即從抽卡式生成視頻走向“可控編輯”。

傳統(tǒng)AI視頻生成往往依賴反復(fù)生成整段內(nèi)容，一旦某一幀不滿意，需要整體重來。而Anijam強(qiáng)調(diào)“局部可編輯”，例如只修改角色表情，而不影響動(dòng)作或背景。

Anijam正在優(yōu)化AI驅(qū)動(dòng)的視頻編輯能力——不僅支持局部修改，還在嘗試構(gòu)建AI的自反饋機(jī)制。在方晨的規(guī)劃中，Anijam未來會(huì)爭取讓AI自動(dòng)評價(jià)視頻生成效果，扮演一個(gè)“第三方AI導(dǎo)演”，對AI工具生成的鏡頭質(zhì)量打分，并反向優(yōu)化生成過程，通過“AI指導(dǎo)AI”來減少人工調(diào)試的次數(shù)。

在產(chǎn)品形態(tài)上，Anijam同時(shí)提供桌面端與移動(dòng)端。Web端承載更復(fù)雜的創(chuàng)作與編輯能力，適合長流程生產(chǎn)。移動(dòng)端則以對話式交互為主，界面更輕量，適配高頻內(nèi)容創(chuàng)作者。團(tuán)隊(duì)還在構(gòu)建創(chuàng)作者社區(qū)，將優(yōu)質(zhì)內(nèi)容沉淀為模板，供用戶復(fù)用。

當(dāng)前產(chǎn)品已支持最長5至10分鐘的視頻生成，具體耗時(shí)取決于內(nèi)容復(fù)雜度。一條約2分鐘的視頻，生成過程可能需要數(shù)十分鐘至一小時(shí)。

在商業(yè)模式上，產(chǎn)品采用分層訂閱模式，覆蓋不同強(qiáng)度的創(chuàng)作需求，從25到60美元不等，價(jià)格區(qū)間的提升，本質(zhì)上對應(yīng)的是算力額度與生成能力的差異。

隨著用戶與Agent的持續(xù)交互，系統(tǒng)會(huì)積累大量與創(chuàng)作相關(guān)的數(shù)據(jù)，包括用戶偏好、風(fēng)格選擇、修改路徑等。這些數(shù)據(jù)將被進(jìn)一步結(jié)構(gòu)化，轉(zhuǎn)化為“創(chuàng)作記憶”，并嵌入到Agent中，使其逐步具備個(gè)性化能力。

Anijam試圖實(shí)現(xiàn)的，是用一句話啟動(dòng)創(chuàng)作，用AI完成生產(chǎn)，并對每一幀內(nèi)容進(jìn)行可控修改，同時(shí)在持續(xù)使用中不斷變得更高效。

Founder思考

AI視頻賽道仍處于早期階段，時(shí)間窗口就是壁壘

視頻大模型的持續(xù)進(jìn)步是確定的趨勢，這對所有入局的玩家來說都是紅利。真正的差異不在模型本身，而在模型之外的能力構(gòu)建，例如后編輯能力、Agent流程編排，以及如何讓生成內(nèi)容變得可用、可修改。相比單純調(diào)用模型，如何讓生成內(nèi)容變得可用、可修改，才是產(chǎn)品競爭的核心。

這一賽道還處在早期階段，產(chǎn)品還不完美，仍需要用戶大量參與修改。在這個(gè)階段，最該擔(dān)心的不是競爭，而是效率。要盡快進(jìn)入市場、獲取用戶，并在真實(shí)使用中積累數(shù)據(jù)與認(rèn)知。

創(chuàng)業(yè)公司與大廠競爭的關(guān)鍵，是要更早跑起來，形成用戶留存與數(shù)據(jù)沉淀。

參考圖像生成市場的發(fā)展路徑，AI視頻領(lǐng)域未來也不會(huì)出現(xiàn)一家壟斷的格局，而是由多家廠商分占不同份額。市場結(jié)構(gòu)可能更加均衡，每家占據(jù)一部分用戶與場景，而不是單一平臺(tái)占據(jù)絕大多數(shù)份額。

視頻Agent的核心不只是生成好視頻，而是“講好故事”

當(dāng)前AI視頻的瓶頸，并不只是畫面生成能力，而是敘事能力。

讓模型在兩分鐘內(nèi)清晰講述一個(gè)完整故事，本身就是一件難度極高的事情。這意味著，真正的挑戰(zhàn)不在于生成單個(gè)片段，而在于如何用導(dǎo)演語言組織內(nèi)容，講述用戶的故事。

未來的創(chuàng)作者工具不再只是提供功能，而是成為用戶的創(chuàng)作伙伴。隨著創(chuàng)作者與Agent持續(xù)交互，系統(tǒng)會(huì)積累用戶在創(chuàng)作過程中的行為數(shù)據(jù)，包括偏好、修改邏輯與經(jīng)驗(yàn)。Agent可以逐漸理解用戶意圖，甚至提前完成部分創(chuàng)作決策，最終演化為一個(gè)具備記憶與進(jìn)化能力的“數(shù)字分身”。

Anijam的目標(biāo)并不只是做一個(gè)工具，而是成為類似Adobe的創(chuàng)作平臺(tái)。通過技術(shù)重塑創(chuàng)作流程，在提升效率、降低門檻的同時(shí)，承載更大規(guī)模的內(nèi)容生產(chǎn)與創(chuàng)作者生態(tài)，從而讓更多人參與創(chuàng)作，并從中獲得價(jià)值。

AI將推動(dòng)創(chuàng)作平權(quán)，但注意力仍集中頭部

隨著Agent能力的進(jìn)一步提升，視頻創(chuàng)作將逐漸從“人不斷參與反饋”的過程，轉(zhuǎn)變?yōu)楦詣?dòng)化的生產(chǎn)模式。未來甚至可能出現(xiàn)“Agent替人反饋”的情況。用戶只需提出需求，其余由系統(tǒng)自行完成迭代與優(yōu)化。

AI正在降低創(chuàng)作門檻，讓更多人能夠參與內(nèi)容生產(chǎn)。類似短視頻平臺(tái)的出現(xiàn)，使原本無法進(jìn)入院線的創(chuàng)作者獲得了表達(dá)空間，這是一次創(chuàng)作平權(quán)的推進(jìn)。

但與此同時(shí)，注意力分配并不會(huì)完全平均。院線與短視頻并非替代關(guān)系，而是新增渠道，頭部內(nèi)容依然會(huì)集中流量與商業(yè)價(jià)值。因此，AI帶來的不是“平均化”，而是在擴(kuò)大供給的同時(shí)，繼續(xù)強(qiáng)化頭部效應(yīng)。

商業(yè)模式將從“賣算力”走向“按結(jié)果付費(fèi)”

目前的視頻生成成本仍然很高昂，但隨著后續(xù)的需求增加和技術(shù)進(jìn)步，價(jià)格會(huì)逐步下滑。

一方面，大規(guī)模的需求會(huì)持續(xù)壓低成本；另一方面，模型層面的優(yōu)化與加速將顯著減少算力消耗，例如通過架構(gòu)優(yōu)化、硬件協(xié)同等方式，將原本需要大量token的生成過程大幅壓縮。這意味著，同樣一段視頻所需的計(jì)算資源可以實(shí)現(xiàn)數(shù)量級下降，從而帶動(dòng)整體價(jià)格快速走低，進(jìn)一步推動(dòng)AI視頻應(yīng)用的普及。

在商業(yè)模式上，當(dāng)前以算力為核心的計(jì)費(fèi)方式，本質(zhì)上是階段性形態(tài)。隨著技術(shù)成熟與成本下降，未來更可能轉(zhuǎn)向“按結(jié)果付費(fèi)”——即用戶在對AI視頻滿意并愿意下載時(shí)，才為最終產(chǎn)出買單，而非為生成過程中的token消耗付費(fèi)。

這一模式的成立，依賴于產(chǎn)品在質(zhì)量、成本與速度之間達(dá)到平衡，一旦生成結(jié)果足夠穩(wěn)定且可控，用戶的付費(fèi)邏輯也會(huì)隨之發(fā)生轉(zhuǎn)變。

從動(dòng)畫創(chuàng)作者出發(fā)，撬動(dòng)更廣泛的內(nèi)容人群

Anijam選擇從動(dòng)畫類型（animation）切入。原因在于，這一群體本身已經(jīng)習(xí)慣數(shù)字化創(chuàng)作流程，對AI工具的接受度更高，相比實(shí)拍視頻創(chuàng)作者，遷移成本更低。同時(shí)，這類用戶往往具備較強(qiáng)的創(chuàng)作意愿，是早期最容易被激活的一批人。

在更廣泛的用戶層面，團(tuán)隊(duì)觀察到，海外市場存在大量“輕創(chuàng)作用戶”——包括副業(yè)創(chuàng)作者、內(nèi)容愛好者等，他們具備較強(qiáng)的內(nèi)容生產(chǎn)意愿，并且已經(jīng)在YouTube、Instagram等平臺(tái)實(shí)現(xiàn)初步商業(yè)化。

方晨認(rèn)為，在B端專業(yè)內(nèi)容公司之外，to C創(chuàng)作者同樣具備付費(fèi)能力與增長潛力。

另外，動(dòng)畫與真人視頻在技術(shù)難度上存在明顯差異。盡管兩者在生成時(shí)長上相近，但真人視頻對質(zhì)量的要求更高，例如需要跨越“恐怖谷效應(yīng)”，同時(shí)在細(xì)節(jié)、銜接與轉(zhuǎn)場上更接近真實(shí)，這使得整體實(shí)現(xiàn)難度顯著提升。相比之下，動(dòng)畫在風(fēng)格容錯(cuò)與表達(dá)上更容易達(dá)到可用水平。

從長期來看，真人視頻仍然是更大的市場方向。隨著技術(shù)成熟與行業(yè)方案逐步完善，真人視頻的需求一定會(huì)釋放，我們未來也會(huì)進(jìn)入這一領(lǐng)域。

封面來源｜企業(yè)官方

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.