![]()
當(dāng)前生成式 AI 動(dòng)畫浪潮往往像是一場(chǎng)只能奏效一次的魔術(shù)。你輸入提示詞,視頻隨即生成,但如果結(jié)果不盡如人意——比如腳部動(dòng)作扭曲變形,這在 AI 生成內(nèi)容中是家常便飯——你唯一能做的就是換一個(gè)提示詞再試一次。這種"黑箱"模式,正是新興 3D 動(dòng)畫初創(chuàng)公司 Cartwheel 致力于打破的。
公司由 Andrew Carr 與 Jonathan Jarvis 聯(lián)合創(chuàng)立,兩人分別擁有 OpenAI 與谷歌的從業(yè)背景。他們希望構(gòu)建一個(gè)由 AI 承擔(dān)動(dòng)畫制作中繁瑣技術(shù)工作、同時(shí)將創(chuàng)作靈魂完整保留給藝術(shù)家的未來。
筆者就公司創(chuàng)立歷程、如何用 AI 定義"品味",以及 2026 年動(dòng)畫領(lǐng)域所面臨的技術(shù)與創(chuàng)作挑戰(zhàn),與 Carr 和 Jarvis 進(jìn)行了深度對(duì)話。
Cartwheel 的核心差異
據(jù)創(chuàng)始人介紹,這一領(lǐng)域最大的挑戰(zhàn)之一,是 3D 動(dòng)作數(shù)據(jù)極度匱乏——與用于訓(xùn)練 AI 模型的海量文本和圖像相比,差距懸殊。
"回顧各大科技公司的發(fā)展路徑,他們將模型建立在文字、音頻、圖像和視頻之上,因?yàn)檫@些數(shù)據(jù)量龐大,規(guī)律也更容易被發(fā)掘,"Jarvis 說,"我們知道這很難,但實(shí)際難度可能超出預(yù)期十倍乃至百倍。"
與其他聚焦于直接生成最終像素畫面的科技巨頭不同,Cartwheel 花費(fèi)數(shù)年時(shí)間深入研究人類的運(yùn)動(dòng)規(guī)律。他們的模型能夠理解動(dòng)作表演中的細(xì)微差異,將一段普通人在后院隨意起舞的 2D 視頻,轉(zhuǎn)化為精準(zhǔn)、逼真的 3D 骨骼動(dòng)畫。
從平面圖像躍升至 3D 資產(chǎn),正是讓動(dòng)畫師重新掌握 AI 時(shí)代所缺失的那種掌控感的關(guān)鍵所在。
打破 AI 的"同質(zhì)化"困境
Cartwheel 的管理團(tuán)隊(duì)認(rèn)為,AI 內(nèi)容的"同質(zhì)化"本質(zhì)上是缺乏控制權(quán)的副產(chǎn)品。當(dāng)所有人都使用同一個(gè)生成器來制作視頻,最終輸出的結(jié)果難免大同小異。
"我們系統(tǒng)的輸出,天生就是為了讓人去編輯的。它是為人去觸碰、去操控而設(shè)計(jì)的。我們不希望有人輸入提示詞之后,動(dòng)畫就直接一路生成到底——那不是這項(xiàng)技術(shù)的意義所在,那很無聊,誰會(huì)去看呢?"Carr 說。
"因?yàn)榇蠹液苋菀咨鲜植⑦M(jìn)行編輯,同質(zhì)化問題其實(shí)就自然而然地消解了,"他補(bǔ)充道,"你可以換不同的角色、放進(jìn)不同的場(chǎng)景、改變畫面風(fēng)格、強(qiáng)化或弱化表演張力——這樣一來,同質(zhì)化根本就不是問題。"
Carr 和 Jarvis 表示,解決之道在于提供一個(gè)"控制層",讓 AI 的輸出僅作為創(chuàng)作的起點(diǎn)。通過生成 3D 數(shù)據(jù)而非平面視頻,創(chuàng)作者可以在 AI 完成初步生成之后,自行調(diào)整光照、移動(dòng)鏡頭或修改角色姿態(tài)——讓這項(xiàng)技術(shù)成為一個(gè)強(qiáng)大的專業(yè)工具,而非藝術(shù)家的替代品。
AI 驅(qū)動(dòng)下的動(dòng)畫未來
除了提升動(dòng)畫制作效率、降低創(chuàng)作門檻,這家公司還著眼于一個(gè)他們稱之為"開放式敘事"或"開放式世界構(gòu)建"的概念。在當(dāng)代游戲和社交媒體領(lǐng)域,內(nèi)容需求已經(jīng)達(dá)到了人工動(dòng)畫根本無法滿足的規(guī)模。
Cartwheel 設(shè)想的未來中,角色不再只是被預(yù)設(shè)幾套固定動(dòng)作,而是由動(dòng)作模型驅(qū)動(dòng),能夠?qū)崟r(shí)做出反應(yīng)與表演。這不再是一幀一幀地設(shè)計(jì)編排,更像是與一位真正理解場(chǎng)景意圖的數(shù)字演員共同進(jìn)行"排練"。
創(chuàng)始人表示,他們的終極目標(biāo)是彌合 2D 創(chuàng)意構(gòu)想與 3D 實(shí)際執(zhí)行之間的鴻溝。
"我們對(duì) Cartwheel 未來三年寄予的核心期望之一,是即便內(nèi)容在 2D 中創(chuàng)作、最終輸出也只是 2D 視頻,每個(gè)人都將在 3D 工作流中完成創(chuàng)作,"Carr 說。
通過聚焦"像素之下的那一層",Carr 和 Jarvis 希望:隨著動(dòng)畫越來越自動(dòng)化,它也能變得越來越個(gè)性化。機(jī)器負(fù)責(zé)處理生物力學(xué)運(yùn)算和文件導(dǎo)出,而人類始終保有對(duì)品味、節(jié)奏與故事靈魂的最終話語權(quán)。
Q&A
Q1:Cartwheel 和其他 AI 動(dòng)畫工具有什么不同?
A:Cartwheel 的核心差異在于它生成的是 3D 骨骼動(dòng)畫數(shù)據(jù),而非直接輸出最終視頻畫面。這意味著創(chuàng)作者可以在 AI 生成初稿后,自由調(diào)整光照、鏡頭角度和角色姿態(tài),擁有真正意義上的編輯控制權(quán)。相比之下,大多數(shù)生成式 AI 工具采用"黑箱"模式,輸出結(jié)果無法靈活修改。
Q2:Cartwheel 是如何解決 3D 動(dòng)作數(shù)據(jù)稀缺問題的?
A:3D 動(dòng)作數(shù)據(jù)遠(yuǎn)比文本、圖像等數(shù)據(jù)稀缺,獲取難度超出預(yù)期十倍甚至百倍。Cartwheel 為此花費(fèi)數(shù)年時(shí)間專注研究人類運(yùn)動(dòng)規(guī)律,構(gòu)建能理解動(dòng)作細(xì)節(jié)的專屬模型,可將普通 2D 視頻(如手機(jī)拍攝的舞蹈片段)轉(zhuǎn)化為精準(zhǔn)的 3D 骨骼動(dòng)畫,從而繞開數(shù)據(jù)稀缺的瓶頸。
Q3:Cartwheel 的"開放式敘事"是什么意思?
A:"開放式敘事"是 Cartwheel 對(duì)動(dòng)畫未來的核心愿景——角色不再依賴預(yù)設(shè)的固定動(dòng)作,而是由動(dòng)作模型驅(qū)動(dòng),能夠根據(jù)場(chǎng)景實(shí)時(shí)反應(yīng)與表演。這一概念尤其適用于游戲和社交內(nèi)容領(lǐng)域,因?yàn)檫@些場(chǎng)景對(duì)內(nèi)容量的需求已超出人工動(dòng)畫的生產(chǎn)能力上限。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.