網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

這家動(dòng)畫初創(chuàng)公司想讓開放式故事創(chuàng)作變得更簡(jiǎn)單

2026-04-13 23:12:03　來源: 至頂頭條

北京舉報(bào)

分享至

當(dāng)前生成式 AI 動(dòng)畫浪潮往往像是一場(chǎng)只能奏效一次的魔術(shù)。你輸入提示詞，視頻隨即生成，但如果結(jié)果不盡如人意——比如腳部動(dòng)作扭曲變形，這在 AI 生成內(nèi)容中是家常便飯——你唯一能做的就是換一個(gè)提示詞再試一次。這種"黑箱"模式，正是新興 3D 動(dòng)畫初創(chuàng)公司 Cartwheel 致力于打破的。

公司由 Andrew Carr 與 Jonathan Jarvis 聯(lián)合創(chuàng)立，兩人分別擁有 OpenAI 與谷歌的從業(yè)背景。他們希望構(gòu)建一個(gè)由 AI 承擔(dān)動(dòng)畫制作中繁瑣技術(shù)工作、同時(shí)將創(chuàng)作靈魂完整保留給藝術(shù)家的未來。

筆者就公司創(chuàng)立歷程、如何用 AI 定義"品味"，以及 2026 年動(dòng)畫領(lǐng)域所面臨的技術(shù)與創(chuàng)作挑戰(zhàn)，與 Carr 和 Jarvis 進(jìn)行了深度對(duì)話。

Cartwheel 的核心差異

據(jù)創(chuàng)始人介紹，這一領(lǐng)域最大的挑戰(zhàn)之一，是 3D 動(dòng)作數(shù)據(jù)極度匱乏——與用于訓(xùn)練 AI 模型的海量文本和圖像相比，差距懸殊。

"回顧各大科技公司的發(fā)展路徑，他們將模型建立在文字、音頻、圖像和視頻之上，因?yàn)檫@些數(shù)據(jù)量龐大，規(guī)律也更容易被發(fā)掘，"Jarvis 說，"我們知道這很難，但實(shí)際難度可能超出預(yù)期十倍乃至百倍。"

與其他聚焦于直接生成最終像素畫面的科技巨頭不同，Cartwheel 花費(fèi)數(shù)年時(shí)間深入研究人類的運(yùn)動(dòng)規(guī)律。他們的模型能夠理解動(dòng)作表演中的細(xì)微差異，將一段普通人在后院隨意起舞的 2D 視頻，轉(zhuǎn)化為精準(zhǔn)、逼真的 3D 骨骼動(dòng)畫。

從平面圖像躍升至 3D 資產(chǎn)，正是讓動(dòng)畫師重新掌握 AI 時(shí)代所缺失的那種掌控感的關(guān)鍵所在。

打破 AI 的"同質(zhì)化"困境

Cartwheel 的管理團(tuán)隊(duì)認(rèn)為，AI 內(nèi)容的"同質(zhì)化"本質(zhì)上是缺乏控制權(quán)的副產(chǎn)品。當(dāng)所有人都使用同一個(gè)生成器來制作視頻，最終輸出的結(jié)果難免大同小異。

"我們系統(tǒng)的輸出，天生就是為了讓人去編輯的。它是為人去觸碰、去操控而設(shè)計(jì)的。我們不希望有人輸入提示詞之后，動(dòng)畫就直接一路生成到底——那不是這項(xiàng)技術(shù)的意義所在，那很無聊，誰會(huì)去看呢？"Carr 說。

"因?yàn)榇蠹液苋菀咨鲜植⑦M(jìn)行編輯，同質(zhì)化問題其實(shí)就自然而然地消解了，"他補(bǔ)充道，"你可以換不同的角色、放進(jìn)不同的場(chǎng)景、改變畫面風(fēng)格、強(qiáng)化或弱化表演張力——這樣一來，同質(zhì)化根本就不是問題。"

Carr 和 Jarvis 表示，解決之道在于提供一個(gè)"控制層"，讓 AI 的輸出僅作為創(chuàng)作的起點(diǎn)。通過生成 3D 數(shù)據(jù)而非平面視頻，創(chuàng)作者可以在 AI 完成初步生成之后，自行調(diào)整光照、移動(dòng)鏡頭或修改角色姿態(tài)——讓這項(xiàng)技術(shù)成為一個(gè)強(qiáng)大的專業(yè)工具，而非藝術(shù)家的替代品。

AI 驅(qū)動(dòng)下的動(dòng)畫未來

除了提升動(dòng)畫制作效率、降低創(chuàng)作門檻，這家公司還著眼于一個(gè)他們稱之為"開放式敘事"或"開放式世界構(gòu)建"的概念。在當(dāng)代游戲和社交媒體領(lǐng)域，內(nèi)容需求已經(jīng)達(dá)到了人工動(dòng)畫根本無法滿足的規(guī)模。

Cartwheel 設(shè)想的未來中，角色不再只是被預(yù)設(shè)幾套固定動(dòng)作，而是由動(dòng)作模型驅(qū)動(dòng)，能夠?qū)崟r(shí)做出反應(yīng)與表演。這不再是一幀一幀地設(shè)計(jì)編排，更像是與一位真正理解場(chǎng)景意圖的數(shù)字演員共同進(jìn)行"排練"。

創(chuàng)始人表示，他們的終極目標(biāo)是彌合 2D 創(chuàng)意構(gòu)想與 3D 實(shí)際執(zhí)行之間的鴻溝。

"我們對(duì) Cartwheel 未來三年寄予的核心期望之一，是即便內(nèi)容在 2D 中創(chuàng)作、最終輸出也只是 2D 視頻，每個(gè)人都將在 3D 工作流中完成創(chuàng)作，"Carr 說。

通過聚焦"像素之下的那一層"，Carr 和 Jarvis 希望：隨著動(dòng)畫越來越自動(dòng)化，它也能變得越來越個(gè)性化。機(jī)器負(fù)責(zé)處理生物力學(xué)運(yùn)算和文件導(dǎo)出，而人類始終保有對(duì)品味、節(jié)奏與故事靈魂的最終話語權(quán)。

Q&A

Q1：Cartwheel 和其他 AI 動(dòng)畫工具有什么不同？

A：Cartwheel 的核心差異在于它生成的是 3D 骨骼動(dòng)畫數(shù)據(jù)，而非直接輸出最終視頻畫面。這意味著創(chuàng)作者可以在 AI 生成初稿后，自由調(diào)整光照、鏡頭角度和角色姿態(tài)，擁有真正意義上的編輯控制權(quán)。相比之下，大多數(shù)生成式 AI 工具采用"黑箱"模式，輸出結(jié)果無法靈活修改。

Q2：Cartwheel 是如何解決 3D 動(dòng)作數(shù)據(jù)稀缺問題的？

A：3D 動(dòng)作數(shù)據(jù)遠(yuǎn)比文本、圖像等數(shù)據(jù)稀缺，獲取難度超出預(yù)期十倍甚至百倍。Cartwheel 為此花費(fèi)數(shù)年時(shí)間專注研究人類運(yùn)動(dòng)規(guī)律，構(gòu)建能理解動(dòng)作細(xì)節(jié)的專屬模型，可將普通 2D 視頻（如手機(jī)拍攝的舞蹈片段）轉(zhuǎn)化為精準(zhǔn)的 3D 骨骼動(dòng)畫，從而繞開數(shù)據(jù)稀缺的瓶頸。

Q3：Cartwheel 的"開放式敘事"是什么意思？

A："開放式敘事"是 Cartwheel 對(duì)動(dòng)畫未來的核心愿景——角色不再依賴預(yù)設(shè)的固定動(dòng)作，而是由動(dòng)作模型驅(qū)動(dòng)，能夠根據(jù)場(chǎng)景實(shí)時(shí)反應(yīng)與表演。這一概念尤其適用于游戲和社交內(nèi)容領(lǐng)域，因?yàn)檫@些場(chǎng)景對(duì)內(nèi)容量的需求已超出人工動(dòng)畫的生產(chǎn)能力上限。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.