文 | 字母AI
我敢打賭,AI視頻生成這個行業(yè),要因為這一個免費開源的項目而變天了。
沒錯,我說的就是從6月下半旬開始在Github上爆火的OpenMontage。
這是一個專門用來給AI視頻生成準備的Harness工具,你把你的提示詞給它,它就能自動幫你完善成專業(yè)的AI視頻生成提示詞,并且還配有剪輯、配音等等一系列后期工作。
并且它跟OpenClaw一樣,會自動幫你挑視頻模型,在滿足你需求的前提下,它會想方設法地去降低整個工作流的成本。
根據(jù)OpenMontage官方的介紹,這是一部完全通過OpenMontage制作的電影級科幻預告片,包括了概念、劇本、場景規(guī)劃、Veo生成的動態(tài)片段、配樂以及Remotion合成。
除了這種概念藝術片之外,OpenMontage還能應用在實際產(chǎn)品宣傳上。
比如下面這個視頻,通過AI,生成了4張關于一個叫做VOID的腦機接口。OpenMontage會自動為它配上相關的產(chǎn)品介紹,還會把產(chǎn)品的數(shù)字概念加以動態(tài)演示。
到底是個什么東西?
現(xiàn)在市面上所有的AI視頻工具,不管是Sora、Runway、Kling還是Pika,本質(zhì)上都是片段生成器。你給它一句話,它給你吐出來一段幾秒鐘的素材。
但是這些工具給你的是“素材”,不是“成片”。
OpenMontage給你的,是一整個視頻制作團隊的完整視頻制作流程。
你跟它說“給我做一個60秒的科普視頻,講清楚黑洞是怎么形成的”,然后它就開始行動了。
? OpenMontage會先上網(wǎng)搜資料,找最新的研究,找觀眾最關心的問題,確保輸出的內(nèi)容不能是瞎編的
? 然后寫腳本,分鏡頭,算成本,完成這步以后它會問你,如果成本OK分鏡OK,那就繼續(xù)往下執(zhí)行
? OpenMontage開始生成畫面、找素材、配音、找音樂
? 根據(jù)生成的畫面自動剪輯、加字幕、做轉(zhuǎn)場、混音、調(diào)色
? 最后自己先檢查一遍,有沒有黑幀,聲音對不對,字幕準不準,沒問題了才把成片給你
整個過程就跟Claude Code一模一樣,你是甲方,OpenMontage是乙方全套團隊。
OpenMontage的核心是一套狀態(tài)機驅(qū)動的確定性制片系統(tǒng),每一步干什么、干到什么標準才能往下走,都寫死在程序里。
最底層是模型無關適配層。它把14家視頻生成API、10個圖像模型、4個TTS引擎、本地開源模型(WAN2.1、Hunyuan、CogVideo)、甚至免費公共素材庫,全部封裝成了統(tǒng)一的接口。
對上層流水線來說,用哪個模型生成的視頻其實無所謂,系統(tǒng)會自動根據(jù)鏡頭類型選最合適的模型、算成本。
中間層是52個專業(yè)工具。
比如事實核查的網(wǎng)絡搜索工具、鏡頭分析工具(自動抽幀識別景別、轉(zhuǎn)場、節(jié)奏點、語音停頓)、基于Remotion和FFmpeg的程序化剪輯引擎等等。
上層是技能工作流。它會規(guī)定整個生產(chǎn)過程里,研究階段要搜多少個來源、腳本要符合什么結(jié)構(gòu)、分鏡每個鏡頭必須包含哪些字段、什么情況要打回重寫、什么鏡頭用什么級別的模型等等。
整個流程跑在一個導演循環(huán)(Director Loop)里。
從你輸入需求開始,系統(tǒng)自動推進研究→腳本→分鏡→資產(chǎn)規(guī)劃→生成→剪輯→質(zhì)檢,每一步都有明確的驗收標準。
說白了,其他AI視頻工具是給你一個很厲害的攝像師,你自己還得當導演、當編劇、當剪輯、當制片;而OpenMontage是直接給你拉來了一整個成熟的劇組,你只需要說你想拍什么就行。
而且它跟OpenClaw一樣,可以隨意更換模型。你有Kling的key就用Kling,有Runway就用Runway。
你可能要問了,那我雖然有token,但我沒素材可咋辦啊?
沒關系,OpenMontage會用免費的圖片生成加動畫來填充畫面,甚至它還能從Archive.org、NASA、Wiki這些免費的地方,去找真實的歷史素材、紀錄片素材給你剪出來真正的“視頻”。
他們官方演示里做了一個60秒的皮克斯風格動畫短片,有角色有劇情有配音有字幕,總共才花了1.33美元。還有一個產(chǎn)品廣告片,只用了一個OpenAI的key,花了0.69美元。
甚至還可以完全不用花一分錢的,用免費素材加本地配音做出來的紀錄片風格視頻。
還有一個被所有人忽略的點:它是“參考驅(qū)動”的,不是“prompt驅(qū)動”的。
這句話的意思是,你不用給OpenMontage說什么“電影感、4K、黃金時刻、景深、85mm鏡頭”這種話。
你直接把你喜歡的一個短視頻或者抖音鏈接甩給它,說“給我做個跟這個節(jié)奏差不多的,但是內(nèi)容講量子計算”。
它會自動去分析那個參考視頻的節(jié)奏、鉤子、結(jié)構(gòu)、鏡頭語言,然后給你出幾個方案,告訴你哪些地方保留,哪些地方改了,要花多少錢,做出來大概是什么樣。
你不用當prompt工程師,你當甲方就行。
因何而爆火?
OpenMontage的創(chuàng)建者是calesthio,全稱為Calesthio AI Labs。calesthio在上傳OpenMontage之前,已經(jīng)開發(fā)了許多個開源項目,比如個人情報Agent Crucix(10.3k stars),以及分析工具BreakoutAnalysis、期權(quán)交易工具OptionsCanvas、Claude Code 上下文記憶工具SessionAnchor等等 。
其實OpenMontage這個項目早在3月份的時候就在Github上創(chuàng)建了,但直到6月底才開始爆火。
原因在于,早期的OpenMontage只是個框架,提出了這種以Agent形式去生成視頻的流程,不過并不能真正幫你執(zhí)行。
直到6月,calesthio提交了23個commit,還合并了15個社區(qū)PR,這才讓OpenMontage變成今天的樣子。
6月22日到6月26日這幾天,OpenMontage幾乎每天都要斬獲3000多顆星星,其火爆的趨勢不亞于3月份的OpenClaw。
OpenMontage能爆火還有一個原因,就是它的README寫得非常通俗易懂。
一般的項目,它的README往往都是各種安裝依賴、使用說明,OpenMontage不一樣,它直接把生成的視頻和提示詞放進了README開頭,是好是壞你一眼便知。
![]()
接著它連續(xù)放了多個樣片案例,并且每個案例都寫清楚生產(chǎn)方式和成本。
另外,calesthio還發(fā)現(xiàn)中國的AI視頻生成市場很大,于是在6月24日,特地用中文重新寫了一篇README。其目的不言而喻。
![]()
在OpenMontage出現(xiàn)之前,AI視頻生成是一件非常麻煩的事情。
首先你得先選平臺。用Sora?得有ChatGPT會員,還不一定排得上隊,生成10秒視頻等半小時,效果還不穩(wěn)定。用Runway?一分鐘視頻大幾十塊錢,生成完了還得自己下載下來。
好不容易生成了幾段素材,噩夢才剛剛開始。你得把這幾段幾秒鐘的視頻下載下來,打開剪映或者PR,自己拼到一起。然后得自己寫文案、自己配音,還得自己找BGM。
雖然此前Seedance 2.0、可靈還有Sora 2都有類似的自動增加配音、自動根據(jù)素材生成視頻,然而由于各種合規(guī)問題和素材質(zhì)量問題,到頭來很多事情還得自己在剪輯時加入。
同一段提示詞同一批素材,如果你想換個模型試試,那對不起,所有流程重來一遍。
說白了,之前的AI視頻,本質(zhì)上還是“大公司建游樂場賣門票”。你想進來玩,可以,得按我的規(guī)矩來,得買我的票,玩什么項目我說了算,而且有些地方還不讓你帶零食進來。
OpenMontage不一樣,它是免費開源的,一切素材解釋權(quán)在你。
它把話語權(quán)從大公司手里奪回來了。
視頻生成行業(yè)真要變天了?
很多人可能會問了,不就是一個開源工具嗎,至于說的這么邪乎?
可以肯定的一點是,OpenMontage會徹底改變,整個行業(yè)的競爭維度,就像我們從Chatbot時代跨越到Agent時代一樣。
之前所有人都在卷模型,卷畫質(zhì),卷時長,卷物理規(guī)律對不對。
現(xiàn)在突然有人告訴你,這些都是基礎能力,是入場券而已。我是用戶,我要的是片子,我要的不是素材,所以你卷那些沒用,我要看你們卷的是成片、是分鏡。
就像手機行業(yè),前幾年大家都在卷處理器,卷攝像頭像素,現(xiàn)在處理器夠用了,大家開始卷系統(tǒng),卷影像算法,卷充電速度,卷誰能把用戶體驗做好。
視頻生成這個行業(yè),馬上就要進入這個階段了。
以后再出來一個新模型,說我能生成10秒視頻,畫質(zhì)8K,根本沒人會驚訝。大家只會在意它能不能接OpenMontage?多少錢一秒?跟其他模型比有什么優(yōu)勢?
還有一個潛在的影響,專業(yè)視頻制作這個行業(yè),也要開始洗牌了。
很多人說AI替代不了剪輯師,替代不了導演。沒錯,頂級的導演和剪輯師永遠不會被替代,但是90%的中低端視頻制作,真的要沒了。
當年美圖秀秀出來的時候,也有人說替代不了影樓,。當年剪映出來的時候,也有人說替代不了專業(yè)剪輯師。
歷史永遠是這樣。新技術出來的時候,一開始大家都覺得玩具一樣,然后突然有一天你發(fā)現(xiàn),它已經(jīng)把你能干的活都干了。
不過也說句實在的。
在體驗的過程中,我發(fā)現(xiàn)OpenMontage還是有很多bug的,而且很多功能也不完善,做出來的視頻也不是每次都能達到專業(yè)水準。
但是,開源的力量從來不是一開始就完美,而是它一旦跑起來,就會有全世界的人一起給它添磚加瓦,發(fā)展速度會超出所有人的想象。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.