![]()
科技大廠既眼紅AI視頻的好生意,沉重的算力消耗也讓人望而卻步。
文|《中國企業(yè)家》見習(xí)記者 林秋藝
記者 王怡潔
見習(xí)編輯|李原編輯|何伊凡
圖片來源|視覺中國
AI短劇帶來的極致成本優(yōu)勢與工業(yè)化生產(chǎn)效率,引爆了資本熱情,也讓AI視頻賽道格局重構(gòu)。
4月初,一匹黑馬殺出:視頻生成模型HappyHorse-1.0在第三方測評平臺Artificial Analysis登頂,文生視頻Elo得分1333、圖生視頻Elo得分1392,雙雙超越字節(jié)跳動Seedance 2.0與快手可靈,成為不容忽視的新變量。
4月10日中午,阿里下場“認(rèn)領(lǐng)”HappyHorse為“ATH事業(yè)群”旗下的AI創(chuàng)新事業(yè)部自研,API將在4月30日開放。
此前,阿里并非視頻生成的核心玩家。但3月16日,阿里新成立以Token 為核心的“ATH事業(yè)群”后,提升多模態(tài)能力變成了拉高Token效率的抓手——而HappyHorse可視為這場戰(zhàn)略大轉(zhuǎn)向的重磅成果之一。
不只阿里,科技巨頭正在視頻生成賽道集體壓境。
憑借Seedance系列的生成質(zhì)量與成熟商業(yè)化,字節(jié)跳動已構(gòu)筑起顯著壁壘。據(jù)了解,火山引擎面向企業(yè)開放的Seedance API接口,有些機構(gòu)得到的最低年消費門檻高達1000萬元。
以高門檻開放API的底氣,來自市場的極度供不應(yīng)求。《中國企業(yè)家》獲悉,在火山引擎近期的招商會上,許多城市與火山引擎和視頻生成業(yè)務(wù)洽談合作,有城市為此投入了數(shù)千萬、上億元資金,將算力支持作為招商引資的重要配套。
另一巨頭騰訊也已下場。知情人士向《中國企業(yè)家》透露,騰訊挖走了Seedance開發(fā)團隊中的數(shù)名核心成員,計劃在5月推出混元視頻大模型新版本,與Seedance正面對壘。“5月的視頻模型賽道,將會格外熱鬧。”
阿里認(rèn)真了
HappyHorse亮相之前,阿里雖有通義萬相視頻模型,但表現(xiàn)始終不溫不火。作為大模型生態(tài)的附屬功能,萬相此前在清晰度、運動連貫性、長視頻穩(wěn)定性等核心指標(biāo)上,與Seedance、快手可靈等有明顯差距,也未打通專屬商業(yè)化場景。
這一次,阿里好像認(rèn)真了。HappyHorse采用150億參數(shù),將文本、視頻、音頻三種模態(tài)Token置于同一序列聯(lián)合建模,從底層解決了音畫不同步、語氣與表情不匹配等問題。
“它的物理模擬更貼近真實環(huán)境。”一位測評人士告訴《中國企業(yè)家》。另外,HappyHorse原生支持七國語言唇形同步,詞錯誤率顯著降低。同時,它在成本與速度上表現(xiàn)優(yōu)異:單張H100生成5秒1080p視頻約38秒,DMD-2蒸餾技術(shù)將去噪步驟壓縮到了8步。
![]()
但HappyHorse的短板同樣突出。測評人士表示,在完成復(fù)雜動作與多人交互時,HappyHorse易出現(xiàn)肢體錯亂、軌跡不穩(wěn)。相比于Seedance,HappyHorse更擅長鏡頭呈現(xiàn),不擅長動作敘事。
在應(yīng)用方面,HappyHorse的API尚未開放,在內(nèi)測中,其支持的時長僅為5~10秒,場景上限較低,更適合做短視頻、廣告、AI漫劇素材,還難以支撐劇情長片。其本地部署也有門檻,需配備H100或A100顯卡,消費級顯卡無法運行。
阿里突然在視頻模型戰(zhàn)場投入火力,意欲何為?相關(guān)人士表示,HappyHorse誕生于淘天未來生活實驗室,或許意味著阿里希望其能與電商場景碰撞融合。
阿里擁有完整的商品、商家、交易與廣告生態(tài),但商品視頻一直是中小商家的痛點:場景搭建、拍攝剪輯成本高,白底圖難以展現(xiàn)賣點。而AI視頻可批量生成多版本、多場景、多語言內(nèi)容,大幅降低了創(chuàng)作門檻。
更關(guān)鍵的是,阿里的商品詳情、用戶評價、搜索行為、轉(zhuǎn)化數(shù)據(jù)、直播表現(xiàn)等全鏈路信息,也可反向訓(xùn)練電商專屬視頻能力,讓HappyHorse成長為懂電商、能帶貨的內(nèi)容生產(chǎn)引擎。
但這條商業(yè)閉環(huán)要跑通,除了技術(shù)攻堅,還必須先解決阿里的算力問題。
接近阿里的人士向《中國企業(yè)家》透露,目前阿里內(nèi)部GPU分配非常緊張。“此前,像月之暗面作為阿里云大客戶,雖然與Qwen存在競爭,還是能獲得比較充足的算力。現(xiàn)在阿里要支持基模研發(fā)、電商、云服務(wù)多條戰(zhàn)線,未來要重新考慮GPU的投入產(chǎn)出比了。”
而視頻生成是算力消耗大戶,如果HappyHorse逐步開放推廣,算力需求更將指數(shù)級增長。這匹黑馬能跑多快、多遠,很大程度上取決于阿里能否破解算力這一核心瓶頸。
Seedance的好生意被盯上了
盡管挑戰(zhàn)重重,各大廠商仍爭相涌入AI視頻賽道,只因這是一門想象空間極強的生意。
目前,紅果短劇等平臺收一部劇的最高價格約2000元/分鐘,一部常規(guī)短劇的時長約120分鐘,價格約24萬元。而市場上AI短劇的外包制作報價已經(jīng)低至400元一分鐘,甚至有團隊用自動化工具實現(xiàn)了一天800~1000分鐘的漫劇內(nèi)容產(chǎn)出。
巨大的成本優(yōu)勢和生產(chǎn)效率,讓AI短劇成為資本追逐的熱點。有AI視頻制作公司負(fù)責(zé)人告訴《中國企業(yè)家》,短短半個月,就有好幾家資本來談收購、并購,目前給他們的估值已超5億元,但他們和合伙人都覺得,這個出價還不夠“美麗”。更有地方政府直接找上門來,希望直接獨家買斷公司的AI漫劇自動化生成工具。
Agent技術(shù)的進展,也正讓一人公司(OPC)大量涌現(xiàn)。幾個擅長高效使用AI工具的員工,便能頂?shù)蒙线^去一個甚至幾個團隊的工作量。各地政府敏銳地捕捉到了這一趨勢,紛紛對AI視頻、AIGC、AI短劇推出算力補貼、內(nèi)容獎勵、園區(qū)集聚等扶植政策,吸引OPC進入。
![]()
2月27日,武漢東湖高新區(qū)發(fā)布“微短劇八條”,對重大產(chǎn)業(yè)項目最高支持5000萬元,爆款短劇單部獎勵50萬元。
3月10日,上海市徐匯區(qū)發(fā)布《“AI+微短劇”產(chǎn)業(yè)扶持意見》,對頭部企業(yè)最高給予1000萬元發(fā)展支持,同時發(fā)放最高100萬元算力券、100萬元語料券,并為OPC減免工位費用。
3月13日,深圳市施行新版微短劇扶持政策:AIGC微短劇單項目最高資助200萬元。
需求的旺盛和政策扶植,讓字節(jié)成為最早嘗到甜頭的公司。據(jù)《中國企業(yè)家》了解,雖然火山引擎向大型影視公司、內(nèi)容制作公司、特定機構(gòu)等開放的Seedance API接口“白名單”,有些機構(gòu)被要求“最低消費”1000萬元/年,客戶仍趨之若鶩。
接近火山引擎的人士告訴《中國企業(yè)家》,地方政府已將算力扶持作為招商引資的重要配套。一些AI短劇公司以“拼盤”接入API,不少算力費用由政府出面解決,以吸引相關(guān)公司落地。
“有些城市采購了火山3000萬、7000萬,甚至過億的費用,用于內(nèi)容扶植。當(dāng)然其產(chǎn)出的內(nèi)容也將對本地稅收和GDP產(chǎn)生極大拉動,這個賬很好算的。”
清晰可見的變現(xiàn)路徑,疊加千億級的市場增量,點燃了巨頭間的競爭熱情。阿里、騰訊紛紛加碼AI視頻賽道,試圖從字節(jié)手中分走一杯羹。
接近騰訊的相關(guān)人士向《中國企業(yè)家》透露,混元視頻模型其實早就有了,“只是效果很差”。近期,騰訊痛下決心,“開出高薪,差不多把Seedance開發(fā)組整個挖走了”。新款模型大約5月上線,有望和Seedance掰掰手腕,在短時間內(nèi)實現(xiàn)技術(shù)突破。
依托騰訊生態(tài),混元新視頻模型還有望深度融入到視頻號的內(nèi)容生產(chǎn)、分發(fā)、商業(yè)化全鏈路,放大騰訊的內(nèi)容生產(chǎn)力與商業(yè)變現(xiàn)空間。
視頻模型的高風(fēng)險抉擇
雖然所有人都看到了AI視頻在短劇、電商、廣告等領(lǐng)域打開的萬億級商業(yè)潛力,但這條賽道的燒錢速度,也遠超想象。投入矛盾與定價分化,以及擺在巨頭面前的規(guī)模化盈利困境,正在考驗著各家的平衡智慧。
雖然火山引擎的收入不菲,但其算力成本負(fù)擔(dān)依然沉重,收入中的絕大部分,都要用來采購GPU和支付電力成本。
4月,火山引擎總裁譚待告訴《中國企業(yè)家》:“我們?nèi)ツ暌呀?jīng)修改了商業(yè)計劃,把目標(biāo)提升了不少。但目前我們還沒有做3年的盈利規(guī)劃,暫時沒有這方面的具體安排。”
OpenAI關(guān)停Sora,更給狂熱的市場潑下一盆冷水。視頻生成的算力消耗,是大模型的上百倍甚至上千倍,即便全球最具財力的科技公司,也難以承受這種無底洞式投入。
OpenAI雖宣稱,關(guān)停Sora是為了將資源轉(zhuǎn)向企業(yè)智能體、編碼工具與具身智能等方向,但業(yè)內(nèi)普遍認(rèn)為,成本與付費嚴(yán)重倒掛才是核心原因:Sora單條1080p的視頻生成成本約0.5~1美元,而用戶平均付費意愿不足0.1美元,根本無法支撐持續(xù)運營。
更深層的挑戰(zhàn),還來自于科技大廠技術(shù)路線的高風(fēng)險抉擇。業(yè)內(nèi)人士向《中國企業(yè)家》指出:多模態(tài)任務(wù)過度消耗算力,在Token用量已經(jīng)暴漲的情況下,廠商有再多算力依舊不夠燒,要把算力留給誰,就成了關(guān)鍵問題。
由于忌憚視頻的無底洞式算力投入,Google始終不敢大規(guī)模開放API,也未推出獨立的視頻生成C端應(yīng)用。“去年Google的多模態(tài)路線備受推崇,但今年便在Agent浪潮下被Anthropic趕超,現(xiàn)在只能說勉強留在牌桌上。大模型的核心技術(shù)路線,往往需要提前一兩年布局,效果卻要滯后顯現(xiàn)。有時候真的像玄學(xué)。”
行業(yè)成本與收入失衡,近期利益和遠期發(fā)展,迫使所有玩家重新審視視頻模型的商業(yè)模式與定價邏輯,這也直接催生了行業(yè)內(nèi)的定價策略分化。
摩根大通曾判斷:頭部領(lǐng)先模型可以維持溢價,追趕者則不得不通過降價搶占市場份額。
Sora停服后,字節(jié)率先選擇漲價。4月8日,即夢宣布:基礎(chǔ)、標(biāo)準(zhǔn)、高級會員的月度積分分別從1080、4000、15000下調(diào)至725、2210、6160,積分縮水近六成,相當(dāng)于變相漲價。
相比之下,Google和快手則選擇用降價換市場:谷歌在3月底放出的Veo 3.1 Lite版本,將720p視頻生成價格壓至0.05美元/秒。可靈緊隨其后,推出會員限時8折優(yōu)惠,部分圖片生成功能甚至完全免費。
定價的兩極分化,本質(zhì)上是競爭烈度的直接體現(xiàn)。長期來看,平臺、API、廣告、電商都只是外層變量,決定勝負(fù)的關(guān)鍵因素仍然是:強化模型本身的同時,誰能在效果和成本之間找到最佳平衡點,誰能結(jié)合自身生態(tài),找到不可替代的落地場景。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.