網易首頁 > 網易號 > 正文 申請入駐

阿里的世界模型發布, HappyOyster 全面解讀

0
分享至

PRODUCT

阿里新出了個世界模型,叫 HappyOyster,中文名「快樂生蠔」

HappyOyster 實操畫面

上面這段,就是 HappyOyster 跑出來的世界。能用一句話生成,能用 WASD 走進去,能在生成過程里持續插指令改劇情,能保存下來分享給別人二創

一句話,給出能走進去的世界

「快樂生蠔」這個名字聽起來有點怪,其實大有來頭

The world is your oyster. — 莎士比亞

這句話出自莎士比亞 1597 年的《溫莎的快活婦人》。四百年來,一直被譯作「世界是你的牡蠣」,本意是世界任你打開。HappyOyster 把這句比喻,做成了字面意義上的產品,然后這句話,也是產品的 slogan


HappyOyster 官網首頁

這個產品的背后,是阿里 ATH 創新事業部,跟之前屠榜 Artificial Analysis 視頻競技場的 HappyHorse 同屬一個部門。當前處于 Beta 內測階段,通過官網 happyoyster.cn 加入候補名單

四大核心能力速覽

官方把 HappyOyster 的能力歸到四個支點

Wander 漫游一句話或一張圖生成 3D 空間,WASD 走進去探索。1 分鐘、480p

Direct 導演生成過程里持續插入指令,實時改鏡頭、改劇情。3 分鐘、480p 或 720p

Create 創造交付的是一個可走進去的完整世界,越過了視頻生成工具這一站

Share 分享用戶生成的世界可保存、可被其他人二創,形成創作者生態

下面分別看具體效果

Wander 漫游:走進畫面里

輸入一句話或一張圖,生成一個具備物理一致性的 3D 空間。鼠標控制視角,WASD 控制移動方向,第一人稱視角自由探索

視角轉動后場景內物體位置穩定,光照隨視角連續變化。突破初始畫框的邊界后,世界仍在繼續生成

第一個例子,用梵高《星夜》做生成,走進畫里之后,柏樹和教堂都立了起來,星空旋渦還在頭頂轉,畫風一直是梵高的

走進梵高《星夜》漫游

切換到寫實風格也能跑,第一人稱在金色廢墟里走,藤蔓掛在殘柱上。光跟著視角換,畫面跟 3A 游戲放一起也不違和

寫實金色廢墟漫游

這里的體驗,跟玩游戲的體驗比較像,區別在于,游戲世界是開發團隊提前幾年做好的。HappyOyster 的世界,是模型在你按下方向鍵的同時,一幀一幀實時算出來的

當然,除了名畫和寫實,Wander 還能跑卡通、像素、童話等風格,畫質之間沒有明顯斷層

Direct 導演:在生成中改劇情

輸入一個初始 prompt 啟動生成后,可以在視頻流任意節點繼續下達新指令。指令可以是文字、語音或圖像,能實時切換鏡頭、調整角色動作、改變劇情走向

傳統視頻生成的工作流是,寫 prompt → 等渲染 → 收成片,是一次性的。Direct 模式讓用戶能在生成過程里持續干預,畫面持續演化,不需要重啟生成

第一個例子是卡通鱷魚飛行員。在生成過程里,輸入了一句新指令,畫面里是一只戴風鏡的鱷魚飛行員,開著飛機看夕陽。中途用戶輸入「Show the whole helicopter」(展示整架直升機)。下一幀鏡頭拉遠,整架直升機出現。鱷魚變成駕駛艙角落里的小人,手在儀表盤上

鱷魚飛行員,中途輸入「Show the whole helicopter」

中文敘事題材也能跑,下面這個是「金手指系統」開局短劇

中文短劇「第一個任務,買車」

第一幀少年坐在簡陋房間里被金光籠罩,下一幀彈出系統 HUD 界面,再下一幀切到停車場。畫面、中文字幕「第一個任務,買車」、系統 UI 同時生成

效果上等于把用戶,從觀眾席挪到了導演位上

Create 和 Share:從視頻到世界

Create 和 Share 這兩塊能力更接近一句產品哲學,官方把它叫做「打破第四面墻」

比如「我的世界」是一款游戲,也可以是一個世界,hhhh

過去幾年,生成式 AI 經歷了幾次躍遷:生成文本、生成圖像、生成視頻。但這些能力都停留在「生成像素」這一層。畫面越來越逼真,用戶能做的依然只有一件事:看

那么,為什么不能讓用戶能推門、走進畫面、親手改寫,能離開又回來,也能帶朋友進去

如果我們把小生蠔做成視頻,也蠻有意思的,比如下面這個

真 - 快樂生蠔

一只戴著生蠔殼當帽子的小動物,在森林里走。每走兩步,樣子換一遍。背景里的花、草、菌類、倒在地上的同類,一幀一換。整段沒有劇情,畫面一直在往前推

技術路徑

阿里給出的技術能力歸納是三點

長時序世界建模:通過海量長視頻數據,模型學到了真實世界的狀態轉移規律,能在長時間跨度里,保持高保真的動態場景生成

實時交互控制:在建模初始,就設計了多樣的控制信號(文本、Action、圖像等)。讓外部指令持續作用于世界狀態演化,而不只作用于初始條件

音視頻聯合生成:視覺和聽覺協同建模、同步生成

阿里把這一組能力描述為「從『被動生成內容』轉變為『主動模擬、并讓用戶參與世界演化』」

世界模型這個賽道,谷歌 DeepMind 2025 年 8 月發布 Genie 3 時定下了一個起點:720p、24fps、幾分鐘環境一致性。能用文本指令在畫面里加天氣、加角色、觸發事件,谷歌把這種能力叫做「promptable world events」

HappyOyster 在官方表述里跟 Genie 3 處在同一方向上,做的是實時交互式世界建模。阿里把擴展點放在兩處:一是在文本、控制信號、圖像等多源條件下,做一致的時序建模。二是引入音視頻聯合生成,把世界模擬從單一視覺通道,擴展到多感知協同

前面 Direct 模式那段「Show the whole helicopter」改鏡頭的演示,跟谷歌的 promptable world events 是同一件事的產品化呈現

剩下的判斷要等更多公開測評

當前能力邊界

世界模型整體處于早期階段,HappyOyster 也不例外。把當前能跑通的事,和暫時跑不通的事羅列清楚,方便心里有數

當前能跑通的

→ Wander 漫游,最長 1 分鐘連續位移和鏡頭控制,分辨率 480p

→ Direct 導演,連續生成 3 分鐘以上畫面,分辨率可選 480p 或 720p

→ 多模態輸入,文字、圖像、語音都能作為指令

→ 音視頻聯合生成,畫面跟聲音同步出

→ 風格泛化,寫實、卡通、像素、名畫都能跑

→ 中文敘事和中文 UI 字幕的同時生成

→ 用戶生成的世界保存下來,開放給其他用戶二次創作

暫時跑不通的

漫游和導演兩個模式當前沒有打通。Wander 模式下能自由探索,但不能在探索過程里實時改寫場景規則。Direct 模式下能改劇情,但不能用 WASD 走進畫面里。阿里方面表示未來會做融合,現在不能

實時控制人物移動和鏡頭旋轉時,存在卡頓,流暢度還有提升空間

商業化路徑尚未明確。當前只對部分用戶開放早期訪問,定價和 API 開放節奏都還沒公布

這背后是阿里 ATH

HappyOyster 的研發團隊來自阿里 ATH(Alibaba Token Hub)創新事業部,跟之前那匹屠榜的 HappyHorse 同屬一脈

今年 3 月的時候,阿里巴巴 CEO 吳泳銘親自掛帥,成立了 ATH 事業群。下面整合了通義實驗室、MaaS 業務線、千問事業部、悟空事業部、AI 創新事業部五大板塊。吳泳銘在最新一季財報電話會上,給 ATH 設的目標是:未來五年,云和 AI 商業化的年收入要做到 1000 億美元

谷歌 Genie 3 把天花板放在那里,國產幾家在追。阿里 ATH 選了實時交互這一支,HappyOyster 是這條線上的第一個產品

莎士比亞那句話,被搬到 2026 年的世界模型里,似乎又多了一層意味

The world is your oyster, open it

快樂生蠔

官網入口

https://www.happyoyster.cn/

參考材料

HappyOyster 官網
https://www.happyoyster.cn/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1999年,69歲禹作敏獄中難耐孤寂,死前曾向李瑞環提出:我想回家

1999年,69歲禹作敏獄中難耐孤寂,死前曾向李瑞環提出:我想回家

華人星光
2026-04-20 09:59:15
炸翻全球軍界!沙特怒砸120億買斷中國神裝,美軍徹底被踢出局

炸翻全球軍界!沙特怒砸120億買斷中國神裝,美軍徹底被踢出局

風信子的花
2026-04-21 14:31:44
致敬傳奇!王治郅正式入選國際籃聯名人堂,諾維茨基一同入選

致敬傳奇!王治郅正式入選國際籃聯名人堂,諾維茨基一同入選

懂球帝
2026-04-21 20:06:06
外院縫合被同行怒批:瞎胡鬧,游醫水平!一個真讓做,一個真敢做

外院縫合被同行怒批:瞎胡鬧,游醫水平!一個真讓做,一個真敢做

新浪財經
2026-04-22 12:10:58
10大天規,不可打破,君子知命不算命!

10大天規,不可打破,君子知命不算命!

神奇故事
2026-04-20 19:27:24
突發:Claude Code把Pro用戶「踢」了

突發:Claude Code把Pro用戶「踢」了

AppSo
2026-04-22 07:49:03
男女同居后,大部分女性通常忍受不了男性這些行為

男女同居后,大部分女性通常忍受不了男性這些行為

阿凱銷售場
2026-04-22 11:44:56
又一個五常國,做出瘋狂決定,比日本都狠!俄羅斯:打的就是你

又一個五常國,做出瘋狂決定,比日本都狠!俄羅斯:打的就是你

揚子的故事屋
2026-04-22 10:58:16
決勝局53-17領先被翻!25歲范爭一9-10出局 43歲墨菲死里逃生狂歡

決勝局53-17領先被翻!25歲范爭一9-10出局 43歲墨菲死里逃生狂歡

風過鄉
2026-04-22 07:20:02
太陽:只要格林,一切關于申京的交易都免談!亞歷山大式交易再現

太陽:只要格林,一切關于申京的交易都免談!亞歷山大式交易再現

呀古銅
2026-04-22 10:33:48
郭士強現場考察,個人認為三名球員應進國家隊,21歲小將上榜

郭士強現場考察,個人認為三名球員應進國家隊,21歲小將上榜

男足的小球童
2026-04-21 18:16:37
馬刺主帥:目前只知道文班是腦震蕩,我們會采取正確的步驟處理

馬刺主帥:目前只知道文班是腦震蕩,我們會采取正確的步驟處理

懂球帝
2026-04-22 12:20:02
驚天內幕!中國專家揭露美國攻打伊朗的真正目的,竟然是這個!

驚天內幕!中國專家揭露美國攻打伊朗的真正目的,竟然是這個!

橙色書卷
2026-04-18 22:56:03
伯納烏不留舊人!皇馬高層拒絕穆里尼奧執教,巔峰已成過去時

伯納烏不留舊人!皇馬高層拒絕穆里尼奧執教,巔峰已成過去時

體育閑話說
2026-04-21 21:48:20
四川省教育廳新任命副廳長!

四川省教育廳新任命副廳長!

創作者_1494406553502
2026-04-22 11:22:00
鬧翻了!遼籃更衣室內訌,趙繼偉深夜2文“炮轟” 弗格打臉管理層

鬧翻了!遼籃更衣室內訌,趙繼偉深夜2文“炮轟” 弗格打臉管理層

小徐講八卦
2026-04-22 05:45:02
齊沃整活被痛批!恰爾汗奧盧獨造3球力挽狂瀾,國米3-2絕殺科莫

齊沃整活被痛批!恰爾汗奧盧獨造3球力挽狂瀾,國米3-2絕殺科莫

釘釘陌上花開
2026-04-22 05:00:39
西班牙打響“反以”第一槍后,匈牙利新總理:內塔敢來,必被逮捕

西班牙打響“反以”第一槍后,匈牙利新總理:內塔敢來,必被逮捕

墜入二次元的海洋
2026-04-22 09:53:44
近10年崩得最狠的專業:從年薪幾十萬到月薪兩千五!

近10年崩得最狠的專業:從年薪幾十萬到月薪兩千五!

燈錦年
2026-04-21 13:28:31
43歲李宗偉談羽聯改革:若改用15分制,說不定我也會復出

43歲李宗偉談羽聯改革:若改用15分制,說不定我也會復出

懂球帝
2026-04-22 10:47:23
2026-04-22 12:52:49
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
399文章數 50關注度
往期回顧 全部

科技要聞

凌晨突發!ChatGPT Images 2.0發布

頭條要聞

KTV服務員被指強奸14歲女生 官方通報

頭條要聞

KTV服務員被指強奸14歲女生 官方通報

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

復婚無望!baby黃曉明陪小海綿零交流

財經要聞

伊朗拒絕出席 特朗普宣布延長停火期限

汽車要聞

四款全球首秀+AI落地 大眾汽車集團在華轉型全面提速

態度原創

數碼
親子
游戲
手機
公開課

數碼要聞

官宣!追覓硅谷發布會定檔,4月27日-30日登陸北美

親子要聞

管不住,一身的反骨

預計680元起 黑旗RE典藏版內容曝光!雕像等超多好禮

手機要聞

小米盧偉冰:REDMI K90 Max官方300元的內存補貼會盡量延續

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版