PRODUCT
阿里新出了個世界模型,叫 HappyOyster,中文名「快樂生蠔」
HappyOyster 實操畫面
上面這段,就是 HappyOyster 跑出來的世界。能用一句話生成,能用 WASD 走進去,能在生成過程里持續插指令改劇情,能保存下來分享給別人二創
一句話,給出能走進去的世界
「快樂生蠔」這個名字聽起來有點怪,其實大有來頭
The world is your oyster. — 莎士比亞
這句話出自莎士比亞 1597 年的《溫莎的快活婦人》。四百年來,一直被譯作「世界是你的牡蠣」,本意是世界任你打開。HappyOyster 把這句比喻,做成了字面意義上的產品,然后這句話,也是產品的 slogan
![]()
HappyOyster 官網首頁
這個產品的背后,是阿里 ATH 創新事業部,跟之前屠榜 Artificial Analysis 視頻競技場的 HappyHorse 同屬一個部門。當前處于 Beta 內測階段,通過官網 happyoyster.cn 加入候補名單
四大核心能力速覽
官方把 HappyOyster 的能力歸到四個支點
Wander 漫游一句話或一張圖生成 3D 空間,WASD 走進去探索。1 分鐘、480p
Direct 導演生成過程里持續插入指令,實時改鏡頭、改劇情。3 分鐘、480p 或 720p
Create 創造交付的是一個可走進去的完整世界,越過了視頻生成工具這一站
Share 分享用戶生成的世界可保存、可被其他人二創,形成創作者生態
下面分別看具體效果
Wander 漫游:走進畫面里
輸入一句話或一張圖,生成一個具備物理一致性的 3D 空間。鼠標控制視角,WASD 控制移動方向,第一人稱視角自由探索
視角轉動后場景內物體位置穩定,光照隨視角連續變化。突破初始畫框的邊界后,世界仍在繼續生成
第一個例子,用梵高《星夜》做生成,走進畫里之后,柏樹和教堂都立了起來,星空旋渦還在頭頂轉,畫風一直是梵高的
走進梵高《星夜》漫游
切換到寫實風格也能跑,第一人稱在金色廢墟里走,藤蔓掛在殘柱上。光跟著視角換,畫面跟 3A 游戲放一起也不違和
寫實金色廢墟漫游
這里的體驗,跟玩游戲的體驗比較像,區別在于,游戲世界是開發團隊提前幾年做好的。HappyOyster 的世界,是模型在你按下方向鍵的同時,一幀一幀實時算出來的
當然,除了名畫和寫實,Wander 還能跑卡通、像素、童話等風格,畫質之間沒有明顯斷層
Direct 導演:在生成中改劇情
輸入一個初始 prompt 啟動生成后,可以在視頻流任意節點繼續下達新指令。指令可以是文字、語音或圖像,能實時切換鏡頭、調整角色動作、改變劇情走向
傳統視頻生成的工作流是,寫 prompt → 等渲染 → 收成片,是一次性的。Direct 模式讓用戶能在生成過程里持續干預,畫面持續演化,不需要重啟生成
第一個例子是卡通鱷魚飛行員。在生成過程里,輸入了一句新指令,畫面里是一只戴風鏡的鱷魚飛行員,開著飛機看夕陽。中途用戶輸入「Show the whole helicopter」(展示整架直升機)。下一幀鏡頭拉遠,整架直升機出現。鱷魚變成駕駛艙角落里的小人,手在儀表盤上
鱷魚飛行員,中途輸入「Show the whole helicopter」
中文敘事題材也能跑,下面這個是「金手指系統」開局短劇
中文短劇「第一個任務,買車」
第一幀少年坐在簡陋房間里被金光籠罩,下一幀彈出系統 HUD 界面,再下一幀切到停車場。畫面、中文字幕「第一個任務,買車」、系統 UI 同時生成
效果上等于把用戶,從觀眾席挪到了導演位上
Create 和 Share:從視頻到世界
Create 和 Share 這兩塊能力更接近一句產品哲學,官方把它叫做「打破第四面墻」
比如「我的世界」是一款游戲,也可以是一個世界,hhhh
過去幾年,生成式 AI 經歷了幾次躍遷:生成文本、生成圖像、生成視頻。但這些能力都停留在「生成像素」這一層。畫面越來越逼真,用戶能做的依然只有一件事:看
那么,為什么不能讓用戶能推門、走進畫面、親手改寫,能離開又回來,也能帶朋友進去
如果我們把小生蠔做成視頻,也蠻有意思的,比如下面這個
真 - 快樂生蠔
一只戴著生蠔殼當帽子的小動物,在森林里走。每走兩步,樣子換一遍。背景里的花、草、菌類、倒在地上的同類,一幀一換。整段沒有劇情,畫面一直在往前推
技術路徑
阿里給出的技術能力歸納是三點
長時序世界建模:通過海量長視頻數據,模型學到了真實世界的狀態轉移規律,能在長時間跨度里,保持高保真的動態場景生成
實時交互控制:在建模初始,就設計了多樣的控制信號(文本、Action、圖像等)。讓外部指令持續作用于世界狀態演化,而不只作用于初始條件
音視頻聯合生成:視覺和聽覺協同建模、同步生成
阿里把這一組能力描述為「從『被動生成內容』轉變為『主動模擬、并讓用戶參與世界演化』」
世界模型這個賽道,谷歌 DeepMind 2025 年 8 月發布 Genie 3 時定下了一個起點:720p、24fps、幾分鐘環境一致性。能用文本指令在畫面里加天氣、加角色、觸發事件,谷歌把這種能力叫做「promptable world events」
HappyOyster 在官方表述里跟 Genie 3 處在同一方向上,做的是實時交互式世界建模。阿里把擴展點放在兩處:一是在文本、控制信號、圖像等多源條件下,做一致的時序建模。二是引入音視頻聯合生成,把世界模擬從單一視覺通道,擴展到多感知協同
前面 Direct 模式那段「Show the whole helicopter」改鏡頭的演示,跟谷歌的 promptable world events 是同一件事的產品化呈現
剩下的判斷要等更多公開測評
當前能力邊界
世界模型整體處于早期階段,HappyOyster 也不例外。把當前能跑通的事,和暫時跑不通的事羅列清楚,方便心里有數
當前能跑通的
→ Wander 漫游,最長 1 分鐘連續位移和鏡頭控制,分辨率 480p
→ Direct 導演,連續生成 3 分鐘以上畫面,分辨率可選 480p 或 720p
→ 多模態輸入,文字、圖像、語音都能作為指令
→ 音視頻聯合生成,畫面跟聲音同步出
→ 風格泛化,寫實、卡通、像素、名畫都能跑
→ 中文敘事和中文 UI 字幕的同時生成
→ 用戶生成的世界保存下來,開放給其他用戶二次創作
暫時跑不通的
漫游和導演兩個模式當前沒有打通。Wander 模式下能自由探索,但不能在探索過程里實時改寫場景規則。Direct 模式下能改劇情,但不能用 WASD 走進畫面里。阿里方面表示未來會做融合,現在不能
實時控制人物移動和鏡頭旋轉時,存在卡頓,流暢度還有提升空間
商業化路徑尚未明確。當前只對部分用戶開放早期訪問,定價和 API 開放節奏都還沒公布
這背后是阿里 ATH
HappyOyster 的研發團隊來自阿里 ATH(Alibaba Token Hub)創新事業部,跟之前那匹屠榜的 HappyHorse 同屬一脈
今年 3 月的時候,阿里巴巴 CEO 吳泳銘親自掛帥,成立了 ATH 事業群。下面整合了通義實驗室、MaaS 業務線、千問事業部、悟空事業部、AI 創新事業部五大板塊。吳泳銘在最新一季財報電話會上,給 ATH 設的目標是:未來五年,云和 AI 商業化的年收入要做到 1000 億美元
谷歌 Genie 3 把天花板放在那里,國產幾家在追。阿里 ATH 選了實時交互這一支,HappyOyster 是這條線上的第一個產品
莎士比亞那句話,被搬到 2026 年的世界模型里,似乎又多了一層意味
The world is your oyster, open it
快樂生蠔
官網入口
https://www.happyoyster.cn/
參考材料
HappyOyster 官網https://www.happyoyster.cn/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.