![]()
王潛堅信,Aha Moment就在未來非常近的地方,可能比大家想象的要近一點。
據IPO早知道消息,自變量創始人兼CEO王潛于4月21日證實,自變量機器人日前已完成由小米戰投領投的B輪融資。
這意味著,自變量成為國內唯一同時被美團、阿里、字節跳動、小米這四家互聯網大廠投資的具身智能企業。同時,自變量也隨之成為在國內具身智能領域被最多大廠投資的一家。
當然,上述大廠本身也都在積極布局具身賽道。對此,王潛認為,這并不妨礙這些大廠投資自變量,也不妨礙自變量接受這些大廠的投資。
王潛進一步指出,首先,這個市場足夠大;其次,自變量作為創業公司也有著大廠不可比擬的優勢。
“我們軟硬一體的能力是非常重要的一個競爭優勢。”王潛補充道,“另外從最近幾年大模型的發展歷史上不難發現,資源某種程度上并不構成任何意義上的追趕速度或者并不構成任何意義上的壁壘,就像谷歌這樣的大廠投入了比OpenAI至少大一到兩個數量級的人力、財力和資源,都沒能產生太多實際的效果。技術本身是一個非常非常高的門檻,在機器人領域技術又沒法‘蒸餾’,所以真正的技術差距是非常大的。”
王潛甚至坦言,相較于自動駕駛、移動互聯網、互聯網等這樣的大機會,當前具身智能賽道不是“過熱”、而是“過冷”的,自變量之所以能獲得如此多大廠青睞的核心原因還是技術領先性。畢竟,這些大廠均為國內乃至全球范圍內模型能力最強的企業之一。
不妨補充一點,從成立之初,自變量便聚焦于為機器人構建“大腦”,即端到端的具身智能基礎模型。2024 年底,自變量發布了基于 VLA(視覺-語言-動作)架構的第一代具身基礎模型 WALL-A;2025年9月,自變量將同樣思路架構下的輕量化模型版本WALL-OSS開源。
![]()
4月21日,自變量還發布了新一代自研具身智能基礎模型WALL-B——這是全球首個基于世界統一模型架構(World Unified Model,WUM) 的具身智能基礎模型,標志著具身基礎模型從VLA架構向原生多模態融合架構的重大跨越。
具體而言:WALL-B采用的WUM的核心理念為:將視覺、語言、動作、物理預測等所有能力,放在同一個網絡中從零開始聯合訓練、融為一體,消除模塊間的邊界和數據搬運損耗。
基于這一架構,WALL-B實現了三項區別于行業現有模型的核心技術特征:
1、原生多模態——從第一天起就實現“多模態進、多模態出”,并首次賦予了模型一種被稱為“原生本體感”的能力。這是一種內生的空間感知能力,而非通過外部測量或建模獲得。據自變量聯合創始人兼CTO王昊介紹,這一點甚至許多動物都不具備。
2、物理世界的“世界觀”——WALL-B能夠感知并預測重力、慣性、摩擦力、速度等基本物理規律。這種對物理規律的理解為零樣本泛化提供了基礎。日常生活中,物理規律在不同環境中均保持一致,WALL-B 在任何一個它從未去過的家庭中,都能利用對基本物理常識的理解來應對新場景,不需要針對每個家庭重新訓練。
3、與世界交互并自我進化——目前,主流機器人在任務失敗后通常直接停止,返回錯誤信息,無法從失敗中學習。WALL-B 的行為模式則完全不同:它在失敗后會調整策略再次嘗試,如果成功,則將這次成功的經驗直接更新到模型參數中。
換言之,WALL-B克服了Transformer架構難以進行長期內化記憶的問題,所有經驗以原生多模態記憶的方式,通過類似人腦記憶的機制實現自我更新。
至于數據層面,自變量的策略可總結為:實驗數據打底,真實場景提質。實驗室數據用于建立基本能力——識別常見物體、執行基礎動作;真實家庭數據用于讓模型學會在不確定環境中生存。真實隨機、不可預測的現實數據所驅動的數據飛輪,才是真正的壁壘。而為了獲取真實家庭環境中采集的嘈雜、多變、充滿隨機性的數據,自變量團隊還進入了數百個志愿者的真實家庭進行模型訓練。
![]()
更值得注意的是,王潛透露,35天后,新一代搭載WALL-B,并根據家居環境進行硬件升級的新一代機器人將入駐首批用戶的家庭。
![]()
“盡管進入家庭的機器人現在還很笨,走得很慢,經常犯錯。人類從嬰兒時期邁出的第一步也是如此。每一個偉大的旅程,都是從踉踉蹌蹌的第一步開始的。如今,機器人已經在最復雜的地方開始了它學習和進化的征程。”王潛表示,“我們希望能夠在比如說兩到三年的時間里實現真正意義上的、物理世界的Aha Moment。或者如果說得通俗一點,就像當年ChatGPT所做的事一樣。所以我們覺得這個事情還是基礎第一性的一件事情,如果當那個轉折點出現的時候我們不需要再去考慮給自己設一個什么樣的milestone,我們希望Aha moment是我們第一個能做出來的。我堅信Aha Moment就在未來非常近的地方,可能比大家想象的要近一點。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.