網易首頁 > 網易號 > 正文申請入駐

前華為字節高管聯手創業，專注于消費級具身智能，兩輪融資數億元

2026-05-20 11:38:18　來源: DeepTech深科技

北京舉報

分享至

5 月 20 日，具身智能初創公司貝塔無限（Beta Infinity）宣布完成種子+ 輪融資。本輪由世紀華通參與的盛趣泰和基金與和利資本聯合領投，毅達資本、南山戰新投等機構跟投。這是該公司成立后完成的第二輪融資，累計融資金額達數億元，資金將主要用于核心技術研發及產品試制等。

創辦這家公司的是劉武龍和陶帥，他們專注于打造消費級具身智能系統與終端產品。

聯合創始人兼 CEO 劉武龍畢業于清華大學電子系。他曾任職于華為，歷任大模型工程團隊負責人、強化學習首席科學家，并成為華為最年輕的 AI 研究所所長。任職期間，劉武龍主導孵化了華為智能駕駛業務，是首個不依賴高精地圖的量產版本 ADS 2.0（高階智能駕駛系統）的核心操刀者，并從 0 到 1 打造了昇騰萬卡集群訓推系統，主持昇騰萬卡集群調優。具備智能駕駛與大模型雙向技術研發及產品落地經驗。

聯合創始人兼 CTO 陶帥同樣來自清華大學電子系。他曾擔任字節負責搜索、網盟商業化 AI 算法和工程總監。在字節任職期間，他帶領百人 AI 團隊，從 0 到 1 打造出年營收數百億的“千人千面”復雜 AI 系統，在 C 端個性化技術、大模型算法等領域積淀深厚。

2025 年中，兩人決定創業。他們密集考察了多個應用場景，于同年年底確立業務方向，并于 2026 年 3 月正式開始運營，團隊核心成員主要來自華為、字節跳動、智元、大疆等企業。

目前，該公司正在研發首批消費級具身智能產品，先鋒體驗版計劃年內亮相；同時，其已與多家上下游產業頭部企業達成深度戰略合作。

在這次對話中，我們聊了聊為什么他們選擇切入家庭場景的商業邏輯，詳細拆解了其致力于打造的“人機共融”硬件形態背后的硬核技術底座。

以下是對話實錄，為方便閱讀，做了不改變原意的編輯：

DeepTech：調研了很多場景，為什么選擇切入消費級具身智能？

陶帥：在深度調研了 3C 電子加工、汽車裝配、養殖場等 B 端場景后，我們得出兩個核心判斷。

第一，大模型驅動的具身智能，最適配的是消費級場景。工業流水線對機器人的核心要求是精準度和節拍，更適合用傳統工業視覺和機械臂做小范圍泛化；而大模型的優勢在于泛化能力和開放性交互，這與消費級市場的需求高度契合。

第二，B 端場景落地難度高，且對通用具身智能的演進幫助有限。工業數據高度定制化，難以形成規模化數據飛輪。過去兩年，雖然市場上有不少訂單，但真正在產線上實現 ROI（投資回報率）大于 1 且完全跑通的案例尚未出現。

相比之下，消費級市場是藍海，其需求與大模型技術的成熟度曲線高度匹配，也與我們的技術棧契合。

DeepTech：你們希望打造一款怎樣的機器人？今年就會有機器人的 Demo 亮相？

陶帥：我們專注于消費級市場，核心落地場景是家庭，希望打造一款面向“人機共融”場景的機器人伙伴，具備高泛化能力和開放性的任務編排能力。

在硬件層面，機器人必須具有消費級的親和力與靈動性，摒棄工業 AGV 式的底盤和僵硬形態，將家庭通行性、人機適配性和安全性放在首位。

在智能層面，我們賦予機器人兩項核心能力：第一，全時空多模態記憶系統，提升機器人個性化和長程復雜任務的執行能力。這是我們從第一天起就確立的消費級具身智能必修課，能復用我們在線上“千人千面”復雜推薦系統中積累的經驗；第二，環境自演進能力。具體包括兩方面：一是部署態的數據飛輪，依靠真實場景中的持續數據驅動實現進化，而非僅靠前置采集；二是強化學習，是環境自演進的關鍵技術基座。

DeepTech：你們近期在招聘服裝設計和柔性皮膚設計的實習生。這是否意味著你們的機器人在形態上會是一款能夠高度融入家庭環境的產品？

陶帥：是的。既然明確面向消費級市場，主打“家庭伙伴”的定位，機器人在形態上就必須具備親和力和安全性。一方面，通過頂尖的工業設計和柔性防護材料優化人機交互體驗；另一方面，團隊中的工業設計師也在外形細節上投入了大量精力。

除了外觀親和力，我們還對標消費電子的“極致堆疊”、性能與高可靠性。目前市面上很多機器人產品在本體上仍停留在初步可用的階段。而我們追求的是：既要有充滿溫度的人機交互，又要實現消費電子級別的硬件極致堆疊，同時兼顧具身智能本身的實用性與科技感。

DeepTech：當機器人真正落地到家庭場景時，你們會先讓它做哪些具體的工作？

陶帥：這是一個逐步演進的過程，主要圍繞三大核心能力展開：

第一，構建個性化多模態交互底座。覆蓋語音、肢體姿態乃至個性化移動方式，這是機器人在家庭中最基礎的立足能力。

第二，操作能力的自演進與逐步解鎖。初期聚焦簡單物品收納、抓取等任務，后續從平面操作升級到立體空間，再攻克柔性物體。產品初期的操作能力上我們判斷，想一步到位解決通用家務，做到消費級產品要求短期不現實，關鍵在于設備入戶后通過 OTA 和真實場景下的自演進機制持續提升。

第三，基于 BetaAgenticOS 打造高階技能生態。結合家庭場景調研與用戶付費意愿，未來開發者可在該系統上開發豐富的 Skill 應用，形成系統+應用的生態模式。

*OTA 意味著機器人進入家庭后，可以像手機系統更新一樣，通過云端遠程獲取新的算法模型、技能包或性能優化，從而實現持續進化。

DeepTech：讓機器人具備多模態交互能力，能和人類互動，那會接入諸如 DeepSeek 這樣的模型嗎？

陶帥：僅僅接入 DeepSeek 這類模型，無法滿足我們對消費級具身智能產品的技術要求。目前行業內部分早期探索往往側重于在交互層接入大模型 API，但我們認為這種架構可能難以完全滿足具身智能在家庭復雜場景中的深度落地。

第一，記憶與個性化能力的缺失。現有的大語言模型聊天機器人普遍缺乏長效記憶、多模態記憶和時空記憶能力，也無法精細化構建用戶畫像。這是我們首先要重點突破的方向。

第二，交互與具身能力的割裂。在機器人場景中，交互不能只依賴語言，還必須與具身智能的大腦能力深度融合。如果交互用一套模型、任務規劃和拆解用另一套模型，中間的“縫合”工作會非常復雜。尤其是在人與機器人交互過程中，用戶會頻繁打斷、糾正、重新規劃任務，這要求交互與具身任務規劃必須在同一模型內天然協同，實現自然的長程任務規劃與執行，而不是兩套獨立系統的簡單拼接。

因此，我們追求的是語言、姿態、操作與具身大小腦協同統一的聯動系統，所有這些能力將在同一個模型中整合。

DeepTech：關于機器人的長期記憶存儲，你們是如何考慮的？是放在本體還是上云？

陶帥：記憶能力一方面支撐“千人千面”的個性化體驗，另一方面也是實現具身智能長程復雜任務的技術底座。核心問題在于：存什么數據、數據怎么用、記憶如何演進？

我們已經構建了一套基于個性化獎勵機制的 reward 系統，通過強化學習來驅動記憶的演進與更新。在存儲層面，我們采取分層策略：原始的用戶數據，為確保隱私安全，會嚴格放在本地存儲和處理；二次挖掘的脫敏數據，經過用戶授權，采用端云協同的方式。

DeepTech：在解決具身智能缺乏個性化和自主做事能力差的痛點上，你們的底層模型和算法架構做了哪些創新和優化？

陶帥：在個性化方面，我們采用了“全時空多模態記憶框架”。它不是簡單存儲數據或做上下文嵌入，底層是一套由強化學習驅動的記憶管理、演進與模型融合的范式。

在自主持續做事能力方面，我們的工作主要體現在兩部分：一是 Wild2Bot 數據框架，即通過部署環境中的數據持續提升具身智能的能力；二是真機強化學習，這也是我們團隊積累較多的方向。

DeepTech：在具身智能領域，數據往往被視為最深的技術護城河。你們訓練機器人的數據從何而來？

陶帥：我們內部構建了一套名為“BetaData”的三階段數據框架。

第一階段（部署前）：傳統的數據金字塔模式，包含互聯網開源數據、umi 眾包采集、真機遙操作等，能讓機器人的基礎操作能力達到 60-70分，覆蓋家庭常見頭部物品。

第二階段（部署后觀察學習）：機器人進入家庭后，通過傳感器觀察人類真實操作，構建 Wild2Bot 數據飛輪。我們為此搭建了部署場景內的可控生成世界模型，這將成為未來最主要的數據來源，也更符合數據的第一性原理。

第三階段（真機強化學習）：當模型能力達到 80-90 分后，通過真機在真實環境中的自主試錯與練習，將精度提升至 99% 以上。

DeepTech：未來的規劃時間線是怎樣的？比如什么時候發布真機，以及數據三階段的時間節點如何安排？

陶帥：我們有一個大的時間線，但機器人智能技術本身發展很快，節奏也在動態調整。

今年的重點是把技術底座和旗艦本體的核心能力做到跨代級的體驗，尤其是幾大基座能力：多模態個性化交互、室內極致自主移動與語音建圖，以及操作層面的數據飛輪。真正規模化的量產和供應鏈打磨計劃放在明年上半年。后續也會考慮出海。

DeepTech：你們的目標市場主要在海外？

陶帥：我們是全球布局，國內和海外都會有相應的產品規劃。不過某些場景確實更適配海外市場。比如偏家務類的操作能力，當產品達到較好的成熟度和付費能力后，北美和海外市場的適配性更高。國內勞動力成本相對較低、居住空間也偏小，家務場景的付費能力沒有那么強。當然，國內市場仍然是打磨產品和技術的重要階段，像多模態交互、自主移動等具身智能的通用能力，在國內同樣有市場需求。

DeepTech：考慮到國內外市場的差異，比如海外住宅面積更大、人工成本更高，而國內可能有更多“三代同堂”的家庭結構，家務訴求也不盡相同。在用戶偏好層面，你們是如何看待這種地域性差異的？

陶帥：這更多是產品層面的問題。我們在國內一、二、三線城市以及海外都做了大量用戶調研，發現了一些差異化需求。比如家務場景的偏好、交互方式、付費點等，不同地域都不一樣。

從產品設計上，我們會做地域化的區分，這也是“千人千面”個性化能力的一部分，不僅體現在不同家庭之間，也體現在不同地域之間。從技術底座上，我們也會做好數據隱私和安全性的分級技術方案，因為不同地域對智能能力的接受度也存在差異。

DeepTech：近期像 Figure AI 等國內外企業進行了多場聚焦日常場景的機器人實機直播，引發了行業熱議。你如何評價他們的優勢與不足？你們未來如何競爭與超越？

陶帥：國內方面，雖然入局者眾多，但從目前展示的技術和數據來看，整體仍處于初級階段。無論是交互與具身智能的融合能力，還是消費級本體的設計能力，距離我們預期的狀態還有很大差距。

海外方面，幾家頭部企業展示的技術理念值得認可，有些與我們不謀而合。比如我們去年底提出記憶能力和長周期復雜任務編排，今年 3 月 pi（Physical Intelligence）團隊也發表了多模態長短期記憶對長程任務提升的工作，說明行業理念正在逐步收斂。至于 Figure AI，他們展示的 Demo 確實不錯，但整體效果在預期之內。

相比海外競爭對手，我們的特點主要體現在兩點：

第一，軟硬件協同的系統級優勢。國內供應鏈和本體產業基礎較好，我們在軟硬件協同設計與頂層算法優化上具備空間；第二，用戶體驗的打磨，在 C 端用戶體驗上，國內團隊在移動互聯網時代已全面領先海外——抖音、微信等都是例證，在具身智能時代，尤其消費級市場，我們也有相應的信心。

DeepTech：你們屬于華為系的創業團隊之一，目前華為系出來做具身智能的團隊不少。你認為你們的產品邏輯和工程邏輯與其他團隊相比有什么不同？

陶帥：我們認為具身智能的落地是一個綜合性系統工程，單靠自動駕駛或某一單一技術棧不夠。我們的不同之處主要體現在兩個方面：

第一，創始團隊是“華為+字節”的組合。華為這邊主要輸入的是自動駕駛和大模型底層研發能力；而我這邊則帶來線上個性化推薦系統和復雜 AI 系統架構的經驗。兩者結合，我們認為是適配消費級落地場景的組合之一。這既不是單純的自動駕駛技術遷移，也不是偏學術的 Demo 演示，而是面向真實落地的綜合能力。

第二，在融資節奏和發展理念上，我們更傾向于穩扎穩打。現在行業里年輕創業者很多，熱錢也很多，但我們選擇拒絕資本催熟的模式，堅持從系統落地做起。

運營/排版：何晨龍

注：封面/首圖由 AI 輔助生成

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.