當Robotaxi還在為L4苦苦掙扎時,酷哇的環衛機器人、無人小巴、機器狗已經在50多個城市“上崗”賺錢了。
具身智能最大的瓶頸不是算法,而是數據——沒有量產就沒有數據,沒有數據就無法進化。酷哇的解法是“以戰養戰”:讓機器人在真實運營中一邊干活一邊成長,用萬臺規模反哺模型迭代。李柯宏強調,中國是全球少有的支持機器人規模化應用的市場,酷哇正依托“一帶一路”先行布點,用真實的運營數據驅動具身智能的持續進化。
以下為酷哇科技聯合創始人、COO 李柯宏 演講內容,經36氪整理編輯:
![]()
李柯宏丨酷哇科技聯合創始人、COO
非常感謝36氪和亦莊的邀請,今天我分享的主題是:作為一家以統一世界模型驅動的具身智能企業,我們如何在全時空城市場景中實現機器人的規模化部署。
從大語言模型和具身智能的演進來看,2023年是一個關鍵分水嶺。此前行業更多采用分模塊或端到端的機器人架構;2023年后,以生成式AI為底座,誕生了面向物理世界的世界模型(World Model)。它與上一代模型的本質差異在于:能夠基于對環境的觀測,生成對未來的動作預測,并將物理因果關系嵌入決策鏈條。
過去兩年,中美頂尖AI公司發布了大量世界模型,無論是應用于機器人、智駕還是視頻生成,大方向是統一的——將生成式算法落地于物理世界。
生成式算法仍遵循Scaling Law。以Robotaxi為例:Waymo從Google X起步,耕耘十余年;特斯拉依托千萬級車隊眾包數據訓練,已逼近L4門檻。但具身智能的復雜度遠超自動駕駛——理論上需要的數據量級更大。現實困境在于:全球沒有一個像汽車那樣普及的“具身智能終端”,能讓用戶邊用邊采集數據。具身數據從何而來,是目前行業最大的瓶頸。
我們酷哇的解法,我們做了Coowa WAIM (World-Action Model),基于這個模型做一腦多行,具體應用在五大場景,環衛、出行、即時配送、物業、家庭,前三個要么是規模化,要么快速做POC,后面兩個還是需要一點時間。再來介紹以下我們模型的結構。
酷哇的解法是,我們構建了 CooWAIM(World-Action Interactive Model)通用世界模型,以“一腦多形”架構驅動不同形態本體,覆蓋環衛、出行、即時配送、物業、家庭五大核心場景。前三者已進入規模化或快速POC階段,后兩者仍需時間爬坡。下面具體介紹模型的結構:
整個模型采用雙系統架構:
- 一、直覺行動系統:基于視覺的端側實時推理,負責當下安全與效率;
- 二、長程任務推理系統:負責全局規劃與語義理解。
兩者疊加,輸出映射為兩大具身能力域:
- Drive(全域移動):覆蓋結構化與非結構化場景,城市主干道、輔道、人行道、園區樓宇內均可自由穿行;
- Work(多關節協作操作):超越傳統“抓取-放下”范式,將環衛掃盤、風機模組、機械臂等執行器統一納入操作空間,實現移動與操作的不可解耦融合。
酷哇的路徑是“以戰養戰”:拆解行業特性,匹配技術成熟度、產品成熟度與商業成熟度,按經濟性節奏部署,最終實現具身智能的規模化落地。在城市服務領域,大家廣義理解的drive層面做到萬臺規模,無序移動的數據或者能力基本實現。
再往上走,我們找到即時配送場景,基于“無序移動+簡單操作”實現產品匹配,我們認為即時配送場景在短期內有規模化空間。長期來看,具身智能的落地路徑是從開放場景走向半封閉、再走向封閉,最后進入家庭——從移動到操作,逐步把數據收集起來。
酷哇成立于2015年,深耕城市開放場景十年時間,推出適配各類場景的產品矩陣,包括1噸級、3噸級環衛機器人及無人小巴,覆蓋市政清掃與出行接駁。以下場景為標準中國人行道——環境高度復雜,感知精度要求高于主干道,是我們的機器人產品在非結構化環境下移動能力的直接體現。
我認為這是世界模型在端側應用的典型范例。講一個大前提:我們的機器人在上下班高峰期過路口時,需實時處理上百個動態特征(行人、非機動車),生成未來軌跡預測,評估對自身的影響,再輸出自適應行動軌跡。在擁擠道路環境下,其交互博弈能力直接決定通行效率。有人會問為什么小車需要這么強的能力——這跟具身智能的經濟性直接相關:每過一個路口,通行率更高或通行時長更短,第一覆蓋距離加大;第二單機清掃時間效率變快,就可以覆蓋更大面積,幫助客戶節約更多成本。比如你能節約20%的時間,基本約等于20%的毛利,這是機器人規模化應用的前提條件。
清掃作業過程中,機器人跟主干道的交互不僅是有避障,還有主動尋求碰撞的 action,比如貼邊清掃、識別垃圾、控制風機模組——多關節協作,既有 Drive,又有 Work,這是不可解耦的。機器人會實時根據垃圾的分布,再做locomotion,進而把 Drive、Walk 融合到一個場景任務中來。
之后是我們的物業服務場景的代表產品瓦力機器人R0,作業范圍覆蓋整個物業場景包括室外、室內,都會有類似的 Work 能力體現。
在出行場景的無人小巴方面,目前Coobus已在全球10個城市左右落地,目前亦莊很快也可以看得到。
接下來是酷哇實現機器人規模化落地的關鍵數據:真實里程5500萬公里,全國50多個城市和地區部署。
在即時配送場景,基于通用的無序移動+簡單Work能力,我們部署了四足配送機器狗。在末端配送環節中,我們發現一個痛點:占用配送小哥大部分時間并不是在主干道上騎電瓶車——這個效率已經非常高了——真正損耗時間的是如何在封閉樓宇或大型小區找門牌號,這是地圖無法標注出來的。我們通過機器狗來解決:一只狗送萬家貨,一方面我們與客單價相對較高、對履約時效有較高要求的品牌專送達成合作。另一方面,在物業層面,我們積極接入他們的系統,爭取在不改變物理基礎設施、不做梯控改造的前提下完成履約,現在也做到三公里以內30分鐘送到。
如圖所示,這是我們抓取冷啟動的動作,包括柔性物體或長程任務抓取也能夠完成。這是機器狗送咖啡的場景:袋子的顏色、大小都不一樣,抓取位置偏柔性,還是得用真機訓練——因為袋子的材質構成在開源數據集中很難抓到,包括 action 和 VOA 對齊的動作數據是不存在的,只能在真實場景中采集,再用收集到的數據進行訓練。
這是比較好的小區,也會出現“看似路又不似路”的場景。即便在小區內,對機器人的尋址能力要求也非常高。目前我們的機器狗在電梯里送貨——在不改變任何基礎設施的情況下,自主識別電梯,不需要做梯控,樓層也可以自主識別。這是最后送到家的環節,跟上游系統打通,通過 AI 短信、電話通知客戶東西到了。雖然看似不那么難,里面的非標環節非常多,非常非結構化,這是我們一整套具身智能戰略目前的應用效果。
目前酷哇的全系列產品,已經在全國50余個地區落地,累計收到1000萬條視頻-語義-動作對齊的 clips。給予現在以戰養戰的經營策略,和萬臺級機器人的部署,公司目前每年也能實現大幾個億的利潤流入。
全世界各地像中國這樣支持機器人、AI 規模化應用的國家不多,或者幾乎沒有。我們盡早去各地先布點,在等別的國家開放應用、市場認可的同時,先行把這個市場的意識形態掌握,主要采用“一帶一路”國家為主。
最后是公司介紹:酷哇科技成立于2015年,以上海交大為班底,總部落在北京。我們依托于北京的自動駕駛、機器人生態,進行具身智能的進一步示范落地。
我的整體介紹到此為止,謝謝大家!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.