作者 | 邱曉芬
編輯 | 袁斯來(lái)
硬氪獲悉,通用餐飲具身機(jī)器人公司「影智XBOT」連續(xù)完成數(shù)億元兩輪融資——其中,A輪的2億元融資由香港簡(jiǎn)坤資本GPTX出資,B輪融資為3-5億元人民幣,由多支政府基金、美元基金和產(chǎn)業(yè)投資方共同參與出資。
這是目前餐飲垂直機(jī)器人領(lǐng)域規(guī)模最大的一筆融資之一。
在此之前,「影智XBOT」還完成了一輪天使融資,出資人陣容豪華——包括騰訊高級(jí)副總裁張小龍、小米聯(lián)合創(chuàng)始人黎萬(wàn)強(qiáng)、黃江吉、林斌、洪鋒、以及港科大首席副校長(zhǎng)郭毅可等。
「影智XBOT」成立于2022年,其創(chuàng)始人唐沐稱得上機(jī)器人圈的“異類”——是機(jī)器人圈CEO中罕見的產(chǎn)品經(jīng)理出身。
![]()
(圖源/企業(yè))
在此之前,他歷任金山軟件、騰訊CDC總經(jīng)理,負(fù)責(zé)QQ、QZone等產(chǎn)品的體驗(yàn)設(shè)計(jì);后又擔(dān)任小米生態(tài)鏈副總裁,先后主導(dǎo)推出小米路由器、小愛音箱等千萬(wàn)出貨量的標(biāo)桿爆品,做產(chǎn)品的經(jīng)驗(yàn)累計(jì)達(dá)25年。
只是,當(dāng)整個(gè)具身智能賽道都在為人形進(jìn)家庭和工廠的敘事而瘋狂時(shí),「影智XBOT」卻選擇了一條看起來(lái)不那么“酷”,卻能快速產(chǎn)品化和商業(yè)化落地的路徑——讓機(jī)器人在商場(chǎng)角落做咖啡。
與多數(shù)主流人形機(jī)器人公司不同,「影智XBOT」的技術(shù)架構(gòu)圍繞餐飲垂類場(chǎng)景設(shè)計(jì),并以“XOS 3.0具身操作系統(tǒng)”為核心,采用了一腦多形的架構(gòu)。
據(jù)唐沐介紹,該系統(tǒng)分為三層——
大腦層:負(fù)責(zé)高層認(rèn)知與任務(wù)規(guī)劃,搭載知味餐飲大模型,基于DeepSeek基座訓(xùn)練,融合了400萬(wàn)杯咖啡的真實(shí)出品數(shù)據(jù);
小腦層:負(fù)責(zé)將語(yǔ)義指令轉(zhuǎn)化為關(guān)節(jié)級(jí)控制信號(hào),響應(yīng)時(shí)間小于10毫秒,已沉淀50多種餐飲動(dòng)作原子技能。
本體適配層:實(shí)現(xiàn)了跨形態(tài)復(fù)用,支持“一次研發(fā),萬(wàn)形復(fù)用”,可將咖啡臂的控制邏輯遷移至「影智XBOT」的冰淇淋、調(diào)酒等其他機(jī)器人上。
![]()
(圖源/企業(yè))
這種架構(gòu)幫助機(jī)器人規(guī)避了當(dāng)前VLA(視覺-語(yǔ)言-動(dòng)作)模型泛化難的行業(yè)痛點(diǎn)。
唐沐向硬氪指出,行業(yè)內(nèi)普遍認(rèn)為VLA泛化能力差,是因?yàn)樵噲D讓一個(gè)模型同時(shí)完成疊衣服和做飯等截然不同的任務(wù)。而「影智XBOT」的策略是限定場(chǎng)景,僅在異常處理時(shí)調(diào)用VLA模型作為兜底,以此節(jié)省算力并保證穩(wěn)定性。
此外,「影智XBOT」還搭建了一套完整的數(shù)據(jù)飛輪。
這一系統(tǒng)在實(shí)驗(yàn)室進(jìn)行仿真預(yù)訓(xùn)練,并在真實(shí)商業(yè)場(chǎng)景中進(jìn)行在線強(qiáng)化學(xué)習(xí),依托400萬(wàn)杯以上的真實(shí)作業(yè)數(shù)據(jù)持續(xù)優(yōu)化;同時(shí),通過RLHF(人類反饋強(qiáng)化學(xué)習(xí)),對(duì)齊300萬(wàn)次以上的人類偏好數(shù)據(jù),不斷提升模型表現(xiàn)。
而在搭好了模型、數(shù)據(jù)的基礎(chǔ)設(shè)施底座之后,「影智XBOT」近期發(fā)布了四條產(chǎn)品線,覆蓋不同層次的餐飲具身需求。
XBOT C3咖啡機(jī)器人:占地面積1.83平方米,采用6軸機(jī)械臂,重復(fù)定位精度±0.02毫米,每小時(shí)可出品80杯咖啡,滿電狀態(tài)下可連續(xù)制作150杯,配備43英寸數(shù)字人屏及“愛寶店長(zhǎng)”Agent,售價(jià)21.9萬(wàn)元;
XBOT I3冰淇淋機(jī)器人:體積更小,每小時(shí)可出品60杯以上,制作失敗率低于千分之五,設(shè)計(jì)壽命達(dá)25萬(wàn)杯,支持4種醬料和4種脆粒添加,售價(jià)17.9萬(wàn)元;
XBOT X1通用餐飲人形機(jī)器人:配備7軸雙臂,雙臂協(xié)同精度≤±1毫米,搭載單顆輝羲R1芯片,提供500TOPS本地算力,計(jì)劃于2026年底量產(chǎn),可實(shí)現(xiàn)拿取、制作、放置、遞送全鏈路閉環(huán),預(yù)計(jì)2026年底發(fā)售;
XBOT CUBE機(jī)器人快餐車:搭載20度電池,占地8平方米,支持咖啡、冰淇淋、調(diào)酒及烤腸等功能,上市時(shí)間待定。
唐沐向硬氪判斷,由于人形和半人形并非所有場(chǎng)景的最優(yōu)解,在未來(lái),專用單臂機(jī)型與通用半人形機(jī)型將并行發(fā)展。
而為了保障未來(lái)的產(chǎn)能,目前,「影智XBOT」在南京、岳陽(yáng)、上海、北京亦莊的基地年產(chǎn)能達(dá)2萬(wàn)。
不過,技術(shù)必須服務(wù)于商業(yè)閉環(huán),唐沐用“跑滴滴”來(lái)類比「影智XBOT」的商業(yè)模式。
據(jù)其介紹,以浙江義烏某商場(chǎng)投放的Lite系列咖啡機(jī)器人為例,設(shè)備售價(jià)十余萬(wàn)元,日均出杯量約200杯,客單價(jià)約20元,單月累計(jì)營(yíng)收可達(dá)6萬(wàn)元以上,凈利潤(rùn)超過3萬(wàn)元。算下來(lái),回本周期僅僅為6至8個(gè)月——機(jī)器設(shè)計(jì)壽命為5年,扣除回本周期后,剩余時(shí)間基本為純利期。
![]()
(圖源/企業(yè))
唐沐以滴滴作類比:滴滴司機(jī)花費(fèi)十幾萬(wàn)元購(gòu)車,還需全天綁定在車輛上,而同等價(jià)格的機(jī)器人僅需每天進(jìn)行一次補(bǔ)料維護(hù)。從商業(yè)邏輯上看,咖啡機(jī)器人本質(zhì)上是一臺(tái)更高效的生產(chǎn)資料。
基于此,XBOT沒有采用行業(yè)常見的租賃模式。唐沐認(rèn)為,租賃并不適合機(jī)器人時(shí)代,為此,「影智XBOT」推行RaaS模式(Robot as a Service,機(jī)器人即服務(wù)),
據(jù)唐沐介紹,未來(lái)加盟商支付機(jī)器成本后,還需按月繳納三項(xiàng)費(fèi)用,包括物料訂閱費(fèi)(咖啡豆、奶制品等)、Agent Token費(fèi)(愛寶店長(zhǎng)數(shù)字人服務(wù))、以及維修保養(yǎng)費(fèi)。
值得注意的是,目前,行業(yè)內(nèi)僅有「影智XBOT」持有“全國(guó)全品類食品經(jīng)營(yíng)許可證資質(zhì)”,這使得公司能夠合法合規(guī)地控制供應(yīng)鏈,從而鎖定RaaS閉環(huán)。
在客戶結(jié)構(gòu)方面,「影智XBOT」鎖定了非咖啡連鎖的異業(yè)客戶,比如奢侈品店、家居店、4S店等。
同時(shí),「影智XBOT」也為京東七鮮咖啡、亦莊機(jī)器人、菲柯機(jī)器人(FICO咖啡)、吉旅控股(吉林冰雪文旅)、博物天行(文博場(chǎng)館)提供解決方案,并與擁有四千多家門店的亞洲咖啡品牌共同探索海外市場(chǎng)。
截至目前,「影智XBOT」的咖啡機(jī)器人已在全球100+城市落地1000+臺(tái),產(chǎn)出咖啡超過400萬(wàn)杯。2025年,「影智XBOT」?fàn)I收已突破1億元。唐沐向硬氪表示,2026年,「影智XBOT」手握的訂單金額已接近3-5億元。
而在成立短短四年內(nèi)快速跑通技術(shù)、產(chǎn)品和商業(yè)閉環(huán),有賴于「影智XBOT」核心團(tuán)隊(duì)“鐵軍”。
有意思的是,「影智XBOT」團(tuán)隊(duì)配置不同于典型的機(jī)器人公司,更像是一家成熟消費(fèi)品公司與AI公司的結(jié)合。
據(jù)介紹,「影智XBOT」的機(jī)器人技術(shù)板塊由王嘉力主導(dǎo),作為哈工大機(jī)電博士,他曾任航天科工、三一集團(tuán)、新松機(jī)器人等企業(yè)高管。
「影智XBOT」的運(yùn)營(yíng)板塊則由“瑞幸系”班底組成,其中包含曾負(fù)責(zé)大區(qū)超高體量門店連鎖運(yùn)營(yíng)、品牌標(biāo)準(zhǔn)化體系、連鎖培訓(xùn)體系搭建相關(guān)工作的曹銳錕、于濤等人。
以下是硬氪與唐沐的對(duì)話節(jié)選:
硬氪:選擇切入商業(yè)場(chǎng)景,是基于什么考量?
唐沐:這個(gè)推導(dǎo)過程非常線性。第一步,我會(huì)首先排除toC家庭場(chǎng)景,當(dāng)時(shí)觀察行業(yè)趨勢(shì),很多團(tuán)隊(duì)前赴后繼地訓(xùn)練機(jī)器人疊衣服、煮飯,錢燒了但結(jié)果不盡如人意,結(jié)論是除了掃地機(jī)器人這種用途被嚴(yán)格圈死的品類,通用家庭機(jī)器人短期內(nèi)并不可行。
第二步,排除toB工業(yè)場(chǎng)景。黑燈工廠里傳統(tǒng)的機(jī)械臂已經(jīng)足夠高效、穩(wěn)定,根本沒有空間讓一個(gè)步履蹣跚、行為不可預(yù)測(cè)的人形機(jī)器人進(jìn)去拖慢速度。工業(yè)場(chǎng)景不需要人形,需要的是效率。
第三步,鎖定toB商業(yè)場(chǎng)景。既然家庭和工廠都不合適,那就在商業(yè)里尋找最大、最高頻剛需且在增長(zhǎng)的生意。推演下來(lái),咖啡是最優(yōu)解——它是全球通用的高頻飲品,標(biāo)準(zhǔn)化程度高,且正處于快速增長(zhǎng)期。所以,我們做咖啡機(jī)器人不是拍腦袋的靈感,而是排除了錯(cuò)誤答案后,邏輯推導(dǎo)的必然產(chǎn)物。
硬氪:今年以來(lái)人形機(jī)器人估值飆升,而你們堅(jiān)持做非人形垂類,你怎么看待這種形態(tài)選擇?
唐沐:馬斯克說人形符合第一性原理,但在很多工作場(chǎng)合,人形其實(shí)是累贅。長(zhǎng)腿本身就要消耗大量算力和電力,站起來(lái)只為“看起來(lái)像人”,并不解決實(shí)際需求。我們的邏輯是,非人形在很多場(chǎng)合能完成人干不了的事,反而更重要。
硬氪:在硬件選型上,你們堅(jiān)持用六軸工業(yè)臂、夾爪、諧波減速器這些成熟的供應(yīng)鏈產(chǎn)品,為什么?
唐沐:商業(yè)場(chǎng)景的第一準(zhǔn)則是穩(wěn)定,不是炫技。五指靈巧手標(biāo)稱能開合10萬(wàn)次,但在商場(chǎng)里,一旦抓空導(dǎo)致咖啡灑了,當(dāng)天經(jīng)營(yíng)就會(huì)受影響,所以我們只用工業(yè)驗(yàn)證過的夾爪。關(guān)節(jié)也是同理,行星減速器只適合“擺大致動(dòng)作”,而諧波在重復(fù)定位精度、量產(chǎn)成本和使用壽命上都贏。商業(yè)不接受實(shí)驗(yàn)室里的“大概齊”,必須追求確定性的“精準(zhǔn)”。
硬氪:現(xiàn)在很多公司都在講“通用具身智能”,你們卻把場(chǎng)景限定在餐飲,這會(huì)限制未來(lái)的想象力嗎?
唐沐:想象力不在于場(chǎng)景寬不寬,而在于能不能打透。過去有一段時(shí)間大家覺得“VLA已死”,是因?yàn)橄胱屗券B衣服又做飯,這在通域里確實(shí)難。但在垂域里,把活限定死,它就會(huì)好用。就像黑燈工廠里的機(jī)械臂,連眼睛都不用長(zhǎng),單一活低成本干好就行。
我們甚至大部分時(shí)候連VLA都不想觸發(fā),只在異常處理時(shí)才調(diào)用,省算力。將來(lái)幾乎所有產(chǎn)品都會(huì)具身化,但不可能都變成機(jī)器人。所以,「影智XBOT」的目標(biāo)是把餐飲這個(gè)垂直場(chǎng)景打透,通過“作業(yè)-數(shù)據(jù)-模型”的飛輪,成為具身智能時(shí)代的SaaS公司。
首頁(yè)圖源 | 企業(yè)供圖
排版|范馨雅
![]()
歡迎交流
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.