文 | 市象,作者 | 景行,編輯 | 古廿
“壓榨也是越來越狠了。”
某機構機器人數據采集員李華(化名)對「市象」表示,在數據采集領域,甲方一直在試圖增加有效采集時長,以追求用更低的成本提升數據獲取量,給到新崗位的工資也在走低。
李華所在的機構,起初對采集員的要求是每日提供4個小時有效數據,時間自由分配,累了可以休息,但每日紅線不能少。
但目前,企業已將數據時長要求提高到5個小時,據說正在考慮再提升到6個小時。
這份來自一線從業人員的觀察,能從側面印證具身智能創業公司在數據維度,是如何焦慮、追趕,生怕落后于人。
5月25日,自變量機器人發布公告,公司率先在國內推動機器人常駐家庭真實應用。具體做法是,由志愿者提出申請,自變量提供搭載WALL-B世界統一模型的全新機器人進入這些家庭,開展家政工作。
此前,自變量還與58同城合作發布149元3小時智能保潔服務,由家政阿姨、自變量機器人、工程師三方協作完成上門保潔。
但服務本身遭遇了輿論風波,有消費者評價稱,機器人的工作效率遠不及人工,且過程中依賴人工監督。
有業內人士評價:目前多少是不具備實際消費價值的,多數消費者還是嘗鮮心理,企業可能更看重保潔過程中的數據。
因此在具身智能圈子里,還有一個調侃是:如果企業更需要機器人上門,那這149元是不是應該付給愿意讓機器人上門的家庭。畢竟占用了3個小時的家庭空間,酒店鐘點房也差不多是這個價格。
從上門到駐家這還遠遠不夠,近期自變量還在公開招募UMI&EGO采集項目供應商,背后是整個具身智能行業的數據饑渴癥。
繞不開的數據荒
極度饑渴,這是整個具身智能行業對訓練數據的真實態度。
“自動駕駛需要約100億英里的訓練數據。”在今年年初的發言中,特斯拉CEO馬斯克如此表述。理由是,只有積累足夠龐大的數據量,才能覆蓋更多極端場景,實現全無人的完整自動駕駛。
自變量對此的觀點相近。在公開表述中自變量提到,人類從嬰兒時期邁出的第一步也是走得很慢,經常犯錯,每一個偉大的旅程,都是從踉踉蹌蹌的第一步開始。
具身智能模型的主流訓練方法是模仿學習,即采集員使用帶有傳感器的夾爪,反復進行同一個動作,并將每一個關節的運動數據加以記錄。
無論是佩戴攝像頭進行勞動,所產出的第一視角視頻,還是傳感器數據,都意味著誰能更快以更低成本拿到天文數字的數據量,誰就能在具身智能的競賽中占得先機。
在業內,雇傭大量數據采集員進行標準勞作,以供給數據訓練,這成為行業的通行做法。
京東已在宿遷搭建全國首個具身智能數據采集社區,讓采集員頭戴設備干家務,或在工廠里裁剪服裝;特斯拉要求采集員戴好5顆攝像頭,每天用8個小時在實驗室拿杯子、擦桌子、拉窗簾,在工廠的傳送帶上工作。
在此方面,自變量花的心思要更多。
在與58同城合作開展的保潔套餐活動中,自變量選擇了“加量少加價”的打法。
「市象」粗略檢索58同城保潔服務發現,下沉市場(三線及以下城市)價格約為44.86元每小時起,一線城市約為45.59元至46.56元每小時起。相比之下,自變量的機器人服務定價要略高于常規保潔服務市場價。
盡管對自變量來說,149元3小時的價格,遠遠不及機器人測試成本與工程師的人力成本。但對消費者而言,現階段的機器人家政難以體現實際價值,更多是花錢買個熱鬧。
這也是博主體驗套餐發表“動作慢、聲音大、專人陪跑”的吐槽后,官方第一時間發文回應,承認機器人比人笨難以避免的原因所在。
另一層是,消費者貢獻家庭場景,為自變量的數據采集添磚加瓦,不僅拿不到報酬,還要為此額外付費。
李華向「市象」介紹了數據采集背后的企業成本重壓——動輒30萬元以上的機器人價格,加上200元以上每天的采集員人力成本。即便拋棄機器人本體,采用附帶高精度傳感器的夾爪訓練,單人一天采集的數據也只有500條左右。
想要進一步增產,必須擴大產能,其中訓練場地、高精度采集設備、采集人員缺一不可。
而受限于訓練場地、采集設備的高昂成本,具身智能企業率先思考的,往往是在采集人員身上做文章。這也是為什么,李華的每日有效數據時長要從4個小時擴展到6個小時。
同時企業不得不想方設法廣開財源,解決采集模式的持續性問題。“公司不僅在招人做采集,還一邊賣采集設備,一邊銷售采集數據,客戶一撥撥的來。”李華表示。
同時,能給到采集員的待遇也在走低。李華表示,采集員的工作內容,就是拿起一個機械夾剝開水果皮、疊好衣物,從業門檻只需大專及以上,所謂的上崗面試,只是初步熟悉工作內容。
這在業內早已是常態。「市象」整理發現,市面大量數據采集員崗位不要求全職,對工作時間與工作時段也不作要求,20元的時薪隨處可見。
盡管大部分崗位標榜高科技環境,簡單輕松,但仍然被求職者冠以“賽博流水線”的稱謂。
李華表示,這份工作勝在簡單明了無需思考,可以邊聽音樂邊干,但時間一長,肩膀和手腕顯著酸痛,大部分求職者都是看一眼就離開。
省錢才是駐家機器人的關鍵?
從家政上門服務,到走進志愿者家庭成為新的家庭成員,自變量的數據采集方案迭代,核心不在于“見世面”,而是人力成本的大幅下降。
為確保不打擾用戶生活,自變量CEO王潛給出了嚴格的隱私保護政策,如原始圖像打碼,用戶同意后設備才開機,設備全程不向第三方共享。
自變量表示,對于具身智能而言,要見更大的世面,核心不再更大的算力集群,不在更SOTA的模型,而在生活日常中。
這一判斷基于現實考量。當今時代,機器人的硬件能力早已完善,匱乏的是應對小概率場景的智能性。
在公開演講中,自變量聯合創始人兼CTO王昊將實驗室固定環境訓練的數據稱為糖水數據,將真實家庭環境中復雜、充滿隨機性的數據稱為牛奶數據。
前者穩定可控,但缺少對真實世界的認知能力;后者采集成本更加昂貴,但具備對物理環境隨機性的應對底氣。
上門家政的業態中,自變量采用的是一人一機,現場管理;但在駐家工作后,陪同安全員的工作被完全取代。
從專人現場監督,到后臺工程師監督,從全程管理走向長尾管理,一切如Robotaxi故事。
有無人車從業者對「市象」表示,相較安全員模式,后臺監督可以大大節約人力:“上路后,幾個維修人員定期查看車輛即可,跟著導航走就沒問題,有極少數情況出現事故,派人去現場就行。”
在Robotaxi跨過成本拐點的歷史進程中,這是相當重要的一環。
以百度蘿卜快跑為例,2024年百度宣布,蘿卜快跑每單服務成本首次低于傳統網約車,驗證了Robotaxi的商業邏輯。
三個事件共同促成了這一商業模式的成立,分別是硬件成本,人力成本與規模效益:
其一是車輛成本跳崖式下降。從第五代車Apollo Moon到第六代Apollo RT6,蘿卜快跑整車成本從48萬元驟降至20.46萬元。
背后是核心傳感器的價格跳水。借助禾賽科技等廠商的傳感器,蘿卜快跑能以幾千元的價格替代早期的昂貴進口雷達。
其二是安全員的減配。早期的主駕安全員得以盡數退場,讓車輛實現獨立上路,而不需要在復雜路況下人工接管,駕駛模式變成云端監控。
其三是全天運營的效率質變,同時也是人力減配的副產品。在武漢,數千臺RT6的運營晝夜不息,24小時運營+品牌認知度提升,令蘿卜快跑在單個區域產生巨大的規模效益。
回看自變量機器人,它要解決的問題要更復雜。
相較售價9.9萬元起,主攻運動場景,以關節電機為主要硬件成本的宇樹G1,主攻家政方向的自變量需要更高的雙臂自由度、細致性更強的機械手。
更關鍵的在于,要深入到服務場景中,完成更精細的環境理解與操作,自變量選擇大力投入WALL系列大模型研發,并在傳感器、計算平臺等“大腦”維度大力下成本。
以自變量Quanta X2量子2號為例,僅傳感器體系,就搭載有一個2D激光雷達(構建地圖)、4個超聲波傳感器(近距離避障)、一個RGBD相機(物體識別)、一個3D-TOF相機(中距離環境感知)、一個單點TOF(補充測距)、一個紅外傳感器(輔助感應)。
反觀宇樹G1,感知系統僅LIVOX MID360 3D激光雷達與Intel RealSense D435i深度相機兩個核心傳感器。
自變量機器人需要更多的感知能力以適應精細環境的工作,并支付更高的BOM成本。同時也面臨使用壽命與迭代速度的壓力。企業需要將機器人成本壓至極低,以保證購入家務機器人的家庭,在成本上打贏人工服務。
這意味著,自變量的入家夢,是一場與時間的賽跑。
在零部件成本下降之前,自變量都無力回答一個核心問題,如何在成本戰中贏下人工隊,讓用戶確信,自己不是為企業花錢打數據工。
(文中人物為化名。)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.