![]()
當我們為機器人每一個靈巧的動作而驚嘆時,不應忘記那些在陰影中為其繪制行動地圖的“影子”。這不是商業模式的拷問,更是一個關于技術倫理與社會的深刻命題:我們追求的智能未來,究竟應該由怎樣的人文基石來支撐?
我們正在見證林立的具身大廈,但要記得何人把它一手手搭。
作者:彭堃方
編輯:呂鑫燚
出品:具身研習社
數據成為具身智能進化最大卡點,成為困住其走向物理世界的“靈魂”時,明面上,產業內討論的是真機數據與仿真、互聯網等數據類型的博弈。其中真機數據由于質量更高且在精細化操作領域的更具效用,被普遍認為“海量真機數據集能左右具身智能發展速度”。
但幾乎不會有人告訴你,機器人真機數據集的背后是怎樣一份沉甸甸的付出。
這份付出是一個略顯老套的商業故事,正如同騎手越來越快的車速為的是加速外賣平臺的即時零售夢實現一樣。數據采集員也在具身智能中扮演同樣的角色,他們通過身穿操作設備,一遍又一遍重復同樣的拿水杯動作,為得就是讓具身智能擁有抓取&放置的能力。
但由于數據需求帶來數采員的缺口巨大,這份工作常以“外包”的形式出現,在不穩定的工作中誕生出更穩定的具身智能產品。
有人說,這是時代賦予的“紅利期”,日薪200元不用風吹日曬,在兼職工作中屬于香餑餑,還有人說,這是和網約車司機、騎手齊肩的新工種,能作為長線發展。
亦有悲觀者認為,這份工作有點悲劇色彩。“數據收集員的工作正是為Optimus最終取代人類勞動鋪路。”BusinessInsider在報道特斯拉建立數據采集團隊的文中這樣評述。通過由數據采集員獲取的數據,機器人會變得更聰明,以至于這次他們親手鍛造的,或許成為未來的競爭對手。
無論視角如何,短期來看這好像都是一份能掙到錢的新路子,至于未來如何發展或許誰也沒拿到預言家的牌。
在喧嘩與躁動的行業中,他們像一群“淘金者”,只不過這次他們不再是向土地要黃金,而是向自己要數據。
![]()
數據勞工的正反面
幾乎所有受訪的數采從業者,都將這份工作定義為“枯燥的體力活”。
枯燥,源于工作的重復性:員工需身著數采外骨骼或遙操設備,重復數百次夾取、拿放、搬運等動作,如同教導嬰兒學步般,引導機器人模仿人類行為。體力活,則體現在工作的低技術門檻,多數崗位明確偏好男性,甚至要求能抓取15公斤重物。
數據采集中心內,數采員們在特定場景中行走、抓取、避障,每一個動作都被精確記錄,成為機器人的行為藍本。或者,他們坐在電腦前,對海量視頻逐幀標注“這是手”“這是門把手”“這是安全行為”。他們是機器人在數字世界中的“鏡像”與“導師”。
Business Insider的采訪對象直言,這份工作對身體的負擔極大,“幾乎等同于一整天都在做有氧運動”。
坦白說,這類工作與兼職群中常見的外賣眾包、快遞分揀、工廠普工,有著高度相似的用戶畫像,以男性為主、無技術門檻的勞動密集型崗位。
但招聘方卻常常附加“偏好條件”:希望應聘者具備計算機、人工智能相關背景,或擁有數據采集經驗。這份在社交媒體上被貼上“含金量低、需避坑”標簽的工作,反而成為許多計算機、人工智能專業大專生的實習與就業選擇。
這些以相關專業、大專學歷為主的新生力量,大多將其視為“行業紅利”。曾從事醫療機器人數采與標注的大專生小呂,數科專業本科剛畢業的小陳,都對這份工作給予了較高評價。小陳認為,滿意的待遇、相對安全的工作環境、蓬勃發展的行業前景,再加上個人興趣的驅動,讓他對這份工作充滿好感。但和大多數從業者一樣,他也清楚這份工作的不穩定性,計劃先積累經驗作為跳板,在行業中探索更多可能性。
這種“鯉魚躍龍門”的職業期待,與外包的AI數據標注、AI訓練師渴望晉升為大廠的AI產品經理的職業規劃如出一轍。“貼近風口賽道,從底層積累經驗逐步晉升”“優秀者可轉正交社保”,這也是HR在招聘中常用來吸引求職者的敘事邏輯。
但若將視野從這些“專業對口”的勞工群體,擴展到更廣泛的從業者,便會發現他們身上諸多令人深思的“異狀”。
正如光與影相伴,當機器人最終站在聚光燈下接受掌聲時,這些教會它一切的數據勞工卻成為不被看見的影子。
而更詭異的是,這種數據勞動正在“異化”。就像程序員們與其親手打造的AI編程工具相愛相殺一樣,勞動密集型崗位上的數據勞工正在教會其偉大的機器人如何從事基礎性、枯燥的重復性勞動。
看不見的另一層是“無根”。
從互聯網、移動計算,到大模型和如今的具身智能,技術風口一輪接一輪,數據勞工們也隨著浪潮遷徙,難以扎根。技術迭代,數據勞動便會游移。
另一層面的“隨波逐流”則是體現在他們的勞工關系上。他們的工作多通過層層外包獲得,勞動關系脆弱。項目一旦終止,都可能導致整個團隊瞬間解散,失業如影隨形。
在這場具身大潮中,不說與動輒百萬年薪的算法工程師相比,數據勞工薪資與招工群里的其他體力工種并無區別。在數據采集方面,以北上廣深一線城市為例,普遍日薪160元-200元之間,時薪20出頭。在數據標注環節,更是價低。這類工作就是針對客戶視頻里的目標檢測識別,打標簽,屬于遠程辦公,全國可做。目前正在三四線城市正迅猛發展,攤薄用工成本。
他們是這條高附加值產業鏈上最基礎、也是待遇最微薄的一環。招聘的低門檻,意味著其可替代性之強,也注定了議價權之弱。
人工智能領域知名政經批判學者凱特·克勞福德在《技術之外:社會聯結中的人工智能》一書中表示,“這些工人從事支持AI‘魔法’說法的重復性工作,但他們從未因為使這個系統正常運行而獲得認可。盡管這項工作對AI系統的‘工作’至關重要,但通常薪酬很低”。
譯文翻譯有些拗口,換句話說當智能展現出震撼人心的魔力時,那些支撐其運作的幕后勞動者,卻未得到應有的認可,至少在薪資回報上是如此。
![]()
數據勞工現狀從何而來?
回到問題的開始,數據勞工的這些“異狀”究竟從何衍生呢?
AI的發展促進了具身智能的誕生,而具身智能也承襲了諸多AI的技術底層邏輯,其中之一是“大力出奇跡”的ScalingLaw。
具身智能的智能水平某種程度上與數據的質與量成正比,甚至業內一度認為具身智能要理解復雜的物理世界,或許要達到“互聯網”數據量級。因此,只有在保證質上足夠干凈精確、足夠豐富,才能從規模化定律中催生智能涌現。
于是,具身智能需要數據采集、標注等大量人力才能堆砌出。這些大量的人力成本,就成為初創企業的輜重了。而為了“輕裝上陣”,在摩爾定律逐漸打破,模型迭代日新月異的節奏里,企業選擇把這項基礎工作外包給三方。
從資本的邏輯來看這一點無可厚非。具身智能公司的核心資本必須投入到算法研發和硬件制造等“硬核”環節。將數據工作外包,是降本增效的好辦法。
但需要強調的是,外包后,企業管理鏈條延長,企業規范(權力)的傳導會遞減、乏力。這當中極容易滋生亂象。
拿標注質量來說,當具身智能企業下達一份數據采集或標注的操作手冊供三方員工按部就班實現標準作業流程。這其中“具身企業—勞務公司—三方員工”之間存在“二次合格”。即原本“具身公司—全職員工”要求及格的數據,在上述鏈路后,變成三方員工“得過且過”地交付勞務公司數據,而勞務公司又“得過且過”地把數據交給具身智能公司,最終影響數據質量。(部分情況下如此)
回到數據勞工的薪資待遇問題。當工人在接受層層外包后,薪資普遍像洋蔥一樣,剝的越來越少。你可以看到網絡上,圍繞這項工作的外包方,工資各有差異,一手的三方可能日薪250元,二手的勞務公司則可能日薪200元,而更多層的勞務則可能變為150元。最終這些勞工被當作資源反復倒手。
當然,數據勞工勞動價值的壓低,還表現在外包項目方本身也可能“吃不飽”。具身研習社也采訪到某數據采集項目負責人,他表示“目前與廠商合作都比較困難,部分廠商要求需要買他們的機器人才能分到業務。現在很多都是希望輸入人過去,去客戶那采集,用客戶的場地。但是這種本質上已經變成了純人力公司”。而當企業選擇成為人力外包公司,就會發現企業在具身產業鏈已經走到很邊緣的位置,自然這份蛋糕注定吃不到多少。
總之,低質量、低激勵的數據工作甚至可能反噬技術本身,導致數據質量下降,這些亂象也共同揭示出產業初期的“野蠻生長”。
結語
當我們沉浸在具身智能描繪的未來藍圖中,不應忽略那些支撐技術迭代的“數據勞工”。他們的職業發展與產業演進本就是相互依存的整體,而非割裂的個體與背景。
從勞工視角來看,像小陳一樣試圖“轉正進管理”只是少數人才能實現的理想路徑,更多人面臨的是“技能無沉淀、就業無保障”的困境。真正的職業成長,應當圍繞“經驗轉化”與“風險兜底”展開。
底層采集員可憑借一線實操經驗,轉向數據質量把控,比如篩選有效動作數據、修正冗余標注,或是參與編寫場景化采集手冊,將“如何讓機器人精準識別障礙物”“不同場景下的動作規范”等經驗轉化為行業標準,擺脫純體力勞動的局限。
從產業方來看,數據勞工不會永遠伴隨著數采廠的建設而呈線性增長,未來AI自動標注、世界模型生成與仿真技術優化數據采集方案,可能會逐步“擠占”勞工的生存空間。
但需要明白的是,在“感知”層面(如識別物體)的自動化可能較快,但在需要“理解”物理世界復雜交互(如力度、觸感、突發情況)的“認知”層面,高質量的人類演示數據大概率在較長一段時間內仍是不可替代的“教科書”。
當我們為機器人每一個靈巧的動作而驚嘆時,不應忘記那些在陰影中為其繪制行動地圖的“影子”。這不是商業模式的拷問,更是一個關于技術倫理與社會的深刻命題:我們追求的智能未來,究竟應該由怎樣的人文基石來支撐?
我們正在見證林立的具身大廈,但要記得何人把它一手手搭。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.