近來,為了使AI模型和機器人更好地理解物理世界,人類的勞動過程正成為AI訓練數據的“收割”對象。印度工廠職工頭戴攝像頭拍攝“第一人稱視角”的視頻素材,被打包成數據集出售;美國外賣騎手兼職記錄自己執行各種任務的視頻,上傳平臺賺取額外收入。
“對于那些試圖讓機器人模仿人類動作的公司來說,第一人稱視角數據可能是一種極具成本效益的實現方式。”印度信息技術研究所海得拉巴分校機器人研究中心助理教授斯潘丹·羅伊(Spandan Roy)告訴媒體,喂給系統的數據越多,機器人就越聰明。
傳統的機器人訓練方式是招募人員,讓機器人在計算機生成的虛擬三維環境中復制他們的動作。現在,利用視覺數據成為另一種更為便捷的訓練方法。
此類視覺數據收集活動的增加引發了擔憂:“工人是在訓練AI來取代他們自己嗎?”值得關注的是,有一些工人是在不知情、未被征得同意的情況下被收集第一人稱視角數據。
印度工人身上的“白鼠實驗”
4月,印度工廠內的一段視頻在網絡上瘋傳。畫面里,一排排工人正坐在縫紉機前縫制衣服,他們頭上佩戴著裝有攝像頭的環形設備,記錄著每一步操作。
![]()
這段瘋傳的視頻中,工人們佩戴著一種可以記錄動作的設備,正在縫制衣服。
據印度知名獨立媒體Scroll報道,這發生在服裝制造巨頭明珠全球工業有限公司位于古魯格拉姆(Gurugram)的工廠。“我們被要求在上午10點到下午4點之間佩戴這個設備。”該工廠的一位工人稱,“他們說我們必須佩戴一個星期,想看看我們在輪班期間都在干什么,以及干了多長時間。”
“我們不相信這些理由。”另一名工人說,“工廠里本來就有攝像頭,為什么不用那些?”該公司大多數工人來自比哈爾邦或西孟加拉邦的村莊,他們從周一到周六每天工作12個小時,月薪在20000至30000盧比(約合人民幣1420元至2130元)之間。
工人每天下班時,管理人員會收回這些配備了32GB內存卡的攝像頭。每臺設備都有一個獨特的序列號,這個號碼會被記錄在工廠提供給工人的身份ID旁邊。
有幾名工人對這個設備感到警惕。“它的電池就在我們的太陽穴附近,隨著電池發熱,我們會感到不舒服。”一位工人說,“感覺它就像在吸我們的血一樣。”
還有工人對該設備的過度監視感到不安。“去洗手間之前,我們必須把它摘下來。”“而且,戴著它的時候我們不能和配偶說話,它會偷聽我們的對話。我們也不能到處走動,有時候我自己會把設備關掉。”
參與這個項目的工人們表示,對于佩戴該設備,公司從未征得他們的同意,無論是通過口頭還是書面形式。
致力于研究技術與社會交匯議題的印度非營利機構Aapti研究所指出,與其通過個人知情同意的視角來思考數據收集,不如“從集體數據權利的概念出發,因為它影響的是整個工人集體”。“我們需要有集體社區的力量。否則,我們就是在做那些讓我們自己失業的工作。”
類似的攝像設備也曾出現在“肯印度(Ken India)”公司的工廠里。這是一家總部位于印度馬哈拉施特拉邦的紡織制造商。該公司在領英平臺上的一篇帖子中表示,工人佩戴的這些硬件設備屬于名為Egolab AI的初創公司。
設備收集到的視覺數據會被“聚合、處理并打包成數據集”,提供給“構建機器人、計算機視覺和自主系統的全球AI公司”。Egolab AI在一份文件中稱,這些公司包括特斯拉、波士頓動力以及Figure AI。
Egolab AI于2026年1月由印度兩名青少年創立,自稱為“印度最大的第一人稱視角(POV)數據聚合商”。該公司在一份公開文件中表示,到2027年,將聚合印度每個主要邦和各個行業的第一人稱視角數據,包括紡織、汽車、化工、電子、鋼鐵和快消品。
創立僅兩個月,Egolab AI就被美國一家公司收購,交易金額達到七位數。“這一龐大的數據集將成為全球AI和機器人訓練的基石。”Egolab AI公司稱,工人們會因“為AI的進步做出貢獻”而感到自身價值的提升,并且是自愿選擇加入數據收集的。該公司強調,這一行為符合印度《2023年數字個人數據保護法》。
Egolab AI的一份報告樣本顯示,數據收集系統基于攝像頭設備捕捉的畫面,利用AI生成了工廠工人的“生產力分析”,列出“最佳工人”和“最差工人”的生產力,并以此計算出“平均生產力”得分。
![]()
Egolab.AI的樣本報告展示工廠工人的“生產力分析”。
樣本報告中的分析寫道:“您的工人平均每天有2.2小時沒有在工作,這導致您每天因產出減少而損失約33000盧比。”此外,報告還量化地拆解了工人在非工作時間都在做什么,例如“空閑比例”中有32%花在了與同事聊天上,報告甚至指名道姓地指出了特定工人。
隨后,報告將這些分數與Egolab AI合作過的其他工廠進行對比,從而給出了工人生產力的百分位排名。
紡織業是印度最大的雇工行業之一,直接從業人口近4500萬,其中許多人來自農村地區。這并不是唯一通過工人收集第一人稱視角數據的行業。印度公司阿維格(Awign)企業有限公司也在收集類似數據,用于實現切黃瓜或整理玩具等家務活的自動化。另一家總部位于舊金山的初創公司Humyn AI也正試圖建立類似的業務。
外賣騎手通過記錄自己的工作賺錢
在美國,外賣騎手成為收集視覺數據的“工具”,他們還能從中賺取報酬。今年3月,美國外賣巨頭DoorDash推出一款名為Tasks(任務)的獨立應用。根據該公司公告,Tasks允許其美國800萬名零工從業者通過記錄自己執行各種任務的視頻來賺錢。這些數據隨后將被應用于訓練AI和機器人。
這款新應用中提供的任務包括疊衣服、洗碗筷和鋪床等日常家務,根據每項零工付出的勞動和復雜程度提供不同的報酬。像修剪植物和換盆這樣難度較高的任務,報酬則更加豐厚。
騎手還可以通過錄制其他語言的口語內容來獲得報酬。應用上的一個任務列表就提示西班牙語使用者:“與您的朋友或家人就日常話題進行自然、即興的對話”。
“我們認為,這對于構建物理智能的前沿領域將具有巨大意義。”DoorDash聯合創始人兼首席技術官安迪·方(Andy Fang)在社交媒體上談到此次發布時寫道。
去年,優步(Uber)也試點了一項類似的任務,允許其美國零工從業者通過執行額外的數字化任務來賺錢,包括上傳用于訓練AI的照片和錄音。近年來,數據標注行業蓬勃發展,數十個平臺都在雇用合同工來幫助在線訓練AI模型。
據《洛杉磯時報》報道,一款對接企業與小時工的招聘應用Instawork,一直在洛杉磯招募工人,讓他們戴上配有手機支架的頭帶,記錄打掃房間的過程。
其他機器人開發商也開發了類似的數據收集策略。總部位于美國加州的機器人公司Sunday Robotics向全國各地郵寄一種“技能捕捉手套”,人們通過戴著這種機械手套做家務來收集運動數據,數據隨后會被用來訓練該公司正在研發的AI驅動家用機器人。
然而,從收集第一人稱視角數據到實現工廠機器人的自動化,科技公司需要來自多個地區的數十億小時的高質量數據。像Build AI這樣曾獲得重量級投資的科技公司,目前聲稱收集到的數據也僅僅是冰山一角。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.