在機(jī)器人領(lǐng)域,AI才剛剛開(kāi)始展露頭角。
不久前,一家名為Figure的初創(chuàng)企業(yè),估值高達(dá)26億美元,由一群來(lái)自波士頓動(dòng)力、特斯拉、谷歌DeepMind和Archer Aviation的前員工成立。今天,他們與新投資者及合作伙伴OpenAI的首次合作問(wèn)世,著實(shí)令人眼前一亮。
Figure的聯(lián)合創(chuàng)始人兼CEO Brett Adcock在社交平臺(tái)X上分享了一段視頻,展示了他們的全尺寸人形機(jī)器人Figure 01的能力。
視頻中,這位機(jī)器人展示了它與人類(lèi)和環(huán)境互動(dòng)的能力:遵循人類(lèi)的指令,找到并遞給他們物品(比如一個(gè)蘋(píng)果),同時(shí)描述它正在做什么并與人對(duì)話(huà)(盡管反應(yīng)時(shí)間比人與人交流時(shí)稍有延遲),自主識(shí)別、規(guī)劃并執(zhí)行有益的任務(wù)(比如撿垃圾和把盤(pán)子放到晾碗架上)。
視頻如科幻電影般展開(kāi):
人類(lèi)詢(xún)問(wèn)“嘿,F(xiàn)igure One,你現(xiàn)在看到了什么?”
機(jī)器人回答:“我看到桌子中央有個(gè)紅蘋(píng)果,一個(gè)晾碗架里有杯子和盤(pán)子,還有你,手搭在桌子上。”
“太好了,我能吃點(diǎn)什么嗎?”人類(lèi)問(wèn)道。
“當(dāng)然可以。”Figure One回答,小心翼翼地伸手抓起蘋(píng)果,遞給人類(lèi)——它明白蘋(píng)果是桌面上唯一可食用的物品,即使人類(lèi)沒(méi)有特別指明。
接著,視頻展示了Figure撿起垃圾,把盤(pán)子和杯子放入晾碗架的場(chǎng)景。
OpenAI新模型的問(wèn)世?OpenAI VLM
Adcock在X上的帖子中提到,F(xiàn)igure的機(jī)載攝像頭輸入到由OpenAI訓(xùn)練的大型視覺(jué)語(yǔ)言模型(VLM)中,但目前還不清楚這是否是GPT-4的一個(gè)版本,是GPT-4V,還是完全新的模型。
Adcock還宣稱(chēng):“視頻展示了端到端的神經(jīng)網(wǎng)絡(luò)。沒(méi)有遙控操作。此外,視頻是以1.0倍速拍攝并連續(xù)拍攝的。”換句話(huà)說(shuō):視頻沒(méi)有加速,這一點(diǎn)與以往的人形機(jī)器人演示視頻常做的不同,那些視頻通常加速以展現(xiàn)更流暢的動(dòng)作,并且沒(méi)有人在幕后遠(yuǎn)程控制機(jī)器人的動(dòng)作。
Figure接下來(lái)的路
Figure的演示視頻似乎是人形、通用目的機(jī)器人互動(dòng)領(lǐng)域的一大飛躍——展示了一臺(tái)機(jī)器人與人相當(dāng)自然地互動(dòng),聽(tīng)從人的指令,憑直覺(jué)做出反應(yīng),并且動(dòng)作比許多其他公司和研究者的示例要流暢得多。
當(dāng)然,這依然只是一個(gè)演示,而且是一個(gè)原型。要讓這樣的機(jī)器人做好商業(yè)部署的準(zhǔn)備,并將其出售給企業(yè)或個(gè)人,可能還需要大量的工作。
然而,Adcock在X上的帖子中明確表示,“我們的目標(biāo)是訓(xùn)練一個(gè)世界模型,使億級(jí)單位的人形機(jī)器人運(yùn)行。”
在Figure的網(wǎng)站上寫(xiě)到:“Figure的目標(biāo):開(kāi)發(fā)出對(duì)人類(lèi)有積極影響的通用人形機(jī)器人,為后代創(chuàng)造更美好的生活。這些機(jī)器人可以消除不安全和不受歡迎的工作——最終讓我們過(guò)上更快樂(lè)、更有目的的生活。”
然而,Adcock繼續(xù)說(shuō),“我們的公司旅程將持續(xù)數(shù)十年——需要一支致力于使命的冠軍團(tuán)隊(duì)、數(shù)十億美元的投資和工程創(chuàng)新,以實(shí)現(xiàn)大規(guī)模市場(chǎng)影響。我們面臨高風(fēng)險(xiǎn)和極低的成功機(jī)會(huì)。”
他還承諾:“我們不會(huì)將人形機(jī)器人用于軍事或防御應(yīng)用,也不會(huì)用于需要對(duì)人類(lèi)造成傷害的角色。”
Adcock和Figure今天展示的進(jìn)展,得益于OpenAI的支持,可能會(huì)給像特斯拉的Optimus項(xiàng)目和與亞馬遜合作的人形機(jī)器人初創(chuàng)公司Agility等領(lǐng)域的競(jìng)爭(zhēng)對(duì)手帶來(lái)更大的壓力。
此外,隨著越來(lái)越多的公司進(jìn)入這一領(lǐng)域,包括Hugging Face(它剛剛聘請(qǐng)了一位前特斯拉Optimus科學(xué)家來(lái)領(lǐng)導(dǎo)其新宣布的開(kāi)源機(jī)器人項(xiàng)目)和昨天宣布的一家名為Physical Intelligence的初創(chuàng)公司,競(jìng)爭(zhēng)將變得更加激烈。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.