著名的Hugging Face,一家估值 45 億美元的人工智能平臺(tái),周二宣布推出Reachy Mini。這是一款售價(jià) 299 美元的桌面機(jī)器人,旨在將人工智能驅(qū)動(dòng)的機(jī)器人技術(shù)帶給全球數(shù)百萬(wàn)開(kāi)發(fā)者。
Hugging Face號(hào)稱(chēng)AI領(lǐng)域的Github,用戶(hù)數(shù)量已突破 1000 萬(wàn)。其首席執(zhí)行官Clément Delangue在一次獨(dú)家采訪中透露:“機(jī)器人技術(shù)的挑戰(zhàn)之一是,不能敲敲鍵盤(pán)就能實(shí)現(xiàn),作為具身智能,你需要具體的機(jī)器人機(jī)械結(jié)構(gòu)來(lái)構(gòu)建,但是目前機(jī)器人都非常貴。”Delangue解釋道,傳統(tǒng)的工業(yè)機(jī)器人系統(tǒng),甚至是較新的類(lèi)人機(jī)器人,比如特斯拉的 Optimus,預(yù)計(jì)售價(jià)也要在 2 萬(wàn)至 3 萬(wàn)美元之間。
這款11英寸人形機(jī)器人是Hugging Face推動(dòng)機(jī)器人開(kāi)發(fā)普及的最大膽嘗試,通過(guò)更便宜的售價(jià)以及開(kāi)源模式,挑戰(zhàn)了行業(yè)傳統(tǒng)。
發(fā)布五天后,Hugging Face 聯(lián)合創(chuàng)始人 Thomas Wolf宣布銷(xiāo)售額超100萬(wàn)美元。
小身材大能量
Reachy Mini 誕生于Pollen Robotics,這是Hugging Face 今年 4 月收購(gòu)的法國(guó)硬件初創(chuàng)公司。該機(jī)器人是首款與Hugging Face Hub原生集成的消費(fèi)產(chǎn)品,開(kāi)發(fā)者可以訪問(wèn)數(shù)千個(gè)預(yù)先構(gòu)建的 AI 模型,并通過(guò)Hugging Face的“ Spaces ”功能共享機(jī)器人應(yīng)用。
Reachy Mini在其緊湊的外形中蘊(yùn)含著先進(jìn)的功能。該機(jī)器人擁有六自由度的頭部移動(dòng)、全身旋轉(zhuǎn)、動(dòng)畫(huà)天線、廣角攝像頭、多個(gè)麥克風(fēng)和一個(gè) 5 瓦揚(yáng)聲器。無(wú)線版本配備Raspberry Pi 5計(jì)算機(jī)和電池,可實(shí)現(xiàn)完全自主。
該機(jī)器人以 DIY 套件的形式發(fā)售,可使用 Python 編程,并計(jì)劃支持 JavaScript 和 Scratch。預(yù)裝的演示應(yīng)用程序包括面部和手勢(shì)追蹤、智能伴侶功能以及舞蹈動(dòng)作,還可以創(chuàng)建和分享更多的模型。
這種方法與傳統(tǒng)的機(jī)器人公司形成了鮮明對(duì)比,后者通常每年只發(fā)布一款產(chǎn)品,且定制選項(xiàng)有限。
開(kāi)源硬件可能是機(jī)器人技術(shù)的未來(lái)
Hugging Face 計(jì)劃將所有硬件設(shè)計(jì)、軟件和組裝說(shuō)明開(kāi)源,允許任何人構(gòu)建自己的版本。
“你盡量分享,才能真正賦能社區(qū),”Delangue 解釋道。“有些人即使掌握了所有開(kāi)源的配方,也能自己動(dòng)手制作 Reachy Mini,但他們還是寧愿花 300 美元、500 美元,買(mǎi)現(xiàn)成的,或者在家輕松組裝的。”
開(kāi)源,也面臨著獨(dú)特的挑戰(zhàn)。制造成本、供應(yīng)鏈復(fù)雜性和實(shí)體配送等,構(gòu)成了限制。然而,Delangue 認(rèn)為,開(kāi)源可以創(chuàng)造寶貴的反饋循環(huán),可以通過(guò)社區(qū)快速了解用戶(hù)需求,從而融入到產(chǎn)品改進(jìn)中。
機(jī)器人最大的顧慮之一是隱私安全。Delangue 認(rèn)為,開(kāi)源機(jī)器人可以解決這些挑戰(zhàn)。“開(kāi)源,可以對(duì)抗權(quán)力集中,傳統(tǒng)機(jī)器人是黑匣子,用戶(hù)無(wú)法真正理解或控制。”他說(shuō)道。“想到最終只有少數(shù)幾家公司控制著數(shù)百萬(wàn)個(gè)家用機(jī)器人,并可能影響現(xiàn)實(shí)生活,可能會(huì)引發(fā)信任危機(jī)。”
而開(kāi)源方法允許用戶(hù)檢查代碼、理解數(shù)據(jù)流,并可在本地運(yùn)行人工智能模型,而無(wú)需依賴(lài)云服務(wù)。Hugging Face 甚至還提供企業(yè)級(jí)平臺(tái),為機(jī)器人應(yīng)用提供私有部署選項(xiàng)。
從原型到量產(chǎn)
Hugging Face 在從軟件平臺(tái)轉(zhuǎn)型為硬件公司的過(guò)程中,面臨著巨大的制造和規(guī)模化挑戰(zhàn)。該公司計(jì)劃最早于下個(gè)月開(kāi)始發(fā)售 Reachy Mini,首先推出的是更偏向 DIY 的版本,由客戶(hù)自行完成最終組裝。
“首批發(fā)售的版本會(huì)有點(diǎn)DIY的感覺(jué),一部分組裝工作我們自己做,一部分組裝工作也由用戶(hù)自己做。”Delangue 解釋道。
這種方法符合公司的目標(biāo),即在管理制造復(fù)雜性的同時(shí),吸引人工智能構(gòu)建者社區(qū)參與機(jī)器人的實(shí)踐開(kāi)發(fā)。該策略也反映了市場(chǎng)對(duì)新產(chǎn)品類(lèi)別需求的不確定性。
構(gòu)建生態(tài)系統(tǒng)推動(dòng)開(kāi)放機(jī)器人技術(shù)
Hugging Face 的機(jī)器人技術(shù)擴(kuò)展得益于整個(gè)行業(yè)的戰(zhàn)略合作伙伴關(guān)系。該公司通過(guò) Isaac Lab 與NVIDIA 合作進(jìn)行機(jī)器人模擬和訓(xùn)練,使開(kāi)發(fā)人員能夠在部署之前生成合成訓(xùn)練數(shù)據(jù)并在虛擬環(huán)境中測(cè)試機(jī)器人行為。
SmolVLA模型,一個(gè)包含 4.5 億個(gè)參數(shù)的“視覺(jué)-語(yǔ)言-動(dòng)作”模型,展示了 Reachy Mini 的技術(shù)基礎(chǔ)。該模型的設(shè)計(jì)效率極高,足以在包括 MacBook 在內(nèi)的消費(fèi)級(jí)硬件上運(yùn)行,讓個(gè)人開(kāi)發(fā)者能夠輕松使用復(fù)雜的 AI 功能,而無(wú)需昂貴的云。
加州大學(xué)伯克利分校教授Sergey Levine聯(lián)合創(chuàng)辦的初創(chuàng)公司Physical Intelligence已通過(guò) Hugging Face 開(kāi)放其Pi0 機(jī)器人基礎(chǔ)模型,為不同機(jī)器人技術(shù)方法之間的交叉融合創(chuàng)造了機(jī)會(huì)。
Hugging Face機(jī)器人的優(yōu)勢(shì)
專(zhuān)為人機(jī)交互而設(shè)計(jì)
富有表現(xiàn)力的運(yùn)動(dòng):電動(dòng)頭部和身體旋轉(zhuǎn)以及動(dòng)畫(huà)天線,可實(shí)現(xiàn)豐富的人機(jī)交互。
多模式感知:配備攝像頭、麥克風(fēng)和揚(yáng)聲器,實(shí)現(xiàn)人工智能驅(qū)動(dòng)的視聽(tīng)交互。
自己組裝:以套件形式出售,與朋友和孩子一起構(gòu)建自己的伴侶機(jī)器人。
開(kāi)放、模塊化、社區(qū)驅(qū)動(dòng)
Hugging Face Integration:使用最先進(jìn)的語(yǔ)音、視覺(jué)和個(gè)性開(kāi)源模型。
開(kāi)源一切:硬件、軟件和模擬環(huán)境完全開(kāi)源,并由社區(qū)支持。準(zhǔn)備就緒后將正式發(fā)布。
社區(qū)驅(qū)動(dòng):與 Hugging Face 社區(qū)的 1000 萬(wàn)用戶(hù)一起上傳、共享和下載機(jī)器人行為。
適合教學(xué):一切開(kāi)源開(kāi)放,非常適合學(xué)生學(xué)習(xí)機(jī)器人與AI相關(guān)技能。
Hugging Face并不孤獨(dú)
斯坦福大學(xué)的學(xué)生正在利用硬件套件構(gòu)建一個(gè)名為Pupper的四足機(jī)器人,并將其應(yīng)用于課程中。在計(jì)算機(jī)科學(xué)系的CS 123課程“構(gòu)建AI機(jī)器人的實(shí)踐入門(mén)”中,學(xué)生們將在10周內(nèi)學(xué)習(xí)從電機(jī)控制到機(jī)器學(xué)習(xí)等全方位的機(jī)器人技術(shù)。
“Pupper”由斯坦福學(xué)生機(jī)器人俱樂(lè)部于2019年開(kāi)發(fā)的四足機(jī)器人“Doggo”進(jìn)化而來(lái)。Doggo提供了一種以低成本創(chuàng)建和設(shè)計(jì)四足機(jī)器人的方法,并且能夠進(jìn)行后空翻。該團(tuán)隊(duì)看到了這個(gè)可愛(ài)的四足機(jī)器人讓機(jī)器人技術(shù)變得平易近人且充滿樂(lè)趣的潛力,并提議將它用于課堂教學(xué)。
這款四足機(jī)器狗以低廉的DIY成本900美元,為科技愛(ài)好者提供了親民的科技體驗(yàn)。Pupper 的代碼已經(jīng)全部開(kāi)源,設(shè)計(jì)文件也可以免費(fèi)獲取。
Pupper使用樹(shù)莓派作為核心計(jì)算平臺(tái),搭配定制的PCB板(優(yōu)化版本集成了5V電源模塊和MPU9250 IMU模塊),通過(guò)舵機(jī)實(shí)現(xiàn)四足運(yùn)動(dòng)。Pupper的控制軟件基于Python,支持ROS框架,便于開(kāi)發(fā)者實(shí)現(xiàn)運(yùn)動(dòng)規(guī)劃和控制算法。
開(kāi)源加速機(jī)器人行業(yè)的創(chuàng)新
Hugging Face 的做法可能會(huì)從根本上改變機(jī)器人行業(yè)的格局。傳統(tǒng)的機(jī)器人公司在專(zhuān)有技術(shù)上投入巨資,將創(chuàng)新限制在內(nèi)部團(tuán)隊(duì)。開(kāi)源模式可以釋放數(shù)千名開(kāi)發(fā)人員的分布式創(chuàng)新,從而有可能加速進(jìn)步并降低成本。
然而,與軟件相比,硬件面臨著獨(dú)特的挑戰(zhàn)。制造質(zhì)量控制、供應(yīng)鏈管理和物理安全要求帶來(lái)了純數(shù)字產(chǎn)品所不具備的復(fù)雜性。該公司能否在秉持開(kāi)源理念的同時(shí)應(yīng)對(duì)這些挑戰(zhàn),將決定該平臺(tái)的長(zhǎng)期成功。
無(wú)論 Reachy Mini 成功與否,它的推出都標(biāo)志著機(jī)器人技術(shù)發(fā)展的一個(gè)關(guān)鍵時(shí)刻。這是第一次,一個(gè)主要的人工智能平臺(tái)押注機(jī)器人技術(shù)的未來(lái)不屬于企業(yè)研究實(shí)驗(yàn)室,而是屬于數(shù)百萬(wàn)擁有價(jià)格實(shí)惠的開(kāi)源工具的個(gè)人開(kāi)發(fā)者。在一個(gè)長(zhǎng)期被保密和六位數(shù)價(jià)格標(biāo)簽所主導(dǎo)的行業(yè)中,這或許是最具革命性的想法。
誠(chéng)邀汽車(chē)電子工程師
微信添加“helloeeworld2”管理員為好友,備注:TI汽車(chē),即可加入TI汽車(chē)技術(shù)交流群,和汽車(chē)行業(yè)圈內(nèi)工程師,或者對(duì)汽車(chē)行業(yè)感興趣的網(wǎng)友交流。
掃碼添加,備注:TI汽車(chē),入群交流。
歡迎將我們?cè)O(shè)為“星標(biāo)”,這樣才能第一時(shí)間收到推送消息。
關(guān)注EEWorld旗下訂閱號(hào):“機(jī)器人開(kāi)發(fā)圈”
回復(fù)“DS”領(lǐng)取《DeepSeek:從入門(mén)到精通》完整版
掃碼添加小助手回復(fù)“機(jī)器人”
進(jìn)群和電子工程師們面對(duì)面交流經(jīng)驗(yàn)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.