![]()
編輯丨%
如果知道正確地提出需求,那么機器人就會成為令人愛恨交加的玩意:它們幾乎可以完成你想要它們做的任何事情。在不久的過去,正確地要求意味著編寫代碼,雖然人類已經(jīng)幸運地超越了這種脆弱的限制,但使用簡便程度和任務復雜程度之間仍然存在令人煩惱的負相關聯(lián)系。
AI 承諾改變這一點。其理念是當 AI 被賦予機器人——使人工智能軟件在世界上擁有物理存在——這些機器人將被賦予推理和理解能力。這是尖端技術,盡管我們已經(jīng)看到了許多在研究環(huán)境中體現(xiàn) AI 的例子,但要找到推理機器人能夠提供可靠商業(yè)價值的應用并不容易。
波士頓動力公司是少數(shù)幾家在可觀的規(guī)模上商業(yè)化部署了腿式機器人的公司之一;現(xiàn)在已有數(shù)千臺機器人在工作。jinri該公司宣布,其四足機器人 Spot 現(xiàn)在配備了谷歌 DeepMind 的 Gemini Robotics-ER 1.6,這是一種高級體感推理模型,為復雜任務帶來了可用性和智能。
![]()
圖示:Spot 在家中運行。
https://youtu.be/LP4-c5AK30g?si=dwB5ylGCChAAnP0D
雖然有關團隊展示了 Spot 在家中的場景,但這次合作的重點是少數(shù)幾個足部機器人在商業(yè)上可行的應用之一:檢查。也就是說,在工業(yè)設施中走動,檢查是否有即將爆炸的危險。有了新的 AI,Spot 現(xiàn)在能夠自主尋找危險的碎片或泄漏物,讀取復雜的儀表和視鏡,并在需要幫助理解周圍環(huán)境時調(diào)用視覺-語言-動作模型等工具。
理解機器人理解
“推理”和“理解”這兩個詞越來越多地被應用于人工智能和機器人領域,但這些詞在實際中對于機器人究竟意味著什么并不總是很明確。“當我們談論理解時,我們衡量自己的基準是系統(tǒng)應該像人類一樣回答,”谷歌 DeepMind 的機器人負責人 Carolina Parada 在一次采訪中解釋道。
為了讓機器人可靠且安全地執(zhí)行任務,機器人理解世界的方式與人類理解的方式之間的聯(lián)系至關重要。否則,人類給機器人的指令和機器人決定如何執(zhí)行任務之間可能會出現(xiàn)脫節(jié)。
視頻中就是一個顯而易見的例子。給 Spot 的指令之一是“回收客廳里的任何罐頭”,這對它而言并不困難,但在完成任務時,它橫著抓住罐頭,這對那些里面還有剩余液體的罐頭來說可就不妙了。我們會避免這種情況,因為我們能憑經(jīng)驗就知道罐頭應該如何拿取,但機器人還沒有(具備)那種世界知識。
![]()
圖示:機器人技術賦能的智能檢測。
https://youtu.be/kBwxmlI2yHQ?si=sGn6J9LkgWLqjbpo
作為一個高級推理模型,Gemini Robotics-ER 1.6 與機器人本身作為物理世界的接口之間似乎仍存在一定程度上的脫節(jié)。該版本的一個新功能是成功檢測,它結(jié)合多個攝像頭角度來更可靠地判斷 Spot 是否成功抓取了物體。
這對于完全依賴視覺進行物體交互的機器人來說,非常合適。但機器人有各種其他成熟的方法來檢測成功抓取,包括觸覺傳感器和力傳感器,而 1.6 并沒有使用這些方法。這種情況的原因涉及到機器人領域仍在試圖解決的問題:當需要物理數(shù)據(jù)時如何訓練模型。
Parada 表示,目前網(wǎng)絡上關于視覺訓練的信息很多,但帶有觸覺傳感的數(shù)據(jù)并不多見。倘若能尋找到更多有關數(shù)據(jù),學習會更加輕松。
實用的現(xiàn)實機器人
在依賴 AI 進行商業(yè)部署的腿式機器人領域,波士頓動力憑借其客戶市場顯得格格不入。涉及 AI 時,客戶對于機器人的信任度始終是一個問題。
在一次采訪中,相關負責人表示,他們通過 Beta 計劃將新的 DeepMind 功能向一小部分客戶推出,以了解需要預期什么,并且只宣傳那些有信心能起作用的部分。
作為可擴展的商業(yè)平臺的稀有地位,Spot 帶來了一個寶貴的機會,讓人們得以認識到像 Gemini Robotics-ER 1.6 這樣的模型如何最有效,然后將這些知識應用于其他具身 AI 平臺。
這意味著波士頓動力的 Atlas 將成為下一個工業(yè)檢查機器人嗎?可能不會。但如果這種實際經(jīng)驗能讓人們更接近于能夠安全可靠地撿起衣物、遛狗、清理易拉罐而不弄臟環(huán)境的機器人,那將是未來一件極為有趣的事。
https://spectrum.ieee.org/boston-dynamics-spot-google-deepmind
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.