亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌深夜大招!機(jī)器人學(xué)會看儀表盤干活,成功率飆升300%

0
分享至


機(jī)器人前瞻(公眾號:robot_pro)
作者 許麗思
編輯 漠影

智東西4月15日報(bào)道,昨天深夜,谷歌推出Gemini Robotics-ER 1.6。

去年9月,谷歌發(fā)布Gemini Robotics-ER 1.5。時(shí)隔半年多,谷歌機(jī)器人模型終于迎來一次大升級。

Gemini Robotics-ER 1.6能夠讓機(jī)器人以前所未有的精度理解周圍環(huán)境,在多項(xiàng)關(guān)鍵推理能力上進(jìn)行了升級,包括視覺與空間理解、任務(wù)規(guī)劃以及任務(wù)完成判斷。它可以作為機(jī)器人的高層推理模型,原生調(diào)用Google Search、VLA以及其他第三方自定義功能,自主完成復(fù)雜作業(yè)任務(wù)。

谷歌提到,與Gemini Robotics-ER 1.5和Gemini 3.0 Flash相比,Gemini Robotics-ER 1.6在空間與物理推理能力上都有明顯提升,尤其是在點(diǎn)位定位、計(jì)數(shù)和任務(wù)成功判斷等方面。

與此同時(shí),Gemini Robotics-ER 1.6還新增了一項(xiàng)能力——儀表讀數(shù),這使機(jī)器人能夠讀取復(fù)雜的壓力表和液位觀察窗等設(shè)備。該功能是谷歌與波士頓動力合作開發(fā)的,特別適合用于高精度工業(yè)任務(wù)。

如圖,在指向與計(jì)數(shù)任務(wù)上,Gemini Robotics-ER 1.6的成功率為80%;在單視角成功檢測任務(wù)中,其成功率為90%;在多視角成功檢測任務(wù)中,其成功率為84%;在結(jié)合Agentic Vision的儀表讀數(shù)任務(wù)中,其成功率達(dá)到93%,相比Gemini Robotics-ER 1.523%的成功率,飆升了300%。


即日起,開發(fā)者就可以通過Gemini API和Google AI Studio使用Gemini Robotics-ER 1.6。

一、升級點(diǎn)位定位和多視角推理能力,提升機(jī)器人干活自主性

點(diǎn)位定位是具身推理模型的一項(xiàng)基礎(chǔ)能力,可以讓模型實(shí)現(xiàn)不同類型的推理任務(wù),包括空間推理、關(guān)系邏輯、運(yùn)動推理、約束理解等。

Gemini Robotics-ER 1.6可以把點(diǎn)位作為中間推理步驟,來完成更復(fù)雜的任務(wù)。它可以先通過點(diǎn)位來計(jì)數(shù)圖像中的物體,或者通過識別關(guān)鍵位置,再結(jié)合數(shù)學(xué)計(jì)算提高尺寸或距離估算的準(zhǔn)確性。

如圖,Gemini Robotics-ER 1.6知道什么時(shí)候該指出目標(biāo)、什么時(shí)候不該亂指。它能正確識別圖中有2把錘子、1把剪刀、1把油漆刷、6把鉗子,以及一組園藝工具。對于圖中并不存在的手推車和電鉆,它也不會錯(cuò)誤標(biāo)注。

相比之下,Gemini Robotics-ER 1.5就沒法正確識別錘子和油漆刷的數(shù)量,完全漏掉了剪刀,還會產(chǎn)生幻覺,指出了并不存在的手推車,鉗子的定位精度也較差。

Gemini 3.0 Flash的表現(xiàn)已經(jīng)比較接近Gemini Robotics-ER 1.6,但在鉗子的處理上還不夠理想。

Gemini Robotics-ER 1.6還提升了多視角推理能力,能夠更好地理解多路攝像頭畫面以及它們之間的關(guān)系,即便在動態(tài)變化或存在遮擋的環(huán)境中,也能保持較高的判斷能力。

Gemini Robotics-ER 1.6可以綜合多個(gè)攝像頭視角的信息,判斷“把藍(lán)色筆放進(jìn)黑色筆筒”這一任務(wù)是否已經(jīng)完成。

像這樣的任務(wù)成功判斷(Success Detection)是機(jī)器人實(shí)現(xiàn)自主性的關(guān)鍵一環(huán),因?yàn)樗鼪Q定了機(jī)器人在執(zhí)行任務(wù)過程中,是應(yīng)該重新嘗試一次,還是可以進(jìn)入下一步。

二、儀表識別成功率達(dá)93%,機(jī)器人可執(zhí)行設(shè)備巡檢任務(wù)

工業(yè)廠區(qū)遍布溫度計(jì)、壓力表、化學(xué)液位觀測窗等各類精密儀器,需要長期持續(xù)監(jiān)測。想要解決真實(shí)工業(yè)場景中這些復(fù)雜難題,就必須讓機(jī)器人學(xué)會儀器讀數(shù)識別。

Gemini Robotics-ER 1.6讓機(jī)器人能夠讀懂多種儀表,包括圓形壓力表、垂直液位計(jì)以及現(xiàn)代數(shù)字讀數(shù)設(shè)備。

讀取儀表并不是簡單的識別任務(wù),而是一個(gè)復(fù)雜的視覺推理過程。系統(tǒng)必須精確感知多種視覺元素,例如指針、液位、容器邊界、刻度線等,并理解它們之間的關(guān)系。

液位觀察窗為例,模型需要結(jié)合相機(jī)拍攝角度帶來的畸變,估算液體實(shí)際填充了多少。對于壓力表,系統(tǒng)還需要讀取并理解文字標(biāo)注的單位;有些表盤甚至有多根指針,對應(yīng)不同的小數(shù)位,必須綜合后才能得出正確讀數(shù)。

依托儀器讀數(shù)識別與升級后的任務(wù)推理能力,波士頓動力的Spot四足機(jī)器人可以實(shí)現(xiàn)全自主巡檢,獨(dú)立感知、理解并應(yīng)對各類工業(yè)實(shí)景挑戰(zhàn)。


Gemini Robotics-ER 1.6之所以能夠?qū)崿F(xiàn)高精度儀表讀數(shù),是因?yàn)樗褂昧?strong>Agentic Vision技術(shù),也就是把視覺推理與代碼執(zhí)行結(jié)合起來。

具體來說,模型會先采取一系列中間步驟:比如先放大圖像,更清楚地觀察儀表細(xì)節(jié);再通過點(diǎn)位標(biāo)注和代碼執(zhí)行估算比例與區(qū)間,最終得到精確讀數(shù),并結(jié)合世界知識理解其含義。


在儀表讀數(shù)任務(wù)上,四種模型的成功率依次提升:Gemini Robotics-ER 1.5成功率為23%;Gemini 3.0 Flash成功率為67%;Gemini Robotics-ER 1.6成功率為86%;Gemini Robotics-ER 1.6(啟用 agentic vision)成功率為93%。


結(jié)語:機(jī)器人走入現(xiàn)實(shí)應(yīng)用,還需要具備足夠安全性

在機(jī)器人規(guī)?;涞孛裼门c工業(yè)場景的當(dāng)下,安全性早已和智能化、自主性同等重要,成為制約具身智能落地的核心門檻。

谷歌稱,Gemini Robotics-ER 1.6不僅在環(huán)境感知、空間推理、工業(yè)儀表識別等核心能力全面進(jìn)階,更完成了安全能力的系統(tǒng)性升級,也是其目前安全表現(xiàn)最優(yōu)的機(jī)器人專用模型。

在對抗性空間推理任務(wù)中,Gemini Robotics-ER 1.6對Gemini安全策略的遵守程度優(yōu)于此前所有版本。同時(shí),Gemini Robotics-ER 1.6在遵守物理安全約束方面也有明顯提升。

比如,在涉及點(diǎn)位輸出的任務(wù)中,它能更安全地判斷哪些物體可以被機(jī)械夾爪抓取,哪些不能碰,從而滿足夾持器限制或材料約束,比如“不要處理液體”“不要抓取超過20公斤的物體”等。

谷歌還測試了模型在文本和視頻場景中識別安全隱患的能力,測試依據(jù)來自真實(shí)世界的傷害事故報(bào)告。在這些任務(wù)中,Gemini Robotics-ER 1.6相比Gemini 3.0 Flash也有所提升:文本場景提升6%,視頻場景提升10%,說明它在識別潛在傷害風(fēng)險(xiǎn)方面更加準(zhǔn)確。


對具身智能而言,真正決定機(jī)器人能否走出實(shí)驗(yàn)室、走進(jìn)大規(guī)模真實(shí)場景的,除了更強(qiáng)的大腦,還需要每一次感知、判斷與動作背后,都足夠安全可靠。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
狐貍尾巴藏不住!以為能“毀掉”全紅嬋,不料自己先被扒個(gè)底朝天

狐貍尾巴藏不?。∫詾槟堋皻У簟比t嬋,不料自己先被扒個(gè)底朝天

阿褲趣聞君
2026-04-14 04:33:26
1921年,兩個(gè)特務(wù)拽住毛主席問:你認(rèn)識毛澤東嗎?找到他賞你大洋

1921年,兩個(gè)特務(wù)拽住毛主席問:你認(rèn)識毛澤東嗎?找到他賞你大洋

銅臭的歷史味
2026-04-14 10:49:26
開拓者晉級季后賽更衣室!斯普利特講話爆贊2將,楊瀚森開心壞了

開拓者晉級季后賽更衣室!斯普利特講話爆贊2將,楊瀚森開心壞了

籃球資訊達(dá)人
2026-04-15 14:55:05
南京出生4天嬰兒被秤砣砸中受傷,最新進(jìn)展:社區(qū)訪視新生兒改用電子秤

南京出生4天嬰兒被秤砣砸中受傷,最新進(jìn)展:社區(qū)訪視新生兒改用電子秤

大風(fēng)新聞
2026-04-15 18:15:04
一季報(bào)業(yè)績爆發(fā)!有色、半導(dǎo)體、光通信,誰是下一個(gè)“業(yè)績王”?

一季報(bào)業(yè)績爆發(fā)!有色、半導(dǎo)體、光通信,誰是下一個(gè)“業(yè)績王”?

小白鴿財(cái)經(jīng)
2026-04-13 20:30:03
何超蕸私生活曝光!信德員工證實(shí):相伴多年伴侶,3位密友陪伴

何超蕸私生活曝光!信德員工證實(shí):相伴多年伴侶,3位密友陪伴

一盅情懷
2026-04-14 09:47:33
煮蝦時(shí),用“開水”還是“冷水”?區(qū)別很大,做錯(cuò)了蝦又老腥味重

煮蝦時(shí),用“開水”還是“冷水”?區(qū)別很大,做錯(cuò)了蝦又老腥味重

阿龍美食記
2026-04-11 14:10:04
伊朗出土元朝羊皮信,學(xué)術(shù)界研究后震驚:波斯可能曾是中國一個(gè)省

伊朗出土元朝羊皮信,學(xué)術(shù)界研究后震驚:波斯可能曾是中國一個(gè)省

抽象派大師
2026-04-15 18:35:46
烏克蘭5枚風(fēng)暴陰影導(dǎo)彈重創(chuàng)頓涅茨克機(jī)場!摧毀俄軍倉庫

烏克蘭5枚風(fēng)暴陰影導(dǎo)彈重創(chuàng)頓涅茨克機(jī)場!摧毀俄軍倉庫

項(xiàng)鵬飛
2026-04-15 21:08:30
同事借我車去青海,我提前把ETC卡拔了,2小時(shí)后他從收費(fèi)站來電了

同事借我車去青海,我提前把ETC卡拔了,2小時(shí)后他從收費(fèi)站來電了

張道陵秘話
2026-04-11 16:37:21
2001年,華國鋒在80歲壽宴上感嘆:國家的前途就在你們年輕人身上

2001年,華國鋒在80歲壽宴上感嘆:國家的前途就在你們年輕人身上

莫地方
2026-04-15 11:39:21
封鎖伊朗第一天,美100架軍機(jī)不頂用!全球開始站隊(duì),中國辦大事

封鎖伊朗第一天,美100架軍機(jī)不頂用!全球開始站隊(duì),中國辦大事

南宗歷史
2026-04-15 14:25:16
浙金中心案件關(guān)鍵性進(jìn)展:追回 11億贓款,逃亡境外者全部押解回國

浙金中心案件關(guān)鍵性進(jìn)展:追回 11億贓款,逃亡境外者全部押解回國

新浪財(cái)經(jīng)
2026-04-15 14:09:10
歷史性一刻!中阿一口氣簽24項(xiàng)協(xié)議,非石油貿(mào)易首破1000億美元!

歷史性一刻!中阿一口氣簽24項(xiàng)協(xié)議,非石油貿(mào)易首破1000億美元!

云舟史策
2026-04-15 07:39:12
301189,突然大漲,發(fā)生了什么?創(chuàng)新藥迎來價(jià)值回歸,業(yè)績高增長股揭秘

301189,突然大漲,發(fā)生了什么?創(chuàng)新藥迎來價(jià)值回歸,業(yè)績高增長股揭秘

數(shù)據(jù)寶
2026-04-15 19:03:15
安徽各地2026年1-2月財(cái)政收入排行:蕪湖接近百億,宣城增長11.6%

安徽各地2026年1-2月財(cái)政收入排行:蕪湖接近百億,宣城增長11.6%

水又木二
2026-04-15 12:18:54
家長擔(dān)心女兒太美,發(fā)明“防早戀”發(fā)型,網(wǎng)友:顏值已經(jīng)很安全了

家長擔(dān)心女兒太美,發(fā)明“防早戀”發(fā)型,網(wǎng)友:顏值已經(jīng)很安全了

蝴蝶花雨話教育
2026-04-10 13:25:02
中俄動作迅猛,特朗普炮頭調(diào)轉(zhuǎn),對日審判已經(jīng)開始,高市被催下臺

中俄動作迅猛,特朗普炮頭調(diào)轉(zhuǎn),對日審判已經(jīng)開始,高市被催下臺

軒逸阿II
2026-04-12 05:19:52
114-110!開拓者搶下季后賽門票,楊瀚森或迎歷史登場

114-110!開拓者搶下季后賽門票,楊瀚森或迎歷史登場

阿晞體育
2026-04-15 20:55:33
四連敗!山東男籃不敵北控,鄒雨宸13+10+8帽,陶漢林13+13

四連??!山東男籃不敵北控,鄒雨宸13+10+8帽,陶漢林13+13

中國籃壇快訊
2026-04-15 21:36:10
2026-04-15 21:51:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11593文章數(shù) 117029關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

伊朗總統(tǒng)發(fā)表講話質(zhì)問美國和以色列:憑什么攻擊伊朗

頭條要聞

伊朗總統(tǒng)發(fā)表講話質(zhì)問美國和以色列:憑什么攻擊伊朗

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

財(cái)經(jīng)要聞

業(yè)績失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評測

態(tài)度原創(chuàng)

時(shí)尚
手機(jī)
家居
親子
教育

拍膩了海馬體的年輕人,開始報(bào)復(fù)性拍“丑照”

手機(jī)要聞

小米 MIX5 全面爆料:玄戒 O2+9000mAh+3D 屏下,真全面屏終極形態(tài)

家居要聞

簡而不減 暖居之道

親子要聞

為什么孩子被騙不會告訴你?

教育要聞

最新!市教委公布24項(xiàng)中小學(xué)生市級活動名單

無障礙瀏覽 進(jìn)入關(guān)懷版