網易首頁 > 網易號 > 正文申請入駐

英偉達推出LocateAnything，主打AI高速、高精度檢測對象

2026-05-30 10:54:55　來源: IT之家

山東舉報

分享至

IT之家 5 月 30 日消息，英偉達昨日（5 月 29 日）發布博文，宣布攜手香港理工大學、南京大學等，推出 LocateAnything 模型，主打高速、高精度檢測對象。

該模型可以從照片或截圖中找出指定對象，并用檢測框標出位置，重點服務機器人感知、電腦自動操作等需要快速定位的場景。

NVIDIA 在介紹中強調，機器人和 AI Agent（智能體）僅能“看見”還不夠，還必須足夠快地確認目標位置。LocateAnything 圍繞檢測框預測重新設計，讓視覺語言檢測更適合即時交互任務。

LocateAnything 提出 Parallel Box Decoding（并行框解碼），把邊界框或點作為固定長度原子單元，在 1 步內預測 x1、y1、x2、y2。

該框架提供 Fast Mode、Slow Mode 與 Hybrid Mode：

Fast Mode 面向端側機器人和具身智能，強調吞吐；
Slow Mode 偏向離線標注和高精度評測；
Hybrid Mode 默認快速輸出，遇到格式異常或空間歧義時切回自回歸解碼。

團隊還構建 LocateAnything-Data，包含 12M 獨立圖像、138M 語言查詢和 785M 邊界框。數據覆蓋通用檢測、GUI 元素定位、指代表達理解、OCR 文字定位、版面定位和點定位，顯著擴展訓練場景。

在單張 NVIDIA H100 GPU 上，LocateAnything 默認 Hybrid Mode 達到 12.7 Boxes Per Second（每秒框數），超過 Qwen3-VL 的 1.1 BPS，也高于 Rex-Omni 的 5.0 BPS。

高精度任務中，LocateAnything 在 LVIS 的 IoU=0.95 下得分 31.1，高于 Rex-Omni 的 20.7；ScreenSpot-Pro 平均 F1 達 60.3；DocLayNet 和 M6Doc 分別達 76.8 與 70.1。

IT之家附上參考地址

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

索尼研發乒乓球機器人打敗日本頂尖選手

每日經濟新聞 2026-04-23 17:49:24
1573 跟貼 1573
機器人打包運輸的正確方式

裝甲鏟史官 2026-02-22 10:41:15
17 跟貼 17

AI走向物理世界的“臨門一腳”還差什么？｜直擊BEYOND Expo 2026

財聯社 2026-05-30 22:44:22
0 跟貼 0

新穎鰭足機器人，水陸兩棲行動自如，適應各種地形

裝甲鏟史官 2025-12-25 10:58:04
0 跟貼 0
亦莊機器人馬拉松現場名場面合集

量子位 2026-04-20 00:34:54
0 跟貼 0

宇樹科技王興興：兩三個月后機器人奔跑速度或將超過博爾特，希望推動具身智能邁向ChatGPT時刻

每日經濟新聞 2026-05-28 23:21:19
1 跟貼 1

LLM數據量大管飽，機器人數據卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0
BEYOND Expo 2026觀察：AI硬件火爆，中東主權基金開始篩選中國公司

經濟觀察報 2026-05-29 11:44:04
0 跟貼 0

人形機器人半馬跑姿大賞，有的比人快多了！有的“狀況百出”

每日經濟新聞 2026-04-20 00:25:36
0 跟貼 0
朗極智能面向構建智能機器人系統發力2

36氪 2026-05-18 12:47:03
0 跟貼 0
520，人類如何回應AI的告白

虎嗅APP 2026-05-20 20:04:19
0 跟貼 0
朱旻琦：具身智能用一天進化一天、聰明一天機器人普及核心痛點是需要二次開發和適配

財聯社 2026-04-17 16:59:02
0 跟貼 0
機器人半馬成績，超越人類紀錄

財聯社 2026-04-20 00:27:12
0 跟貼 0
萬幀照片級仿真2

機器之心Pro 2026-05-07 17:57:19
0 跟貼 0
黃仁勛親臨現場！COMPUTEX 2026終極前瞻：AI計算統治一切？

雷科技 2026-05-30 21:29:07
2 跟貼 2
不跳舞、不打拳、也不擰螺絲，陳震和他的機器人扎進后廚炸雞塊

鈦媒體APP 2026-04-17 17:35:08
0 跟貼 0
Agent輸出到底該用誰？卡帕西轉發：試試讓AI輸出HTML

量子位 2026-05-13 07:19:50
0 跟貼 0
讓你的龍蝦秒變電影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟貼 0
MIT研究生用NotebookLM兩天學完一學期課程

量子位 2026-03-22 10:50:49
0 跟貼 0
對談樓天城：Harness會成為AI時代最關鍵的能力之一

量子位 2026-05-06 15:41:08
0 跟貼 0
大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
安心養蝦！從OpenClaw 看云上AI安全落地路徑

量子位 2026-04-18 19:55:39
0 跟貼 0
Anthropic的AI讀心術，讓人類讀懂大模型在想啥

量子位 2026-05-10 23:00:57
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
王曉野：Working Agent將是下一個爆發點

量子位 2026-05-21 08:05:51
0 跟貼 0
博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0
邱錫鵬：未來我們一定會進入泛情境智能時代

量子位 2026-05-21 08:04:26
0 跟貼 0
如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0
Salesforce指引不及預期，AI顛覆軟件隱憂加劇｜財報見聞

華爾街見聞官方 2026-05-31 04:29:12
0 跟貼 0
一座未來城市，到底長成什么樣子？

科學火箭叔 2026-05-30 10:40:17
1 跟貼 1
原來有錢人連買烤玉米都有優速通！

劇坐家花花 2026-05-29 10:13:26
651 跟貼 651
黃仁勛：AI時代“孩子學什么專業并不重要”

財聯社 2026-05-28 10:54:03
0 跟貼 0
英偉達x清華Gamma World迅速登頂抱抱臉多智能體世界模型γ-World

量子位 2026-05-30 20:18:29
0 跟貼 0
英偉達微軟聯合預熱新處理器，車主訴特斯拉FSD案國內開庭，MiniMax啟動A股IPO進程，神舟二十一號乘組凱旋，這就是今天的其他大新聞！

差評XPIN 2026-05-31 00:07:02
0 跟貼 0
領先于Transformer！

機器之心Pro 2026-05-06 17:01:48
0 跟貼 0
英偉達開源個量子AI

機器之心Pro 2026-04-15 12:05:50
0 跟貼 0

手機 / 數碼

房產 / 家居

英偉達推出LocateAnything，主打AI高速、高精度檢測對象

車圈大佬發聲：價格戰遠去，但競爭仍殘酷

兩名9歲女孩被困電梯近2小時 求救幾十次物業無動于衷

兩名9歲女孩被困電梯近2小時 求救幾十次物業無動于衷

巴黎再度捧起歐冠獎杯 槍手眾將黯然神傷

張碧晨《歌手》 “活人微死” 自嘲

雙匯管不住一頭豬

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

REDMI K90至尊版入網？K90單品激活破200萬

嘗試干細胞療法如何避免踩坑？

巫師3新DLC跨十年：年輕玩家在初發售時還是小孩！

非洲超級地標！全球最大足球場，持續推進！

用剪紙的方式，打開江蘇揚州

兩名9歲女孩被困電梯近2小時求救幾十次物業無動于衷

兩名9歲女孩被困電梯近2小時求救幾十次物業無動于衷

巴黎再度捧起歐冠獎杯槍手眾將黯然神傷

900V+3.2秒破百領克10+&領克10上市16.99萬元起