亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

具身智能的PyTorch時刻,還需要哪些“原力”?

0
分享至



過去兩年,具身智能幾乎成了全球機器人領(lǐng)域最不缺討論、卻最難落地的方向。

在北美,Embodied AI被頻繁寫進通往AGI的路線圖;在歐洲,實驗室里的機器人已經(jīng)能完成越來越復雜的多步操作;而在中國,從大廠到創(chuàng)業(yè)公司,幾乎所有與智能有關(guān)的發(fā)布里都開始出現(xiàn)“embodied”“VLA”“世界模型”等關(guān)鍵詞。

IDC預(yù)測,2026年的全球人形機器人市場將翻倍,中國具身智能支出規(guī)模或?qū)⒊^110億美元,從千臺級向萬臺級躍遷。

2026春節(jié)前夕已經(jīng)傳出多家具身智能企業(yè)的機器人將集體上春晚斗舞的消息。

看上去,一切都在加速。但一個略顯尷尬的現(xiàn)實是,熱度雖高,真正能穩(wěn)定跑在真實場景里的系統(tǒng)卻寥寥無幾,大多數(shù)方案仍是在通用大模型上拼湊感知、控制和執(zhí)行模塊。



行業(yè)逐漸意識到,研發(fā)新技術(shù)并不意味著真實的量產(chǎn)能力,具身智能的瓶頸正從算力Infra轉(zhuǎn)向算法Infra,也就是支撐開發(fā)、驗證和持續(xù)迭代的底層工具鏈。有沒有好用的開發(fā)框架?有沒有統(tǒng)一的評測標準?模型能不能在真實環(huán)境中越用越聰明?

換句話說,具身智能要走向大規(guī)模部署,需要的不是更多單點技術(shù),而是一套原生的、端到端的系統(tǒng)。

那么,這套系統(tǒng)應(yīng)該如何構(gòu)建?實驗室到量產(chǎn)之間還有哪些鴻溝需要跨越?



在剛剛結(jié)束的Dexmal Open Day 2026上,原力靈機發(fā)布的系列產(chǎn)品給出了一些不同的答案。



明明技術(shù)和發(fā)布會層出不窮,大規(guī)模部署卻遲遲難以落地,具身智能究竟被困在了哪里?

如果回顧過去兩年具身智能的技術(shù)脈絡(luò),會發(fā)現(xiàn)幾乎所有玩家都走上了同一條路——拼湊主義。

簡單來說,拼湊主義就是從大模型出發(fā),引入視覺、語言,再試圖通過動作頭或策略網(wǎng)絡(luò),把智能延伸到物理世界。這種方式能讓機器人快速學會看圖說話,卻難以讓它進行常識推理。一旦現(xiàn)場環(huán)境發(fā)生變化,或遇到訓練數(shù)據(jù)中未覆蓋的長尾場景,系統(tǒng)就會失效。



模型技術(shù)之外,另一個阻礙行業(yè)爆發(fā)的頑疾是行業(yè)碎片化。現(xiàn)在具身智能的開發(fā)就像是在原始森林里開路,各家的感知、規(guī)劃和控制模塊深度綁定。如果想給機器人換一個更好的視覺方案,就需要把整套控制邏輯重寫一遍。極高的重復造輪子成本讓很多初創(chuàng)團隊還沒走到交付階段就耗盡了資源。在這個節(jié)點上,開發(fā)者們真正渴望的,其實是一個像PyTorch那樣統(tǒng)一、開放且解耦的開發(fā)底座。

除了技術(shù)和開發(fā)工具,目前行業(yè)還缺乏一套能夠?qū)⒓夹g(shù)轉(zhuǎn)化為經(jīng)濟價值的衡量標準。目前主流的具身智能公司都無法回答客戶最關(guān)心的指標問題。而缺乏指標,自然難有客戶愿意為大規(guī)模量產(chǎn)買單。

正因如此,行業(yè)逐漸意識到:具身智能不能被視為大模型的下游應(yīng)用,而必須是一套具備原生技術(shù)、開發(fā)工具和商業(yè)評估標準的面向物理世界的系統(tǒng)工程。



面對碎片化的難題,誰能給出新解法?

一個值得注意的變化是,在這輪具身智能討論中,中國團隊的身影愈發(fā)清晰。

早期,中國公司更多被視為快速部署和落地的代表,而具身智能的底層范式往往由海外實驗室主導。但在最近一兩年,這種分工正在被打破。

從跨機型VLA訓練到真機評測基準、再到開源框架和數(shù)據(jù)標準,越來越多中國團隊開始直接參與到方法論層的構(gòu)建。

但這些構(gòu)建大多還停留在爭論用哪個大模型改,那么能不能直接跳出這個問題,從第一行代碼就直接為機器人而寫呢?

在剛剛結(jié)束的 Dexmal Open Day 2026 上,這個問題已經(jīng)有了一些新的思考。

Dexmal Open Day2026 是原力靈機成立之后首次面向行業(yè)專家、技術(shù)開發(fā)者、媒體等舉行的技術(shù)開放日。



開放日上,原力靈機給出的答案可以概括為一個關(guān)鍵點——以infra為底座構(gòu)建具身原生。該系統(tǒng)以DM0為原生智能內(nèi)核,以Dexbotic 2.0為算法開發(fā)Infra,以RoboChallenge為評測Infra,再以DFOL為持續(xù)進化引擎,四者共同構(gòu)成一套自洽、可擴展、可進化的具身智能基礎(chǔ)設(shè)施體系。



這一思路最直接的體現(xiàn)是其具身原生大模型DM0。與行業(yè)中常見的單任務(wù)訓練方式不同,DM0是從0開始訓練的具身原生大模型。其在預(yù)訓練階段就引入多任務(wù)、跨機型的混合訓練,覆蓋抓取、導航、全身控制等核心能力,并橫跨8種結(jié)構(gòu)差異顯著的機器人本體。例如,在A平臺上學會處理易碎品的經(jīng)驗,能夠有效遷移到B平臺處理類似物體,無需重新標注海量數(shù)據(jù)。



有意思的是,DM0只有2.4 B參數(shù),卻在真機測評里拿了單任務(wù)和多任務(wù)雙項第一。為什么?關(guān)鍵在于它用了一種叫空間推理思維鏈(Spatial CoT) 的方式來思考。

舉個例子,“把桌上的商品掃個碼計價”這句話其實很模糊,桌上可能有好幾個商品,有的被遮擋,有的反光,掃碼槍的角度也得對。DM0能夠像人一樣一步步拆解:先看清楚有哪些東西,判斷哪個是目標商品,再想“我該從哪邊靠近?手怎么動才能穩(wěn)穩(wěn)拿起它并轉(zhuǎn)到掃碼位置?”接著生成一條平滑的視覺軌跡,最后轉(zhuǎn)換成機械臂能執(zhí)行的三維動作。正因如此,它不僅能完成特定任務(wù),還能內(nèi)化物理常識,具備更強的泛化能力和魯棒性。

目前,DM0 2.4B版本代碼、模型已分別在GitHub、Hugging Face開源,模型測試任務(wù)RoboChallenge Table30的全部30個任務(wù)的參數(shù)和推理代碼也同步開源。



如果說DM0解決的是底層技術(shù),Dexbotic 2.0解決的就是如何讓能力被復用。

作為全球首個具身原生開發(fā)框架,Dexbotic 2.0的出現(xiàn)某種程度上解決了開發(fā)碎片化的難題。過去,感知、規(guī)劃與控制模塊往往深度耦合,換一個視覺模型可能就得重寫整套控制邏輯。而Dexbotic 2.0通過模塊化設(shè)計,將整個系統(tǒng)清晰拆解為三大可插拔組件:V(Vision Encoder)、L(LLM )和A(Action Expert),實現(xiàn)真正的解耦。



在此基礎(chǔ)上,它還統(tǒng)一了數(shù)據(jù)格式、訓練流程和評測標準。無論是模仿學習還是強化學習,都能在同一個框架內(nèi)高效協(xié)同,仿真訓練的結(jié)果也能無縫遷移到真機部署。這種端到端打通的思路顯著降低了具身智能系統(tǒng)的工程復雜度。

但研發(fā)與開發(fā)之后,什么能讓具身智能真正被大規(guī)模復制、走向?qū)嶋H生產(chǎn)生活場景?

真正將這一切推向商業(yè)語境的是具身原生應(yīng)用量產(chǎn)工作流DFOL(Distributed Field Online Learning)。傳統(tǒng)模式中,真實場景只是模型的考場,系統(tǒng)部署后,表現(xiàn)好就留下,表現(xiàn)差就退貨。DFOL構(gòu)建了一個“云端-現(xiàn)場”協(xié)同的持續(xù)學習閉環(huán),將成功率、動作精度、節(jié)拍(吞吐效率)等工業(yè)客戶最關(guān)心的指標直接嵌入學習目標中。



這樣一來,具身智能不再是交付即終結(jié)的一次性產(chǎn)品,而變成一種可進化、可度量、可解鎖具身應(yīng)用量產(chǎn)工作流。客戶按效果付費,廠商通過數(shù)據(jù)飛輪持續(xù)優(yōu)化體驗,形成正向商業(yè)循環(huán)。

當然,要讓這一模式被廣泛采納,還需要行業(yè)共識。原力靈機聯(lián)合Hugging Face共同發(fā)起RoboChallenge,旨在建立全球首個聚焦真機性能的大規(guī)模評測平臺。未來,各家公司不再自說自話,而是用同一套標準衡量成功率、精度與節(jié)拍,推動行業(yè)透明化與良性競爭。

這樣一來,從模型、研發(fā)到商業(yè)化、評測,具身智能就有了自己的一套原生系統(tǒng)。



站在今天回看具身智能,競爭焦點已經(jīng)發(fā)生了變化。

具身智能的上半場,拼的是單點突破,語言理解、視覺識別、運動控制輪番登場,每一項技術(shù)進步都足以掀起一輪融資熱潮。

但熱潮褪去,客戶開始更加關(guān)注技術(shù)落地能力和算法層面的開發(fā)框架。

在下半場,具身智能不再比誰的單項技術(shù)最亮眼,而是比誰擁有更強的系統(tǒng)能力、誰有更強的開發(fā)基礎(chǔ)設(shè)施。所謂系統(tǒng)能力,不是模塊的簡單堆砌,而是感知、決策、執(zhí)行、反饋各環(huán)節(jié)能否在真實物理世界中形成高效、魯棒、可進化的閉環(huán)。

2026年不是具身智能的元年,而是具身原生的元年。

所謂具身原生,意味著不再將通用AI“外掛”到機器人上,而是從第一行代碼起,就讓智能在物理交互中生長,理解重力、摩擦、碰撞,適應(yīng)光照變化、物料變異與環(huán)境擾動。



在這一意義上,原力靈機的技術(shù)產(chǎn)品矩陣提供了一條值得被認真審視的樣本路徑:用具身原生大模型彌合語義與動作的鴻溝,用開源框架降低創(chuàng)新門檻,再通過DFOL這樣的閉環(huán)機制,將工業(yè)客戶關(guān)心的成功率、精度與節(jié)拍直接轉(zhuǎn)化為可優(yōu)化的學習目標。而RoboChallenge作為真機評測Infra,用統(tǒng)一標準衡量實效,確保所有技術(shù)進步可驗證、可比較、可對齊商業(yè)需求。

歷史經(jīng)驗表明,真正的技術(shù)革命往往始于Infra的成熟。深度學習因PyTorch而爆發(fā),自動駕駛因CARLA而加速。如今,具身智能正站在自己的Infra拐點上。得Infra者,得天下。誰構(gòu)建了更開放、更高效、更貼近物理世界的基礎(chǔ)設(shè)施,誰就掌握了定義下一代智能體的能力。

而這,或許正是克服具身智能“最后一公里”難題的關(guān)鍵解法。



聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
比亞迪大火:千車焚毀燃燒5小時,非電池自燃卻撕開行業(yè)安全隱痛

比亞迪大火:千車焚毀燃燒5小時,非電池自燃卻撕開行業(yè)安全隱痛

復轉(zhuǎn)這些年
2026-04-16 12:36:34
敢攔就開戰(zhàn)?美國給“臺獨”遞刀,中方:公海銷毀沒商量

敢攔就開戰(zhàn)?美國給“臺獨”遞刀,中方:公海銷毀沒商量

華山穹劍
2026-01-19 21:32:59
向太哭訴:三個孩子廢了倆,天天做夢發(fā)財,全家只靠向佐一個人養(yǎng)

向太哭訴:三個孩子廢了倆,天天做夢發(fā)財,全家只靠向佐一個人養(yǎng)

阿廢冷眼觀察所
2026-04-17 02:57:02
仰望U8為何“涼了”

仰望U8為何“涼了”

趣味萌寵的日常
2026-04-15 04:07:54
此路不通了!哈里梅根到訪澳洲首日尷尬拉滿,一張圖戳破現(xiàn)狀

此路不通了!哈里梅根到訪澳洲首日尷尬拉滿,一張圖戳破現(xiàn)狀

鄉(xiāng)野小珥
2026-04-16 16:23:32
美高層曾提議:中國可以用1萬多億美債,從美國手中"贖回"臺灣

美高層曾提議:中國可以用1萬多億美債,從美國手中"贖回"臺灣

快樂彼岸
2026-04-09 18:35:16
這是王勵勤的妻子多娜,長得非常漂亮美麗,不知王勵勤積了多大德

這是王勵勤的妻子多娜,長得非常漂亮美麗,不知王勵勤積了多大德

阿廢冷眼觀察所
2026-04-17 01:52:46
女孩在行李箱上寫字,全網(wǎng)狂贊:這才是中國人刻在骨子里的浪漫!

女孩在行李箱上寫字,全網(wǎng)狂贊:這才是中國人刻在骨子里的浪漫!

中國藝術(shù)家
2026-04-14 05:23:31
威脅中國?美國不準與伊朗做生意,不到一天,伊外長打電話到北京

威脅中國?美國不準與伊朗做生意,不到一天,伊外長打電話到北京

愛下廚的阿釃
2026-04-17 00:32:47
《哆啦A夢》漫畫再連載完結(jié)!24年陪伴畫上句點

《哆啦A夢》漫畫再連載完結(jié)!24年陪伴畫上句點

3DM游戲
2026-04-16 10:24:33
巴西客商當場下跪:“謝謝中國,終于不用被本田雅馬哈宰了!”

巴西客商當場下跪:“謝謝中國,終于不用被本田雅馬哈宰了!”

娛樂圈的筆娛君
2026-04-16 16:35:09
除夕兩巴掌后老婆十年不進家門,我病倒才懂她十年布局

除夕兩巴掌后老婆十年不進家門,我病倒才懂她十年布局

曉艾故事匯
2026-04-12 10:23:09
特朗普抱怨“她不再是原來的那個她”,梅洛尼怎么就“變心”了?

特朗普抱怨“她不再是原來的那個她”,梅洛尼怎么就“變心”了?

上觀新聞
2026-04-16 13:47:03
關(guān)稅這些都是小打小鬧,真正的中美大決戰(zhàn),決勝于未來五年

關(guān)稅這些都是小打小鬧,真正的中美大決戰(zhàn),決勝于未來五年

詭譎怪談
2025-05-02 15:35:06
毛主席心中之痛:為何1955年授銜時,井岡山籍將領(lǐng)只有一個?

毛主席心中之痛:為何1955年授銜時,井岡山籍將領(lǐng)只有一個?

浩渺青史
2026-04-17 01:12:52
臺灣突然宣布重磅決定,島內(nèi)數(shù)萬人聯(lián)名反對,鄭麗文成眾望所歸

臺灣突然宣布重磅決定,島內(nèi)數(shù)萬人聯(lián)名反對,鄭麗文成眾望所歸

泠泠說史
2026-04-16 19:53:45
世界杯抽簽分組出爐,中國隊迎戰(zhàn)奧運冠軍

世界杯抽簽分組出爐,中國隊迎戰(zhàn)奧運冠軍

刺猬籃球
2026-04-16 12:16:02
美國簽署37億合同,繼續(xù)給烏克蘭提供愛國者導彈,將在德國生產(chǎn)

美國簽署37億合同,繼續(xù)給烏克蘭提供愛國者導彈,將在德國生產(chǎn)

白日追夢人
2026-04-16 04:26:12
中國AI正在繞過大模型,直奔Agent時代

中國AI正在繞過大模型,直奔Agent時代

鈦媒體APP
2026-04-16 13:15:06
伊朗警告美:若繼續(xù)封鎖伊朗港口,將阻斷紅海貿(mào)易

伊朗警告美:若繼續(xù)封鎖伊朗港口,將阻斷紅海貿(mào)易

參考消息
2026-04-16 13:58:05
2026-04-17 05:12:49
腦極體 incentive-icons
腦極體
從智能密鑰到已知盡頭
3655文章數(shù) 167421關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰在大模型上更高效

頭條要聞

特朗普宣布黎以將停火后 以軍大規(guī)模空襲黎巴嫩

頭條要聞

特朗普宣布黎以將停火后 以軍大規(guī)模空襲黎巴嫩

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

本地
數(shù)碼
家居
藝術(shù)
公開課

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

數(shù)碼要聞

榮耀史上最短發(fā)布會,發(fā)布榮耀史上最強MagicBook數(shù)字系列

家居要聞

智能舒適 簡約風尚

藝術(shù)要聞

你絕對想不到!這幅油畫背后的美麗故事!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版