![]()
編輯|冷貓
據(jù)統(tǒng)計,今年國內(nèi)具身智能領(lǐng)域融資總額已突破 370 億元。
工信部與國務(wù)院國資委聯(lián)合啟動「人形機器人與具身智能實景實訓(xùn)專項行動」,央廣網(wǎng)直接把今年定義為「商業(yè)化落地關(guān)鍵年」。一級市場的錢、二級市場的故事,全都在喊同一個方向:落地、落地、落地。
但問題來了,具身智能到底應(yīng)該怎么落地?
大家都比較認(rèn)可的觀點是,具身智能應(yīng)該去攻克人類做不到的事,應(yīng)該去替代人類做一些高危、繁重、重復(fù),人不想干也不該干的活。
6 月 22 日,第四屆中國國際供應(yīng)鏈促進博覽會在北京開幕,首次設(shè)立人工智能專區(qū)。
一家名為若愚科技的深圳公司首次亮相,帶來了搭載自研「若愚九天機器人大腦」的特種防爆機器人「若愚攬月 01」。展臺前人群不斷,「若愚攬月 01」在「若愚九天」機器人大腦的驅(qū)動下,于模擬油氣場站中自主完成了語音指令接收、環(huán)境感知導(dǎo)航、設(shè)備狀態(tài)識別到精準(zhǔn)操作的完整作業(yè)閉環(huán),直觀呈現(xiàn)了具身智能大腦從「理解任務(wù)」到「執(zhí)行動作」的全鏈路能力。
![]()
而早在兩個月前,全球首個面向加油場景的「具身智能大腦系統(tǒng)」解決方案,就已經(jīng)面向普通車主提供全流程自主加油服務(wù)了。開蓋、取槍、加注、收槍、關(guān)蓋,全套工序獨立完成,不需要人工介入。這在行業(yè)里是一個稀缺樣本。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/AzNxtEcdVRlzcYgfuWxkUA
國內(nèi)首張防爆資質(zhì)
若愚科技是一家務(wù)實的公司。
若愚科技從一開始就扎進了具身智能在特種場景中的應(yīng)用:加油站、油氣場站、港口碼頭等等。他們認(rèn)為,具身智能技術(shù)要想真正產(chǎn)生社會價值,應(yīng)該先去解決那些人類從業(yè)者面臨高安全風(fēng)險的場景,讓他們脫離危險繁重的作業(yè)環(huán)境。
但想法歸想法,要讓機器人真正「進得去」這些場景,第一道關(guān)卡就足夠勸退大多數(shù)公司:防爆認(rèn)證。
在加油站、油氣場站、化工廠等易燃易爆環(huán)境中,機器人自身絕對不能成為潛在的點火源。這對產(chǎn)品硬件在設(shè)計之初就提出了極其嚴(yán)苛的要求。比如說:從電路層面就要做本質(zhì)安全設(shè)計,限制回路能量,確保即便發(fā)生故障也不足以引燃環(huán)境氣體;機械結(jié)構(gòu)要滿足隔爆要求,承受內(nèi)部爆炸而不損壞外殼;所有連接點要做增安處理,防止正常運行中產(chǎn)生火花風(fēng)險;關(guān)鍵部件還要通過澆封手段隔絕危險接觸等等。
2026 年 3 月,若愚科技自研的「若愚攬月 01」拿下了這張入場券:Ex db eb ib mb IIB T4 Gb 整機防爆認(rèn)證與 Ex db IIB T5 Gb 協(xié)作機械臂防爆認(rèn)證。若愚科技因此成為國內(nèi)首家取得輪式人形機器人防爆資質(zhì)的企業(yè)。
![]()
在整個具身智能向行業(yè)應(yīng)用邁進的今天,這張防爆認(rèn)證或許是含金量最高的「成績單」。
具身智能能去哪里
加油場景:全球首個具身智能大腦系統(tǒng)解決方案落地
2026 年 4 月,「若愚攬月 01」進駐佛山一座加油站,開始面向普通車主試運營。
這個場景對機器人的挑戰(zhàn)集中在「精細(xì)操作的連貫性」上。車主下單后,機器人要連續(xù)完成十多個動作:掀外蓋、擰內(nèi)蓋、從槍座上摘下油槍、瞄準(zhǔn)油口插入、等待加滿、拔槍、掛回槍座、蓋內(nèi)蓋、合外蓋。每個動作的容差只有幾毫米,任何一步卡住都意味著整條鏈中斷。而且不同車型的油箱位置、蓋板結(jié)構(gòu)、開啟方式千差萬別,機器人不可能靠固定程序跑通所有情況。
「若愚九天」機器人大腦在這套流程里做的事情比逐步下發(fā)指令復(fù)雜得多:每一步動手之前,它會先推演接下來三到五步的成功概率。比如當(dāng)前車型的油箱蓋開啟角度偏小,大腦預(yù)判到后續(xù)取槍角度受限,就會在摘槍之前先調(diào)整機器人的站位。
![]()
這是一個已經(jīng)落地驗證的場景,無需改造加油站現(xiàn)有設(shè)施,機器人直接適配現(xiàn)有布局;單臺機器人不綁定固定工位,可以在相鄰油島之間來回作業(yè);對車主停車精度的容忍度也做了專門優(yōu)化,不需要停得很正也能完成加注。車主端的體驗也變得更簡單,隨到隨加,無需下車。
油氣場站:鏈博會上的中石油展臺首秀
場站巡檢的痛點和加油站完全不同。加油站考驗的是精細(xì)操作,場站考驗的是「長時間自主巡邏 + 多種異常識別 + 現(xiàn)場即時響應(yīng)」的綜合能力。巡檢員每天走固定路線,這份工作枯燥、危險,而且對注意力的要求極高,人連續(xù)巡檢幾個小時后遺漏率會顯著上升。
若愚科技正在開發(fā)的巡操一體化方案,讓「若愚攬月 01」承擔(dān)這類工作。操作員可以直接用語音下達任務(wù),機器人將語音轉(zhuǎn)化為結(jié)構(gòu)化的自然語言指令,由「若愚九天」大腦理解意圖并拆解為具體任務(wù)序列。整個過程中,大腦同時融合激光雷達、攝像頭、力覺傳感器等多源信息,驅(qū)動感知、識別、規(guī)劃、執(zhí)行形成連貫閉環(huán),讓機器人能針對不同巡檢任務(wù)靈活調(diào)整策略。
鏈博會現(xiàn)場,「若愚攬月 01」在模擬管路環(huán)境中演示了完整的巡檢閉環(huán),是這套方案的首次公開亮相。
![]()
港口場景:多機器人協(xié)同的探索
這個場景最特殊的地方在于,它天然需要多臺機器人協(xié)同。
扭鎖是集裝箱之間的機械連接件,每個箱角四個,裝卸船時需要逐一安裝或拆除。若愚科技的方案是把整條作業(yè)鏈交給機器人:從料箱里取出鎖具、運送到指定箱角、對位安裝,卸船時再反向操作。
與其他場景的關(guān)鍵區(qū)別在于,一條船上百個扭鎖,靠一臺機器人逐個拆裝效率遠(yuǎn)遠(yuǎn)不夠。這要求「若愚九天」機器人大腦同時調(diào)度多臺機器人分布在不同工位上并行作業(yè)。這些調(diào)度決策都由同一顆大腦統(tǒng)一規(guī)劃。這也是若愚科技強調(diào)的「一顆大腦驅(qū)動多具身體」在實際場景中最直觀的體現(xiàn)。
三個場景背后有一條共同的產(chǎn)業(yè)邏輯:加油站驗證了精細(xì)操作能力,場站驗證了長程自主能力,港口驗證了集群協(xié)同能力。
每多跑一天真實作業(yè),現(xiàn)場產(chǎn)生的傳感器數(shù)據(jù)、失敗案例、邊界工況就會進入訓(xùn)練管線,反過來讓「若愚九天」機器人大腦更快地適應(yīng)下一個新場景。若愚科技把它叫做「場景數(shù)據(jù)飛輪」,廣泛應(yīng)用后將開啟更高效的進化迭代。
「若愚九天」,解決多個難題
目前大多數(shù)具身智能系統(tǒng)的架構(gòu)是「流水線式」的,視覺模塊負(fù)責(zé)看,語言模塊負(fù)責(zé)理解,動作模塊負(fù)責(zé)執(zhí)行。
這種架構(gòu)處理短序列、低干擾的簡單任務(wù)還行,一旦遇到十幾步連續(xù)操作、環(huán)境高度動態(tài)、容錯率極低的場景,中間任何一步的微小偏差都會像多米諾骨牌一樣向后傳導(dǎo)。傳統(tǒng)流水線架構(gòu)在這種量級的任務(wù)面前,幾乎不可能保證端到端的穩(wěn)定性。
若愚科技自研的「若愚九天」機器人大腦,把感知、規(guī)劃、執(zhí)行三個模塊端到端整合進同一個系統(tǒng)內(nèi),依托大語言模型與三維解碼器耦合的創(chuàng)新架構(gòu),讓視覺、語言、空間、動作、力覺等多源信息在一個模型里完成深度融合處理。這意味著,具身智能「看見」「理解」「動手」三件事,在同一個神經(jīng)網(wǎng)絡(luò)里同時發(fā)生。
架構(gòu)設(shè)計上,「若愚九天」大腦采用「大腦 - 小腦」分層協(xié)同的思路。大腦層負(fù)責(zé)高層任務(wù)規(guī)劃與決策,基于擴散模型模仿學(xué)習(xí)和 3D 可供性感知技術(shù),處理智能體交互、長序列任務(wù)分解和環(huán)境避障等認(rèn)知層面的工作。小腦層則聚焦于執(zhí)行精度,把大腦輸出的規(guī)劃指令轉(zhuǎn)化為關(guān)節(jié)級的精細(xì)運動控制,確保操作毫米級到位。
世界模型驅(qū)動的預(yù)測能力
在加油站場景中,具身智能面對的任務(wù)鏈極長:停車引導(dǎo)、識別油箱位置、開外蓋、開內(nèi)蓋、取槍、對準(zhǔn)油口、插入、加注、拔出、收槍、關(guān)內(nèi)蓋、關(guān)外蓋。任何一步的微小偏差都會向后傳導(dǎo)。
「若愚九天」機器人大腦引入世界模型能力,可以對環(huán)境未來狀態(tài)、任務(wù)進程及動作結(jié)果進行持續(xù)預(yù)測與推演。簡單理解,就是讓機器人在真正動手之前先「腦中過一遍」,預(yù)判各種可能出現(xiàn)的狀況。如果模型預(yù)測到「以當(dāng)前角度取槍,后續(xù)插入油口的成功率很低」,它會在動手之前就調(diào)整策略,而非執(zhí)行到一半才發(fā)現(xiàn)問題。
這種能力在長序列任務(wù)中尤其關(guān)鍵。加油不是一個「抓取 - 放置」的簡單操作,它是一整條有前后因果關(guān)系的動作鏈。世界模型讓具身智能具備了「看三步走一步」的前瞻能力。
用一個比喻來理解:一個老司機加油,不管油箱蓋開得順不順利,腦子里始終清楚最終要達到什么狀態(tài),中間的每一步都圍繞這個終態(tài)來調(diào)整。讓具身智能從「線性執(zhí)行」變?yōu)椤附K態(tài)對齊」。
第一,生成目標(biāo)觀測。 系統(tǒng)接收到任務(wù)指令和當(dāng)前攝像頭畫面后,先去預(yù)測「任務(wù)完成后,世界應(yīng)該變成什么樣」。例如加油任務(wù)結(jié)束后,油槍應(yīng)該歸位、油箱蓋應(yīng)該合上。這個預(yù)測出來的「終態(tài)畫面」就是目標(biāo)觀測,它為后續(xù)所有推理過程提供了一個明確的語義錨點。
第二,合成中間過渡幀。 有了目標(biāo)之后,系統(tǒng)再倒推中間應(yīng)該經(jīng)歷哪些視覺狀態(tài)。如果起點是「油箱蓋關(guān)著」、終點是「油槍歸位、油箱蓋合上」,那中間就需要依次出現(xiàn)「油箱蓋打開」「油槍取出」「油槍插入油口」等過渡畫面。這些合成出來的中間觀測幀,為動作生成提供了逐步對齊的視覺參考。
這套機制讓機器人在動手之前就對整個任務(wù)過程有了完整的視覺想象,后續(xù)的動作規(guī)劃都圍繞這條「想象的軌跡」展開,從而大幅降低了長序列執(zhí)行中的累積偏差。
目標(biāo)驅(qū)動的分層精煉框架(H-GAR)
「若愚九天」機器人大腦搭載了一套目標(biāo)驅(qū)動的分層觀測 - 動作精煉框架(H-GAR),先鎖定終態(tài),再逐層向前精煉動作。
![]()
(a)現(xiàn)有方法通常采用目標(biāo)無關(guān)、整體式的預(yù)測范式。(b) H-GAR 引入了目標(biāo)條件觀測合成器和交互感知動作優(yōu)化器,從而實現(xiàn)了以目標(biāo)為錨定的預(yù)測,并顯式建模觀測與動作之間的交互。
具體而言,H-GAR 的工作流程分為三步:
![]()
H-GAR 架構(gòu)圖
- 第一步:粗粒度動作草案。基于歷史畫面和任務(wù)指令,系統(tǒng)首先生成一組粗略的動作序列。這些動作描述了一條從當(dāng)前狀態(tài)到目標(biāo)的「大致路徑」,類似于人類加油時腦子里的粗略計劃,知道大概要做哪些步驟,是執(zhí)行前的準(zhǔn)備。
- 第二步:目標(biāo)條件觀測合成(GOS 模塊)。拿到粗粒度動作后,系統(tǒng)在目標(biāo)觀測的引導(dǎo)下合成中間視覺幀。這一步的關(guān)鍵在于:合成的畫面不是隨便生成的,而是同時受到目標(biāo)終態(tài)和粗動作的雙重約束。這確保了中間過渡幀既符合動作邏輯,又對齊了最終目標(biāo)。
- 第三步:交互感知動作精煉(IAAR 模塊)。最后一步將粗動作升級為精細(xì)的可執(zhí)行指令。IAAR 從兩個方向獲取反饋來精煉動作:一是中間觀測幀提供的視覺上下文,讓動作與實際場景對齊;二是歷史動作記憶庫,它記錄了此前執(zhí)行過的精細(xì)動作,確保當(dāng)前生成的動作與歷史軌跡保持時序一致性。當(dāng)記憶庫超過容量閾值時,系統(tǒng)采用相似度淘汰策略,合并最相似的相鄰動作來保持記憶多樣性。
若愚科技團隊聯(lián)合多家機構(gòu),已將這套框架的核心理論以論文形式發(fā)表于 AAAI 2026,在仿真基準(zhǔn)和真實機器人操作任務(wù)上均取得了當(dāng)前最優(yōu)的表現(xiàn)。在 Libero-10 多任務(wù)基準(zhǔn)上,H-GAR 取得高達 94% 的成功率;在真實世界實驗中,長鏈任務(wù)(如物體放置、抽屜操作)的階段完成率也顯著高于對比方法。
- 論文地址:https://arxiv.org/pdf/2511.17079
視覺 - 力覺融合的閉環(huán)糾偏
真實場景里意外幾乎是常態(tài)。油箱蓋可能打開角度不對,車主停車位置可能偏移預(yù)期,甚至油口周圍可能有異物遮擋。在實驗室里一百次能成功九十九次的動作,放到戶外真實環(huán)境可能打個七折。
「若愚九天」機器人大腦的解法是引入多模態(tài)閉環(huán)糾偏機制:實時融合視覺變化與力覺反饋,識別真實操作狀態(tài)。舉個例子,當(dāng)機器人試圖將油槍插入油口時,如果視覺告訴它「位置看起來對了」但力覺反饋顯示「阻力異常」,系統(tǒng)會綜合判斷當(dāng)前操作是否安全有效,自主決定是微調(diào)角度重試,還是退回上一步重新定位。
「一個大腦,多個身體」的通用架構(gòu)。 最后一個關(guān)鍵設(shè)計決定了這套技術(shù)體系的擴展性。
「若愚九天」機器人大腦采用輕量化通用架構(gòu),同一顆大腦可以高效驅(qū)動多類型、多數(shù)量的機器人協(xié)同作業(yè)。目前若愚科技已自主研制了雙臂重載、單臂重載、雙臂輕載等多品類機器人本體,配套自研高負(fù)載防爆靈巧手,形成多構(gòu)型產(chǎn)品矩陣。
這意味著什么?在加油場景積累的感知能力、規(guī)劃策略、糾偏經(jīng)驗,可以直接遷移到其他場景的機器人本體上,不需要為每種構(gòu)型從頭訓(xùn)練一套系統(tǒng)。大腦的智慧是通用的,身體可以根據(jù)場景需求靈活適配。這大幅降低了多機型適配改造的成本與部署周期。
尾聲:知行合一
讓具身智能走向特種場景,是一件需要有長期主義精神的事情。
若愚科技從立項之初就選擇了具身大腦和本體一起做的完整鏈路。我們相信,這并非出于「什么都想干」的貪心,而是想要深耕特種場景的必選項。
要進入特種行業(yè),機械結(jié)構(gòu)設(shè)計必須從底層考慮安全性,必須要有研發(fā)具身本體的能力。而在特殊場景下執(zhí)行任務(wù),具身大腦更是不可或缺。大腦與本體的深度耦合已經(jīng)超越了加分項,它就是準(zhǔn)入條件。
正是這種選擇,讓若愚科技形成了行業(yè)中少見的完整閉環(huán):同一個團隊既掌握從感知到?jīng)Q策的全鏈路算法,又能獨立完成滿足防爆標(biāo)準(zhǔn)的結(jié)構(gòu)設(shè)計與制造。「若愚九天」機器人大腦從誕生起就和本體共同生長。
當(dāng)具身智能行業(yè)集體站在商業(yè)化落地的十字路口,那些最早跑通「大腦 - 本體 - 數(shù)據(jù)」閉環(huán)的玩家,大概率會在接下來的競爭中占據(jù)先手。
支撐這套體系的,是一支學(xué)術(shù)積累深厚、產(chǎn)業(yè)經(jīng)驗豐富的創(chuàng)始團隊。
公司由哈爾濱工業(yè)大學(xué)(深圳)孵化,依托哈深資產(chǎn)經(jīng)營有限公司進行成果轉(zhuǎn)化。董事長聶禮強,哈工深信息學(xué)部主任,達摩院青橙獎獲得者。創(chuàng)始人兼 CEO 孫騰,90 后人工智能博士,成果發(fā)表于 IEEE TPAMI 等國際頂級期刊和會議。COO 江隆業(yè),前奧比中光科技集團高級副總裁,產(chǎn)業(yè)化落地經(jīng)驗十分豐富。首席科學(xué)家張民,是哈工深特聘校長助理、計算與智能研究院院長,2026 年 3 月斬獲吳文俊人工智能科技進步獎特等獎。
源自于哈工大的基因決定了這個團隊的氣質(zhì),信奉技術(shù)要落到實處。不去做錦上添花的事,去做那些真正把人從危險中釋放出來的事。讓具身智能進入這些危險場景,才是技術(shù)該去的地方。
若愚科技已累計完成種子輪、天使輪和天使 + 輪數(shù)億元融資,投資方包括東方精工、昆仲資本等。截至 2026 年 6 月,圍繞核心技術(shù)申報國內(nèi)專利 40 余項。先后獲得深圳市創(chuàng)新型中小企業(yè)、國家高新技術(shù)企業(yè)認(rèn)證,入選深圳市「機器人 +」典型案例及 36 氪「2026 最具價值成長企業(yè) 100」。
具身智能技術(shù)的終極承諾,或許正在于替換人去承受那些不該由血肉之軀承受的風(fēng)險。在那些容錯率為零的特種現(xiàn)場,若愚科技的具身智能已經(jīng)站在了第一線。
整個特種作業(yè)板塊,只是「若愚九天」機器人大腦率先驗證能力的第一站。
特種場景的價值在于,它對感知精度、決策魯棒性和執(zhí)行安全性的要求極高,能在極端工況中充分錘煉智能的上限。未來,若愚科技將在此基礎(chǔ)上,向更廣泛的領(lǐng)域拓展。
「若愚九天」想要打造機器人時代的智能內(nèi)核。機器人的形態(tài)會隨場景變化,但驅(qū)動它們感知環(huán)境、理解任務(wù)、協(xié)調(diào)行動的那顆大腦,是跨越所有場景的通用基礎(chǔ)設(shè)施。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.