![]()
年初,知名機器人行業媒體The Robot Report在2026年行業展望中指出,中國正與美國并駕齊驅引領物理AI的發展,其與美國公司差異化的模型方案將推動人形機器人部署[1]。
兩個月后,美中經濟與安全審查委員會(USCC)發布報告稱,中國已經進一步提升了頂尖模型的性能。“中國推動AI技術在機器人等領域的廣泛應用,由此產生的真實數據為模型的改進提供了支撐[2]。”
這是西方媒體與機構針對中國人形機器人產業難得的集體改口。
西方語境之下的中國,慣常以“強制造”形象示人,即使承包了全球大部分人形機器人出貨量,被反復提及的仍是硬件生產能力、供應鏈、效率和性價比,“硬件靠中國,模型靠美國”成為一種政治正確。
然而,隨著人形機器人進入大規模落地期,中國機器人公司的模型實力開始被重新審視。
本月,具身智能領軍企業它石智航宣布完成4.55億美金Pre-A輪融資,創下中國具身智能史上最高單輪融資紀錄和最大Pre-A輪融資紀錄,成立首年累計公開融資達到6.97億美金,這個數字,是當下行業領頭羊、全球估值最高的機器人企業——Figure AI首年融資額的近10倍。
![]()
與主打跳舞打拳大部分中國人形機器人的不同,它石機器人出圈,靠的是能打破世界紀錄的模型能力,這正是資本蜂擁而至的原因所在。
它石的出現,再次印證了中國人形機器人產業正在發生的新態勢:硬件強,模型要更強。
新的路徑
時間拉回到一年前的特斯拉電話會議,馬斯克先揚后抑,夸完自家Optimus世界第一,再提“中國威脅論”:擔心排名第二到第十的人形機器人公司全是中國的[3]。
綜合馬斯克全場發言,這句話隱含兩層意思,一是中國公司可以靠強大的硬件制造能力占領人形機器人大部分市場,二是即便如此,中國公司仍然打不過特斯拉。
給馬斯克信心的,是美國在模型上的絕對實力。
平心而論,從VLA再到世界模型,美國始終掌握著模型最前沿的演進方向,因而無論硬件制造多拉垮,美國機器人總被認為可以通過更聰明的“大腦”對中國機器人降維打擊。
實際上,硬件和模型是人形機器人的“兩條腿”,兩者的進步缺一不可。
人形機器人區別于傳統工業機器人的關鍵是泛化和通用性,不只要像人一樣有手有腳,還得像人一樣既能打螺絲,又能洗衣做飯煮咖啡,硬件決定行動力,模型決定通用性。
![]()
理想中的人形機器人既能進廠打工又能在家做家務
硬件的桎梏在于大部分零部件必須“無中生有”,純靠廠商“現搓”,這是中國零部件制造商擅長的,所以中國機器人“表演欲”旺盛,其實是為了秀硬件的肌肉。
模型的瓶頸在于路線尚未收斂,訓練還需時間,模型入端降本仍是考驗,這是美國科學家的傳統藝能,所以美國的機器人公司總把產品發布會開成學術發表會。
對于大部分中國機器人公司來說,當下,模型瘸腿帶來的商業化困境已經開始顯現,中國機器人被詬病只跳舞不打工,不是主觀上不愿意,而是客觀上“腦子”還不夠聰明。
人形機器人模型的主流技術路線可以分為三種:
第一種是以特斯拉為代表的自動駕駛遷移路線,核心是將自動駕駛能力“平移”到機器人身上,例如特斯拉直接復用其FSD視覺算法和占用網絡(Occupancy Network),讓機器人擁有類似汽車的3D空間建模能力;
![]()
Optimus照搬特斯拉的FSD模型
第二種是以Figure AI的Helix系統為代表的VLA端到端路線,主張將機器人的感知、思考與行動集成在同一個大模型中,搭載這類模型的機器人具備極強的常識推理能力,比如對它說“我餓了”,它就會直接找食物并遞給你。
第三種是許多主流中國機器人公司都在用的“大腦+小腦模式”,“大腦”用大語言或視覺模型來拆解任務,“小腦”用強化學習或傳統控制理論來做任務。
前兩種路徑技術被產業寄予厚望,但在實際操作中缺點比優點更突出。
例如特斯拉的“平移”路線需要大量的適配與再驗證工作,具身智能比自動駕駛要復雜若干數量級,模型無法直接適用,導致Optimus量產一拖再拖,且據稱目前只能做搬運、裝配等簡單操作,距離真正替代人類工人恐怕還得再等等。
Figure AI的VLA路線硬傷在于“動作跟不上大腦”。雖然“善解人意”(推理能力強),但到了產線上,也由于推理延遲,無法實現亞毫米級的精細化實時反饋,干不了細活。
再加上極其依賴特定場景的預訓練視頻,工廠環境、光照甚至零件色差發生微小變化,容易發生“邏輯死機”,而真實產業場景恰恰復雜、多變、容錯率低,跨產線工作的通用泛化能力與穩定工作能力培養難度極大,因此短時間還很難在復雜的工業實戰中落地。
國內主流的“大腦+小腦”路線則是先天不足,“大腦”和“小腦”的割裂導致無法實現高精度操作,是大部分中國機器人無法進場擰螺絲的主要原因。
中美雙方,一個開發硬件,一個研究模型,看似兩條腿齊步走,實際狀況卻是模型遠遠跟不上硬件的發展速率。當中國供應鏈已經開始下探硬件成本,模型的進步還僅僅停留在和論文和PPT里,扼住了商業化的喉嚨。
中美雙方暗暗都在期待和競爭一個新的路徑出現。這次是中國先出了招。
數據為王
3月舉行的全球三大家電及消費電子展之一AWE,不負眾望開成了人形機器人的秀場。
與隔壁跳舞打拳的機器人相比,它石智航的展臺顯得很務實,機器人A1沒什么花拳繡腿,但卻以一小時百余次的速度,創造了“機器人在一小時內裝配亞毫米級線束最多次數”的吉尼斯世界紀錄。
![]()
吉尼斯世界紀錄頒獎現場,A1機器人創造了吉尼斯世界紀錄
這一幕的含金量,身處一線的自動化工程師和工人們一定懂。
線束不同于剛性零件,會彎曲、晃動、變形。機器人必須在每一毫秒實時感知線束的細微形態變化并做出亞毫米級的動作補償,被認為是工業自動化界的“哥德巴赫猜想”世界級難題。
攻克線束裝配,直接把它石A1與還在工廠做搬運分揀工作的機器人們拉開了差距,也把它石的模型能力放到了一個值得單獨審視的位置。
2025年2月才成立的它石出道不算早,但其在成立后的三個月內就完成了2.42億美元天使輪融資,打破了中國具身智能有史以來的天使輪融資紀錄。
創始人兼CEO陳亦倫和董事長李震宇均為國內自動駕駛領軍人物,名聲在外;首席科學家丁文超和首席架構師陳同慶同樣產業背景深厚,主導過眾多知名自動駕駛項目。
自動駕駛被視為人形機器人的前置產業和子命題,因此技術團隊的自動駕駛經驗很大程度決定了技術的深度和廣度,特斯拉最早的Optimus團隊工程師大部分就是從汽車產業鏈跳槽來的。
也正是這樣的團隊組合,使得它石在紛繁的技術路徑和產業雜音中找到了突破口。
它石提出的方法是直接與真實世界對齊,創新打造“數據、模型和物理硬件三位一體”解決方案,核心邏輯是以真實世界數據驅動研發世界模型。這一路徑在當時并不主流,甚至因為難度極大、見效極慢,可以說是吃力不討好,但卻也是通向通用智能最“筆直”的一條路徑。
為此,它石首創了Human-centric數據采集新范式,能夠實現真實世界具身數據獲取能力的跨越式突破,精準鎖定了當下行業痛點——數據。
![]()
它石“三位一體”方案
模型訓練,數據為王。機器人們遲遲無法進廠打工,原因就在于用于其模型訓練的數據規模還不夠大,不夠真實,也不夠可靠。
相較于大語言模型可以依賴網絡上現有的圖文數據,機器人需要與真實的物理世界交互,需要大量“第一人稱數據”,具體包括視覺感知數據、運動控制數據、物理反饋數據等。
這些數據無法從網上獲得,需要在真實場景中通過實操來獲取、積累,是一個從0到1的工程。
放眼全球,即使家大業大如特斯拉,除了生搬自駕數據,早期主要靠遙操作獲取數據,人類操作員穿上特制設備,遠程驅動機器人動作,機器人身上的傳感器記錄力覺、觸覺、空間感等各個維度數據,重復幾千上萬次,用以訓練。
![]()
通過人類操作員通過遙操作“教”機器人做動作
這種方法不僅費人費錢,而且由于機器人機械結構的局限性,采集到的數據是人類“為了適應機器人”而變形的動作,導致訓練出來的機器人動作流利度遠低于人類正常水平。
Figure AI除了遙操作之外,還收集了大量人類第一視角視頻,讓機器人“邊看邊學”,但學習效率還得看機器人本身的智力水平,就像都是看網課學習,學霸和學渣的效果也不同,并且只有視覺沒有觸覺。
綜合現有方案,不是成本高昂就是數據不夠可靠,而它石的Human-centric最大改進就是提高了數據收集的真實性和可操作性:
人類操作員穿戴它石自研的SenseHub套件在真實場景中干活,由套件中的傳感器記錄數據,如此記錄的是人類肢體最自然的加速度、抓取力和空間軌跡,這些數據沒有經過機器人硬件的“污染”,保留了動作的原生高頻細節。
其中SenseHub套件包括TARS Glove(高精度動捕手套)和 TARS Vision(第一視角感知相機),輕巧易穿戴,主打隨時隨地采集數據。
![]()
![]()
人類操作員穿戴SenseHub套件做指定動作收集數據
由于不需要機器人配合,這種模式可以利用人海戰術進行大規模并行采集,且成本大幅下降,根據機構測算,其成本預估比傳統的真機遙操作低10-20倍。而在這一領域,中國恰恰具備極大的先天優勢,因為這里具備超大規模的應用場景與極高的任務多樣性。
通過提高數據的純凈度和數據采集的效率,它石Human-centric解決的是當下機器人行業普遍存在的商業化“拖延癥”,也為機器人的大規模落地提供了彎道超車的新路徑。
在上述數據范式下,它石收獲的是實打實的模型成果與巨大的應用潛力。
2026年3月,它石發布的通用具身大模型AWE3.0在延續全身端到端學習、動態時空推理等既有優勢基礎上,實現了三項關鍵性的技術創新:全視角通感決策(OSD)、高密度觸覺感知(HTS)、隱空間絲滑動作(LAS),它們可大幅提升機器人在新視角下的任務成功率、對局部觸覺的靈敏感知與精細響應能力,降低了任務抖動率。
而世界級的紀錄印證,也只是它石模型能力的一隅溢出。
![]()
它石智航吉尼斯世界紀錄挑戰現場
漸進式 VS 跨越式
高新技術從開發到大規模落地,總要經歷一個陣痛期,在不同的技術路徑之間反復試錯,然后慢慢靠近商業化爆發的奇點。
人形機器人正在經歷的便是這樣的陣痛期,技術路徑尚未收斂,每一條看似光明的大路前方實則大霧彌漫。這個階段,考驗的與其說是誰的技術路線更高級,不如說是誰更能承受住試錯的風險,活著走到大霧飄散的時刻。
上一個接受考驗的是人形機器人的“前輩”,自動駕駛汽車。
與當前人形機器人廠商繁雜的技術路線類似,最早一批自動駕駛開發者,同樣面對幾條不同的發展路徑,最具代表性的是“跨越式”和“漸進式”。
”跨越式”優等生如Waymo、Cruise,核心邏輯是直接研發L4級自動駕駛,不依賴人類監管,在特定區域進行商業化測試;“漸進式”代表如特斯拉、小鵬,核心邏輯是先量產L2/L2+,再利用海量用戶行駛數據反哺算法,逐步提升自動化等級。
這種直搗黃龍的激進路線,最初是大部分參與者的選擇,但當時開發出來的L4車輛成本高達20萬美元,而且由于測試周期漫長,導致商業化舉步維艱,企業重資產運營、負債前行。
與之對應的是“漸進式”主打“先上路、再進步”,最典型的代表就是特斯拉,其核心邏輯是先實現L2/L2+自動駕駛,再逐步提升自動化等級。本質是保證了能活下來,再在技術循序漸進,通過真實的駕駛數據、解決一個個corner case,進而反哺模型能力。
過去的幾年,跨越式的隊伍隨時有人倒下,逐漸人丁稀少,反倒是漸進式的隊伍不斷壯大,大模型時代來臨,特斯拉也是最早調轉船頭、吃到大模型紅利的車企。
如今的人形機器人,類似跨越式和漸進式之爭已經露出苗頭。
Figure AI的技術路線就類似于跨越式,即一開始就追求通用化的極致、全場景的覆蓋。
Figure AI試圖讓機器人通過“看視頻”自學,相當于讓自動駕駛汽車上來就完全擺脫高精地圖、純靠算法感知世界。小學生不是不能做大學高數題,但前提是小學生是個萬里挑一的天才。
但人形機器人需要的不只是智商,還有“行動力”,博士生進廠打工可能不如一個高中畢業的熟練工,沒有足夠的真實、精準針對特定場景且有效數據的積累,機器人再聰明,也擰不了一顆螺絲釘。
這種情況下,量產無限期拖延或是實際能力不符合預期也無可厚非,但投資人的錢總有燒干的一天,要等到技術完美再大規模量產,大概率會步入自動駕駛“跨越式先烈”的后塵。
它石走的就是類似于“漸進式”的路線,即先從特定場景出發,先學會人類最精細的動作,再談泛化,解決方案圍繞“效率至上、落地應用為先”的策略。
Human-centric的最大突破就是擺脫了“先造出高精度的機器人、再采集數據”的桎梏,通過自研SenseHub套件,人類操作員可以隨時在產線上作業采集數據,使得其大模型能夠快速進化更新,與硬件共同進步,構建起一個相互賦能的閉環,進而快速跑通具身智能的scaling law。
![]()
它石A1機器人產線多機協同
同時,數采成本降低至遙操作的1/10到1/20,意味著同等資本投入,能夠覆蓋的場景深度(如從簡單的抓取到復雜的精密裝配)和廣度是競爭對手的數十倍。
這種商業和技術的平衡,使得它石能夠保證技術持續提升的同時,確保量產和商業化的節奏,及時“造血輸血”,這也是為什么機器人公司扎堆,“來得晚”的它石反而獲得資本的青睞。
活下去,其實是每個科技創業公司最稀缺、也是最寶貴的能力。
它石的Pre-A融資,是高瓴資本與紅杉中國兩大頂級資本首次在具身智能賽道聯合領投,本輪后它石已然躋身國內人形機器人的第一梯隊。
但這遠未達到它石的巔峰。
將視線拉向全球,中美機器人公司估值的鴻溝顯而易見:Figure AI背靠OpenAI,短短兩年內身價突破390億美元(約合人民幣2700多億元);特斯拉Optimus量產日程一拖再拖,也不妨礙資本將其隱形估值錨定在千億美元上下。
這種落差并非技術的代差,而是刻板印象的投資語境下,資本與技術實力的錯配。
當頂著光環的明星企業還在為如何走出實驗室、克服落地延遲而焦慮時,它石已經靠著更低的數據成本、更大的數據規模、更真實的物理世界數據和更精準務實的模型,在工業落地的深水區實現了局部戰場的技術反超。
某種意義上,如今的它石正佇立于極具性價比的爆發前夜。隨著其機器人在真實產線上展現出越來越強大的韌性,眼下的估值鴻溝終將被填平,同時迎來價值的真正重估。
寫在最后
今年年初的特斯拉電話會議,馬斯克老生常談,再次對中國人形機器人公司大夸特夸,而這次夸的不只是中國的硬件,還稱中國的模型“也相當不錯”。
看著中國人形機器人在模型端的超預期進步,美國的“特斯拉們”確實該緊張了。
![]()
![]()
[1] Chinese robotics outlook 2026,The Robot Report
[2] China’s open-source dominance threatens US AI lead, US advisory body warns, Rueters
[3] Elon Musk worries Chinese companies will fill out the world’s top 10 robot makers—but claims Tesla is, and will stay, No. 1,Fortune
[4] 中國機器人在跳舞,美國機器人在發論文,遠川科技評論
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.