![]()
![]()
靈巧手不只是機器人末端硬件,而是一套能在真實世界中感知、修正并持續進化的靈巧操作系統。
作者|寇雨然
編輯|王博
「甲子光年」獨家獲悉,機器人靈巧手初創企業伯牙智能已完成數千萬元天使輪融資。本輪融資由乾融控股領投,蘇創投、熙誠致遠跟投。融資資金將主要用于高自由度靈巧手產品迭代、軟硬件團隊擴張,以及面向真實場景的數據和解決方案建設。
伯牙智能成立于2024年8月,創始人兼CEO劉欣曾長期在阿里巴巴操作系統事業部和智能汽車相關業務中工作,曾任阿里巴巴技術總監、阿里斑馬智行產品負責人,后任蔚來汽車樂道智能化產品負責人,長期負責軟硬結合的復雜產品定義、研發管理和智能化產品落地。
在劉欣看來,智能汽車和機器人在底層技術棧上存在高度相似性:都需要感知、計算、控制,以及對物理空間的理解。不同的是,汽車理解空間是為了避免碰撞,而機器人理解空間,是為了和真實世界發生互動。
![]()
伯牙智能創始人兼CEO劉欣,圖片來源:甲子引力
這也決定了伯牙智能的團隊底色:既要懂復雜軟硬件產品,也要懂機器人本體、控制和科研前沿。
CSO張斯成曾任阿里斑馬智行聯合創始人、阿里釘釘副總裁、明略集團首席戰略官,具備智能硬件生態和商業化經驗;CTO陳浩耀是哈爾濱工業大學(深圳)教授、自動化系主任、博士生導師,長期研究機器人控制;首席科學家張世武是中國科大工程科學學院副院長、中國科大人形機器人研究院副院長,長期從事機器人和精密機電系統研究。
而這個團隊的核心目標是,把高自由度靈巧手從一個機械末端,做成融合硬件結構、觸覺感知、力控算法和真實數據反饋的靈巧操作系統。
1.技術取舍:基于人手生理結構的混合驅動路線
過去一年,靈巧手賽道變得熱鬧,也變得越來越像。
20個以上自由度、五指仿生、觸覺感知、混合驅動、力位混合控制、仿真生態、大小腦架構,正在成為高端靈巧手公司的共同語言。
但是,什么才是靈巧手的最優解?
「甲子光年」認為,力量和重量,速度和穩定性,觸覺和成本,精密控制和柔順性,硬件壽命和可維護性,模型泛化和真實任務成功率。這些問題都是靈巧手從實驗室樣機走向真實場景時繞不開的部分。
“技術路線本身不是最重要的。”劉欣告訴「甲子光年」,“真正重要的是,你想解決什么問題,然后為了這個目標做什么取舍。”
伯牙智能沒有把靈巧手定義為一個孤立的機械末端。
在很多機器人系統里,機械臂負責把手送到物體附近,靈巧手負責抓取和操作。按照這種理解,靈巧手公司最容易講的是硬件參數:自由度、重量、負載、指尖力、觸覺分辨率。
但在伯牙智能看來,這種定義還不夠。
![]()
伯牙靈巧手夾取螺絲,圖片來源:伯牙智能
機器人真正進入真實場景之后,問題不是把手伸過去就結束了,而是碰到物體之后發生了什么。杯子有沒有滑,布料是不是被拉緊,瓶身會不會被捏變形,螺絲有沒有擰到位,這些都發生在接觸之后。它們不是單純的視覺問題,也不是單純的機械結構問題,而是結構、驅動、觸覺、力控、算法和數據共同作用的結果。
因此,伯牙更愿意把靈巧手看成一套“靈巧操作系統”。
在這套系統里,硬件只是第一層。自由度、力量、重量和速度,決定了一只手能不能完成基本動作;觸覺和力反饋,決定了它能不能知道自己碰到了什么;控制系統決定了它能不能在接觸瞬間做出調整;數據和模型,則決定了它能不能從一次次成功和失敗中繼續變好。
伯牙智能的首發產品高山S1靈巧手,正是在這個邏輯下被定義出來的。
![]()
高山S1靈巧手,圖片來源:伯牙智能
這款產品的手部不到500克,接近人手的重量,擁有22個自由度和30N指尖力。單看參數,它當然是一只高端靈巧手。但伯牙真正想強調的,是這些指標背后的系統取舍:末端不能太重,否則會影響整機負載和動作效率;力量不能太小,否則無法完成真實抓握;自由度不能太低,否則很難覆蓋復雜操作;結構又不能過度復雜,否則維護和量產都會成為問題。
這種取舍直接體現在驅動結構上。
在靈巧手行業,繩驅、直驅、連桿,常常被拿來作為不同技術路線的標簽。但伯牙沒有把問題簡化成“選擇哪一種驅動方式”。它更接近于把靈巧手重新拆開:把手掌、小臂和手腕三個看似“孤立”的部件組成一套協同系統。
劉欣告訴「甲子光年」,人的手之所以能同時做到輕末端和大力量,并不是因為所有肌肉都長在手掌里。主要力量來自小臂肌肉,再通過肌腱傳遞到手指;手掌內部的小肌肉,則更多負責精細調整。
伯牙智能的混合驅動路線,也是沿著這個思路展開的。
在高山S1靈巧手中,抓握力量主要由小臂端驅動提供,再通過腱繩傳遞到手指;手部保留用于外展、內收等精細動作的驅動單元;手腕則通過獨立自由度擴大操作空間。
換句話說,伯牙不是簡單選擇了繩驅、直驅或連桿中的一種,而是在不同動作需求下,把小臂驅動、手部精細驅動和手腕自由度組合起來。
這套設計在高自由度、輕量化和大力量之間找到一個可以交付的平衡點。也因此,伯牙智能的高山S1靈巧手能夠在不到500克的重量下,有高達22的自由度和30N的指尖力。
這里劉欣用了一個很生動的比喻:“如果有重工業的客戶需要單根手指承重5kg,我們可以在不大改設計的情況下把電機加大,就像一個人去健身房擼了半年鐵,手變粗了,自然力量就變大了。”
2.評價標準:從“精準重復”轉向“實時修正”
在機器人行業,很多評價標準來自傳統工業機器人體系。比如,重復定位精度,因為傳統工業機器人面對的是高度結構化的產線任務。只要環境足夠穩定,目標足夠明確,機器人最重要的能力就是把同一個動作精準重復下去。
但靈巧手面對的是另一種世界。
真實物體并不總是標準件。在這種場景里,“回到同一個位置”只是問題的一部分。更重要的是碰到物體之后,系統能不能根據反饋把動作修正回來。
因此,劉欣認為,在智能機器人時代,強調重復定位精度沒有意義。
“你閉著眼睛,讓自己的手指重復一百次同樣的角度,其實做不到。”劉欣說,“人完成精細操作,不是靠絕對重復定位,而是靠多模態反饋。”
因此,要從“精準重復”轉向“實時感知與修正”,伯牙在硬件、控制和數據三個維度上,展開了系統性的工程布局。
首先在硬件底座上,降低物理延遲,為感知修正留出空間。
輕量的手部本體降低了運動慣性,確保了操作調整的‘剎車時間’;高達1000Hz的控制頻率與3Hz的開合速度,讓硬件能夠快速響應指令;配合0.01N的指尖觸覺分辨率,讓靈巧手在接觸的毫秒級時間窗口內,擁有了高精度的反饋與調整能力。
這一思路也讓腱繩的蠕變、磨損等問題不再成為一個必須被隱藏的脆弱點。劉欣提到,他們已經通過材料、結構和保護設計將腱繩提高到了數十萬次的使用壽命,在此基礎上,即便有蠕變也可以通過他們的“感知-修正”系統保持控制精度。
而對于腱繩的磨損、壽命邊界問題,劉欣認為,在盡可能提高其壽命的同時,讓腱繩變得更易維護、更換才是關鍵。
他用了一個很生活化的類比:“吉他弦也會斷,但沒有人會因為吉他弦會斷,就不買吉他。關鍵是弦能不能方便更換。”
其次在控制架構上,解耦復雜決策與高頻執行,確保自適應調整。
真實接觸發生在很短的時間窗口里。手指碰到瓶身的一瞬間,力是不是過大、物體有沒有滑移、指尖姿態要不要調整,都需要系統快速響應。如果每一次接觸、每一次力控修正都交給端到端大模型重新推理,延遲和算力都會成為瓶頸。
劉欣提到,近一年備受關注的VLA模型π0系列,依然沒有完全解決大模型在機器人控制中的推理延時問題。其衍生版π0-FAST,本質上也是為了降低延遲、提升推理速度而做出的壓縮取舍。
這正是業內轉向“大小腦分層架構”的原因。大腦負責低頻的復雜任務理解和規劃,比如判斷要拿起哪個物體、選擇怎樣的操作順序、規劃大致路徑;小腦則負責高頻的底層動作執行,比如手指以多大力閉合、什么時候減速、檢測到滑移后如何調整姿態。
![]()
大小腦分層模型,圖片來源:伯牙智能
這種分層方案的好處在于,大腦不需要占用小腦的高頻控制資源,小腦也不需要每一步都等待大模型重新推理,前者解決“做什么”和“大致怎么做”,后者解決“接觸之后如何穩定做成”。并且,當硬件性能出現下滑時,這種解耦的系統仍然有機會維持任務完成能力。
在真實使用中,靈巧手不可能永遠處在理想狀態。腱繩可能逐漸磨損,傳動間隙可能發生變化,傳感器信號也可能出現噪聲。
劉欣認為,在大小腦分層架構下,即便小腦執行的動作變慢、抖動或出現偏差,只要上層大腦仍然能夠給出任務目標和策略約束,底層控制就可以圍繞反饋繼續修正;而完全端到端的方案,在硬件狀態變化后往往更容易出現泛化問題。
換句話說,伯牙并不是試圖把所有不確定性都從硬件里消滅掉,而是希望通過感知、控制和學習,把不確定性納入系統閉環。
最后在數據上,用“不完美的數據”讓系統在真實環境中學會實時修正。
劉欣并不認為只有“成功動作”才有價值。在真實操作中,一次抓取失敗、一次打滑、一次差一點成功的動作,都可能幫助模型理解任務邊界。
“特別糟糕的數據當然要剔除,但次優數據有價值。”劉欣說,“它能告訴你,失敗是怎么發生的。”
如果說成功數據告訴系統“應該怎么做”,那么失敗數據和次優數據則告訴系統“邊界在哪里”。對于靈巧操作來說,這類數據尤其重要。因為真實世界里的很多失敗并不是災難性的,而是發生在接觸瞬間:力用大了、角度偏了、摩擦不夠、物體開始滑移。只有記錄這些過程,系統才有可能在下一次操作中提前修正。
從這個角度看,伯牙的硬件、控制和數據思路其實指向同一個目標:不是造一只在實驗室里重復定位最精準的手,而是造一套能在真實世界中感知變化、處理誤差、持續修正的靈巧操作系統。
3.落地路徑:不急著進入家庭
在人形機器人敘事里,家庭一直是最有想象力的終局市場。一臺機器人走進家庭,整理房間、端茶倒水、洗衣做飯、照顧老人和孩子,這是大眾對具身智能最容易理解的圖景。靈巧手作為機器人和物理世界發生交互的末端,也天然會被放進這個想象里。
但伯牙智能沒有把家庭作為第一個主戰場。
家庭并不是一個適合早期產品快速驗證的場景,家庭里的物品種類太多,任務邊界太模糊,安全要求高,用戶對價格和穩定性的容忍度也低。
相比之下,科研機構和部分行業客戶,更像是高自由度靈巧手的早期入口。
其中,科研客戶就是伯牙智能最早面對的一批“開發者用戶”。
過去,很多機器人研究集中在移動、導航、機械臂控制等方向;但當機器人開始進入真實操作任務時,末端執行器的重要性被重新放大。
對于科研機構來說,一只足夠開放、可控、具備觸覺和力控能力的高自由度靈巧手,本身就是開展操作學習、模仿學習、多模態感知和機器人控制研究的重要平臺。
這類客戶的特點是,未必馬上要求完整行業解決方案,但對自由度、接口、傳感器、控制能力和開發環境有較高要求。因此,科研市場不僅能帶來早期收入,也能幫助伯牙智能建立開發者生態。
![]()
高山S1靈巧手執行抓取任務,圖片來源:伯牙智能
除了科研市場,伯牙智能更看重的另一類早期場景,是已經具備明確人力成本、危險性或柔性操作需求的行業客戶。
劉欣判斷,危險環境中的遠程作業,海外高人工成本地區的服務和操作任務,需要處理多品類、小批量的柔性裝配,以及部分服務業場景可能會更早落地。
這些場景不一定要求機器人一開始就做到完全自主,很多時候,只要先實現遠程化,就已經能夠創造價值。
例如,在高危環境中,讓人離開現場本身就是價值;在人工成本高的地區,一個操作員遠程管理或接管多臺設備,也可能產生經濟性;在柔性作業中,如果機器人可以完成部分重復操作,人類只在復雜環節介入,也能提高效率。
換句話說,商業化并不只有“全自動替代人”這一條路,遠程操作、半自主操作和人機協同,都可能成為靈巧手的早期落地形態。
這也解釋了為什么伯牙智能不愿意只做一個零部件供應商。
對于靈巧操作來說,數據不只是訓練材料,也會反過來定義產品迭代方向。哪些動作最常發生,哪些物體最難抓,哪些任務最容易失敗,哪些傳感器信號真正有用,哪些結構設計在真實使用中最容易磨損——這些問題很難只靠實驗室假設回答,必須進入真實場景才能被發現。
如果只賣一只機械手,伯牙智能能獲得的是硬件收入;但如果進入科研平臺、行業客戶和真實場景試點,它獲得的將不只是訂單,還有真實操作數據、任務反饋和工程迭代線索。硬件、控制、模型和數據之間,必須形成閉環。
劉欣認為,在高精度靈巧操作中,真機數據目前仍然非常關鍵。仿真當然有價值,尤其適合做算法預訓練、任務驗證和大規模實驗,但靈巧手的接觸、摩擦、形變、滑動和微小力反饋很復雜,sim2real的gap仍然存在。很多看似細微的接觸差異,都會影響真實抓握和操作的穩定性。
因此,伯牙智能希望通過科研客戶、行業客戶和真實場景試點,逐步積累高質量操作數據。這些數據不會簡單開源,但公司會提供開發環境和生態支持,包括兼容ROS、Gazebo、MuJoCo、Isaac等機器人開發生態,讓更多開發者和客戶能夠基于伯牙的硬件和控制系統開展二次開發。
從這個角度看,伯牙智能的商業化路徑與技術路線是一體的:先進入科研和行業場景,一方面可以更快形成收入,另一方面也是為了讓產品在真實任務中被使用、被反饋、被修正。每一次真實抓取、每一次失敗恢復、每一次遠程接管,都會成為下一輪硬件設計、控制策略和模型訓練的輸入。
這才是伯牙智能想要滾動起來的數據飛輪:不是先閉門造出一只完美的手,再等待通用機器人時代到來;而是在真實場景中邊賣、邊用、邊采集、邊迭代,讓靈巧手從一個硬件部件,逐漸變成機器人操作能力的底層入口。
(封面圖來源:伯牙智能)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.