五名精英乒乓選手走進一個標準奧運尺寸的賽場。球臺是ITTF認證的SAN-EI,球是Nittaku 40+三星球,裁判是日本乒協持證上崗的。一切按國際乒聯規則來,沒有縮水。
他們的對手不是人,是一個叫Ace的機器人。結果,五場三局兩勝,Ace贏了三場。
![]()
要知道,這是人類歷史上,自主機器人首次在正式比賽規則下,實打實地從人類運動員手中搶下勝場。Ace并非實驗室里的發球模板,面對時速超過20米、每秒轉動上百圈的極限旋轉球,它不僅接住了,還回擊得極為刁鉆。
同時,這項成果剛剛以封面文章的形式登國際頂刊《Nature》。它用數據向世界證明,物理AI在復雜、高速的實時交互任務中,已經擁有了足以媲美人類精英的無限潛力。
![]()
01.
為什么“打乒乓球”件事這么難?
職業乒乓球的球速能飆到20米/秒以上,兩拍之間往往不到0.5秒。更狠的是旋轉,角速度可達1000弧度/秒,一個上旋或下旋能讓球的軌跡完全違背直覺。球臺上的彈跳還會受旋轉影響,下旋球可能“飄”,上旋球可能“扎”。
自1983年以來,人類做了四十多年乒乓球機器人。但之前的方案要么用發球機喂球,要么縮小場地覆蓋范圍,要么干脆忽略旋轉,要么禁止某些擊球方式。說白了,它們打的不是真正的乒乓球。
![]()
所以索尼AI團隊面對的問題是:不是讓機器人碰到球,而是讓它在完整的、對抗的、帶旋轉的真比賽里,跟人類高手過招。
Ace的核心突破,就是贏在穩定性和對旋轉的處理能力。
02.
Ace是如何練成的?
如何做到這一點?索尼AI團隊為ACE搭載了一套精密的“感知-決策-執行”鏈條。Ace的整套系統以1毫秒周期同步運行,與視覺系統共享時鐘信號,即使在最大速度下,位置跟蹤延遲仍低于5毫秒。
![]()
Ace集成了感知、控制和機器人硬件,用于打乒乓球
- 感知:看懂位置,更看懂旋轉
乒乓球場上,人類選手靠眼睛追球、靠經驗猜旋轉、靠肌肉記憶調整動作。Ace走的完全是另一條路,靠直接測量。
它看位置靠的是9臺APS傳統相機,分布在球臺外圍,以200赫茲的頻率捕捉球的3D位置,平均誤差只有3毫米,延遲10.2毫秒。
真正的核心突破,是“看懂旋轉”。
Ace配備了三套凝視控制系統,每套都搭載了事件驅動視覺傳感器,這種相機不按幀曝光,而是對光線變化做像素級異步響應,高速旋轉物體在傳統相機里糊成一片,在它眼里卻是清晰的運動軌跡。
每套系統還配了一對可旋轉的跟蹤鏡和一個遠攝可調鏡頭,鏡頭會主動跟隨球的移動,始終對準球體表面印著的商標。
系統用卷積神經網絡和對比度最大化算法分別估算角速度,再根據不確定性動態融合,最終以400到700赫茲的頻率把旋轉數據傳給決策層。平均測量誤差24.8弧度每秒。
![]()
- 決策:仿真中自學,比賽中調用
有了位置和旋轉數據,下一步是決策。
Ace采用Soft Actor-Critic(SAC)算法,在仿真環境中通過試錯自學回球策略。訓練中,評估模塊能看到真實的球狀態,而決策模塊只能依賴帶噪聲的傳感器歷史數據。這種“不對稱”設計確保策略能從仿真順利遷移到真實世界。
比賽時,策略每32毫秒查詢一次,根據球和機器人的當前狀態輸出一個抽象動作,然后映射為未來32毫秒的關節軌跡。與此同時,系統會預先計算一條返回安全位置的“重置軌跡”,一旦預測到碰撞就立刻執行,保證高速運動中的安全。
為了應對不同類型的來球,團隊訓練了多個策略,分別掌握高上旋、下旋等技能,每個技能設定期望的落點和旋轉權重。比賽時,系統根據來球特征從技能庫里實時選取最合適的策略。這套思路上很像一個全能運動員,拿到什么球就調出什么技能包。
發球則單獨處理。拋球動作來自人類示范,擊球動作通過遺傳算法優化。每種發球要經過真人陪練測試,20次嘗試中失敗率低于5%才能入庫。最終,Ace的發球庫里存了15種發球。
- 執行:為速度與精度定制
執行層面,機械臂有8個自由度(2個直線關節+6個旋轉關節),末端最高速度設定為20米/秒,工作空間覆蓋3.6米×3.6米。
此外,其連桿經過拓撲優化設計減重,使用Scalmalloy高強度鋁合金3D打印。末端執行器是一塊改裝球拍——Butterfly Dignics 05膠皮搭配VICTAS ZX-GEAR OUT底板,外加一個用來發球的小杯。
有了這套能“看懂旋轉、實時決策”的系統,Ace走上了賽場。
03.
贏下精英選手,從職業選手手中拿分
2025年4月,Ace先對陣5位精英選手(三女兩男,十年以上競技經驗,每周訓練約20小時),三局兩勝制,3勝2負,13局拿下7局。
隨后對陣兩位日本T聯賽現役職業選手安藤南和曾根薰,五局三勝制,0勝2負,但7局中拼下1局。
數據揭示了Ace的贏法。它不靠更快的擊球。Ace的制勝球和普通回球在速度和旋轉分布上幾乎一致,穩定回球等對手失誤。而人類選手的制勝球明顯高于普通回球,靠突然加力得分。
面對旋轉高達450弧度/秒的來球,Ace回球率始終超過75%,遠超此前報道的競技乒乓球機器人水平。
它自己打出最高速度16.4米/秒、最高旋轉600弧度/秒,也能回擊對手最高19.6米/秒、867弧度/秒的來球。平均回合長度5.0拍,比人類職業比賽典型值3.9拍更長。發球方面,15種不同發球直接拿下16分,精英選手僅8分。
![]()
最驚艷的一幕是擦網球。球在0毫秒觸網,Ace僅用49毫秒調整軌跡并成功回球。
團隊做了反事實模擬:如果球沒擦網,Ace的動作路徑會截然不同。說明它真的是在實時決策,而非執行固定套路。
![]()
04.
從球桌走向更多場景
當然,Ace還遠非完美。
目前它仍無法穩定擊敗頂級職業選手。《Nature》同期評論文章指出,Ace從多個視角同時觀察場地的方式與人類存在本質差異,離“擬人化”還有距離。
研究團隊自己也很清醒:真正的挑戰在于如何建模人類對手的行為。在高維物理空間中精確模擬人類動作極其困難,這意味著真正的目標函數(贏或輸)無法被直接用于訓練,只能使用替代目標。未來如果能引入對手建模和在線學習,Ace有望在實戰中持續進化。
即便如此,這項突破的意義已經超出了乒乓球本身。它為制造、服務、搜救等需要高速、精準人機協作的領域,提供了一個可驗證的技術路徑。機器人執行實時復雜任務的能力,正在被一步步驗證。
正如1992年奧運會選手、乒乓球專家中村金次郎在看完Ace一記擊球后的感嘆:“其他人根本做不到。我以前認為這是不可能的。但既然它能做到……那就意味著人類也有可能。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.