一個機械臂,對面站著人類高手,中間隔著一張標準乒乓球臺。球飛過來,速度快到肉眼只能看見一道白影。0.3秒,機械臂動了,球被穩穩打回去。對面的人類選手接球、回擊、再接球,幾個回合下來,球落地了。機械臂贏了這一分。
這個看起來有點簡陋卻速度飛快的家伙叫Ace,來自索尼AI。Ace是第一個能贏了高水平選手的乒乓球機器人,剛剛登上了Nature。
過去,乒乓球機器人打的是高度簡化的“模擬賽”,比如使用發球機代替人類發球、縮小球臺面積,甚至不許對手打旋轉球。而Ace是實打實地進行了標準比賽:標準的場地,真實的比賽規則,對戰人類精英選手。
Ace VS 人類
這件事的意義,遠不止“機器人會打乒乓球”這么簡單。
乒乓球比賽很難嗎?
如果你覺得 AI 下棋厲害、打游戲厲害,所以打乒乓球厲害就理所當然,那就是高看它了。棋盤和游戲畫面再復雜,本質上都還是數字世界里的事情。屏幕里的棋子不會因為你手抖而掉到地上,游戲角色也不用擔心關節會不會撞到桌子。
真正難的,是讓 AI 走進現實世界。
乒乓球幾乎把機器人最怕的幾件事疊在了一起。第一件是快。高水平比賽里,球速可以超過每小時100公里,來回之間不到半秒,也就是眨眼的功夫。第二件是旋轉。一個球帶不帶上旋、下旋、側旋,會直接改變飛行軌跡和落臺后的反彈方式;同樣的揮拍動作,面對不同旋轉的來球,結果可能完全不一樣。
第三件是對抗。對手不是按照固定程序出牌,而是在不斷試探你的弱點。回球總是落在左邊,他下一板就會盯著你的右邊打。這種實時的、有針對性的博弈,比任何預設的訓練場景都要復雜。
第四件是物理約束。機械臂有慣性,有速度極限,有關節活動范圍的限制,還得時刻避免撞到桌子甚至自己。哪怕 AI 已經算出了“完美動作”,也得確保這個動作在現實中做得到。
把這四件事放在一起,你就明白為什么乒乓球機器人這么難做了。它需要的是感知、決策、控制這一整條鏈路在極短時間內無縫配合。
Ace 是怎么做到的
Ace 的思路可以粗略理解成三層:看、想、動。
Ace 用多臺普通相機來定位球在三維空間中的位置,同時用一種特殊的相機“事件相機”來估計球的旋轉。
事件相機和常見的攝像頭不太一樣。普通攝像頭是一幀一幀拍的,就像每秒鐘截圖60次。但對于高速運動的物體來說,這種拍攝方式有兩個問題:一是延遲,從拍下這一幀到處理完這一幀,中間總有時間差;二是運動模糊,球動得太快,一幀畫面里球已經拖出一條影子,很難看清楚。
事件相機的工作方式完全不同。它不是定時拍照,而是讓每個像素點獨立工作,哪里的亮度變了,哪里就立刻上報一個“事件”。你可以把它想象成一群時刻值班的哨兵,不是每隔一段時間統一匯報一次,而是一有動靜就馬上喊出來。這種機制的時間分辨率比普通相機快了好幾個數量級。
事件相機捕捉球面亮度變化的細微模式,再通過算法反推出旋轉方向和速度,讓Ace能“看清”高速的來球是怎么轉的。
“想”
工程師不可能窮舉所有來球情況,再給每種情況寫死一套動作規則,因為來球的速度、旋轉、落點組合起來有無數種可能。取而代之的是強化學習,就是讓 Ace 在仿真環境里反復練習,用試錯的方式去學“面對這樣的來球,如果我想把球打成某種落點和旋轉,應該怎么揮拍”。
整個學習過程完全在仿真環境里完成,這可以讓機器人“死”無數次——撞桌子了,重來;球沒接住,重來;動作太慢了,重來。在真實世界里這么試錯,機器人早就撞壞了,時間成本更是承受不起。等在仿真里學得差不多了,再把策略遷移到真實的機械臂上即可。
![]()
乒乓球機器人的”超級大腦“丨Sony AI
哪怕策略網絡已經決定了“要這么打”,也不能直接把一個理想動作硬塞給機械臂。因為理想動作可能要求機械臂在0.1秒內完成一個大幅度的揮拍,但機械臂的電機和關節做不到;或者理想軌跡會讓機械臂的某個關節撞到桌子邊緣,那就更不行了。
Ace 的做法是,把策略輸出先映射成一個短時間窗口里的目標,再交給軌跡優化和安全模塊,生成真正可執行的連續運動。換句話說,AI 負責給方向,控制系統負責現實中的實現。
![]()
ACE的機械臂有8自由度,回球速度可達19.6米/秒丨Sony AI
這三層配合起來,從看見球到打出球,整個流程被壓縮在不到半秒的時間里。而且這不是一次性的動作,而是要在一場比賽中連續執行幾十次、上百次,每次都不能出大錯。
它到底打得怎么樣
Ace 和5位超過10年球齡的精英級選手打了比賽,贏下了3場。與2位職業選手時對決時都輸了,拿到了1局。不過,它能穩定回擊高速和高旋轉來球,說明它不是靠運氣或者偶然性得分。
![]()
Ace今年4月對戰了5位精英選手和2位職業選手。在更早的比賽中,曾與日本排名前10、世界排名64的吉村和弘切磋(并輸了)。
有意思的是,Ace 的球風和人類不太一樣。比如面對極速來球時,人類的本能是后撤以爭取反應時間,但 Ace 可以在不退臺的情況下守住原位。
人類高手更常靠很猛的上旋和速度直接壓死對手,一板球又快又轉,對方接不住就直接得分。Ace 的優勢更多來自穩定性——它能穩定回球,不會體力不支動作變形,在高速條件下能維持比較高的成功率。你很難用一板爆沖直接打死它,但它也很難用一板爆沖直接打死你。
這反映了機器人和人類各自的優勢。人類的優勢在于爆發力和創造力,能在關鍵時刻打出一板質量極高的球。機器人的優勢在于一致性和反應速度。
但 Ace 也還有明顯的短板。很明顯,它還打不過真正頂尖的職業球員。另外人類高手不僅是在回球,更是在讀對手、設陷阱、做節奏變化,Ace 現在無法完成戰術。
論文作者自己也提到,未來的重要方向包括更強的人類對手建模,以及能從真實互動中持續改進的在線學習。
讓機器人打乒乓球,重要嗎?
如果你關心的只是“機器人會不會搶走人類的體育冠軍”,那這篇論文可能沒那么激動人心,畢竟 Ace 現在連世排64的選手都還打不過。
但它讓我們看到一種新階段的 AI:不再只在數字空間里推理,而是在物理世界里,以接近人類極限反應速度的節奏,與人互動、對抗、調整。這類能力一旦成熟,影響不會停在球桌邊。
想象一下服務機器人的場景。你在廚房里做飯,機器人在旁邊幫忙。你說“把那個碗遞給我”,機器人需要理解你指的是哪個碗,判斷你現在的姿勢和位置,然后用合適的速度和角度把碗遞到你手邊,既不能太慢讓你等,也不能太快嚇你一跳,更不能撞到你的手。這需要高速的感知-決策-動作閉環。
乒乓球只是第一個足夠好看、也足夠難的舞臺。下一個舞臺會是什么,現在還不知道。但可以確定的是,這扇門已經被推開了。
作者:腦子通電
編輯:Luna
封面圖來源:Sony AI
點個“小愛心”吧
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.