原文作者:用戶“多多的賈維斯”
原文鏈接:https://www.xiaohongshu.com/
KAN We Flow? Advancing Robotic Manipulation with 3D Flow Matching via KAN & RWKV
![]()
一、整體概述
1. 本文提出KAN-We-Flow,一種用于機器人三維操作的高效流匹配策略模型。
2. 核心貢獻在于用RWKV與KAN替代傳統大規模UNet骨干,在保持甚至提升成功率的同時,大幅降低參數量與推理延遲。
3. 方法在Adroit、Meta-World、DexArt三大基準上取得當前最優或并列最優性能,參數量減少約86.8%,支持實時控制。
![]()
二、研究背景
1、擴散式策略
① 優點是動作分布建模能力強
② 缺點是需要多步去噪,推理慢、模型重,不利于真實機器人部署
2、流匹配策略
① 通過學習一步向量場實現快速生成
② 但現有方法仍大量依賴UNet,計算與存儲開銷依舊偏大
3、核心問題
如何在保證精度的前提下,進一步壓縮模型規模并提升實時性
![]()
三、動機直覺
1、RWKV具備線性復雜度的時序建模能力,適合長時序動作預測
2、KAN基于可學習的一維函數逼近,能以更少參數表達復雜非線性映射
3、將二者結合,有望同時解決“長時序依賴”和“參數效率”問題
![]()
四、技術路線
1、整體框架
① 采用一致性流匹配,實現一步動作生成
② 輸入為點云感知、機器人狀態與時間編碼
2、核心網絡
① RWKV-KAN骨干網絡
* RWKV負責時間與通道混合,建模動作序列上下文
* GroupKAN對特征通道進行分組的非線性函數校準,替代傳統MLP
② Action Consistency Regularization(ACR)
* 通過歐拉外推,將一步預測動作與專家軌跡在末端對齊
* 提供額外監督,穩定訓練,不增加推理成本
3、學習目標
聯合一致性流匹配損失與ACR正則項進行端到端訓練
![]()
五、實驗結果
1、性能表現
① 在Adroit、Meta-World、DexArt上整體成功率優于FlowPolicy與DP3
② 在高難度、長時序任務中優勢更明顯
2、效率對比
① 參數量約33.6M,相比DP3減少86.8%
② 推理時間約8–11ms,滿足100Hz實時控制
3、消融實驗
① RWKV、GroupKAN與ACR均對性能有穩定增益
② ACR在長預測窗口下顯著降低動作漂移
雷峰網
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.