cover_image

研究进展:四足机器人-学会抵御攻击 | Nature Machine Intelligence

今日新材料 今日新材料
2023年08月22日 16:00

机器人运动技能,可以通过深度强化学习获得,以作为反映状态-动作映射的神经网络。状态选择是机器人运动学习的关键所在。然而,由于神经网络的复杂性,通常需要人类的洞察力和工程努力,以通过定性方法(如消融研究 ablation studies)选择适当的状态,而没有对状态重要性进行定量分析。

近日,英国 爱丁堡大学 (University of Edinburgh) Wanming Yu, Chuanyu Yang,Zhibin Li等,在Nature Machine Intelligence上发文,提出了系统的显著性分析,定量评估了不同反馈状态的相对重要性,以用于基于深度强化学习,有效地学习运动技能,从而为机器人运动学习最基本的反馈状态识别提供了指导。
基于包括关节位置、重力矢量和基本线速度和角速度的重要状态,研究证明了了模拟四足机器人可以学习各种鲁棒的运动技能。研究发现,只有在重要状态下,学习的运动技能,才能达到与具有更多状态,即相当于人的任务表现。
这项工作,为状态观察对特定类型的运动技能影响,提供了定量的见解,从而以最小感知依赖性,学习广泛的运动技能。
图片Identifying important sensory feedback for learning locomotion skills. 
识别重要感觉反馈,用于学习运动技能。

图片图1:四足动物和机器人之间的功能性感觉反馈。


图片图2:用于学习有效运动技能的关键反馈状态识别方法。


图片图3:基于显著性分析,确定了平衡恢复、小跑和跳跃技能的前四个关键状态反馈排名


图片图4:小跑和跳跃反馈状态的64个维度相对重要性。


图片图5:平衡恢复、小跑和跳跃的全状态、关键状态和不相关状态策略的任务性能基准。


图片图6:基于关键反馈状态,学习新运动技能的适用性。

文献链接
Yu, W., Yang, C., McGreavy, C. et al. Identifying important sensory feedback for learning locomotion skills. Nat Mach Intell 5, 919–932 (2023).
https://doi.org/10.1038/s42256-023-00701-w
https://www.nature.com/articles/s42256-023-00701-w
https://www.nature.com/articles/s42256-023-00701-w.pdf
本文译自Nature。
来源:今日新材料
声明:仅代表译者个人观点,小编水平有限,如有不当之处,请在下方留言指正!

推荐阅读
让机器狗自己学会如何抵御人类的攻击
仅用1个小时,这只机器狗从零开始学会了自己走路!
研究进展:Science-多足机器人
研究前沿:浙江大学Nature Machine Intelligence-模仿-驰豫强化学习 | 四足机器人



继续滑动看下一个
今日新材料
向上滑动看下一个