运动机能障碍

首页 » 常识 » 常识 » 浙大机器狗绝影展现新绝技,在陌生环境
TUhjnbcbe - 2025/7/28 20:04:00

对于一只自然界的动物来说,在各种陌生环境下灵活切换相应的运动技能,似乎是一种条件反射和先天本领,但如何让机器人掌握这种能力,却非常具有挑战性,这也是全球机器人专家们长期探索的课题。

年12月,一项由华人科学家团队合作完成的机器人创新成果,当选为ScienceRobotics杂志的月度封面论文,研究人员来自英国爱丁堡大学先进智能机器人实验室与浙江大学朱秋国教授带领的机器人团队。

基于四足机器人,科研人员提出了一种多专家学习框架,让机器人具备了应对各种意外情况的自主能力,并在运动响应敏捷度和灵活度方面表现优异。

图|封面论文(来源:ScienceRobotics)

本项研究中使用的四足机器人,即是被称为中国版波士顿动力的“绝影”机器人,DeepTech此前曾对该机器人进行过专访报道:《浙大机器狗“绝影”的逆袭,从技术上“被虐”到应用上追赶|独家专访》。

关于本期封面论文的算法特点和贡献,DeepTech联系到论文的通讯作者李智彬进行了一番交流。

让机器狗“集各家之长于一身”

李智彬目前是爱丁堡大学信息学院的助理教授,领衔先进智能机器人实验室(主页见文末)。他的研究方向包括机器人动态运动控制、实现(超)人类级别的机器人自主移动、多臂协调和抓取操作等,同时在机器人硬件平台、力和柔顺控制等领域也有丰富经验。

据他介绍,机器人在实际应用中通常会面临两种挑战:一是在任务层,二是在算法方面。

首先,传统方法中,机器人要去执行某种任务,需要算法工程师、程序员们对其进行编程,一般而言都是针对某一个具体任务来编程。这种方法无疑存在短板,比如说野外救灾或是地震现场搜救工作中,机器人所处的环境将会非常复杂,地面可能有障碍物阻拦、崎岖不平、打滑问题,机器人也会出现各种摔倒和其他意外情况。

如果出现种或者0种不同的情况,还要去执行多项任务,用传统方法去编程是非常难涵盖的,其量级也不可扩展,开发人员不可能“先知先觉”预先编程出所有的特定解决方案。因此,这就需要机器人在一个全新的环境下,自主决定应该怎么去做才能完成任务。

其次,机器人遇到新的情况需要随机应变,灵活应付。此前的很多研究中,几乎都是把机器人的单项技能训练做得很好,比如走路、奔跑、故障恢复等,但在演示中,有时候还需要操作员拿着遥控器根据机器人当时所处的情况去切换模式和操作,这让实用性大打折扣。

而本次研究中提出的多专家系统,相当于每个“专家”都训练了一种基本技能,比如说走路、故障恢复、摔倒爬起等,单项技能学会之后,然后让不同“专家”组队一起训练,通过一个门控神经网络,在不同事件、不同情况下去激活调度每个专家,让他们综合形成不同的协调组合,进而克服不同问题。

通过这样的技能加持,四足机器人“绝影”在没有导航的情况下,能自动执行在楼梯、砾石堆、崎岖路面上进行连贯的小跑、转向,乃至在被人踹倒、被推翻的情况下也能迅速恢复正常姿态。

“最后形成的那个综合‘专家’,相当于是集各家之长于一身,懂得融会贯通,这就让机器人具备了在当时那种特定情况下所需要的技能组合,而且能够根据不同情况千变万化、举一反三,去自主恢复继续执行任务。”李智彬说道。

机器人摸爬滚打的能力有了怎样的提升?请看以下效果:

8项“专家技能”融会贯通,关键恢复能力控制在1秒内

详细来讲,论文中提到的多专家学习体系结构被命名为MELA(multi-expertlearningarchitecture),这是一个由深度神经网络(DNN)和门控神经网络(GNN)组成的分层强化学习(HRL)结构。

为了帮助解释,研究人员定义了几个关键术语:运动技能、专家和运动模式。

运动技能:即一种反馈策略,可以产生协调的动作来完成特定类型的任务,这是构建更复杂动作的基础;专家:具有专业运动技能的DNN;运动模式:四肢协调运动的一种模式,如站立、原地转动、向前/向后小跑、左右转向、跌倒恢复等。

图|不同的技能种类(来源:ScienceRobotics)

研究人员为机器人训练了8项运动技能,包括:(1)从背部翻身;(2)侧滚;(3)身体姿势控制;(4)站立平衡;(5)左转;(6)右转;(7)小步小跑;(8)大步小跑。

不同的技能需要不同的触发方式,而把“八技”融会贯通是MELA合成可变技能和产生适应性行为的基础。

面对不同情况下,GNN生成可变权重(α)来融合所有八个专家网络的参数,这样新合成的运动技能可以通过混合各个专家的有效技能,快速生成不同的运动技能,来适应各种未知场景。

图|多专家学习框架MELA的原理(来源:ScienceRobotics)

实验结果表明,依靠MELA输出的融合技能加持,“绝影”机器人的关键恢复能力控制在1秒内(恢复身体姿态平均0.5s,恢复小跑模式平均0.4s),也显示出了在非结构化环境下更强的可靠性和通障性能。

还有一个值得

1
查看完整版本: 浙大机器狗绝影展现新绝技,在陌生环境