波士顿动力人工智能研究所的最新方法——结合采样与学习的动态全身操作中,波士顿动力的机器狗Spot最快仅用3.7秒就能搬起轮胎。
搬运的轮胎重达15公斤,相当于Spot自身重量的一半(32.7千克),并远超其最大臂力。
而且,搬起轮胎后,它还能将轮胎滚动到指定位置。
甚至还能把一个轮胎叠到另一个轮胎上面(还会用头帮忙顶一下)。
这一方法克服了传统操作策略(如摇操)在不同机器人形态学结构上的迁移限制,并通过分层控制实现了机器狗四肢与全身的协调动力学操作。
网友表示,狗子快去回收站去搬轮胎吧!
这是怎么做到的?
结合采样与学习的动态全身操作
总的来说,结合采样与学习的动态全身操作(Combining Sampling and Learning for Dynamic Whole-Body Manipulation)利用强化学习与基于采样的控制(sampling-based control)相结合的方法,使机器人能够执行需要手臂、双腿和躯干协同配合的动态力交互任务。
为应对复杂的操作任务,研究采用了分层控制(hierarchical control)方法,将控制问题划分为两个互补且同步的层级。
在低层,基于强化学习的运动策略直接控制电机力矩,以实现平衡、稳定性与运动执行。
高层控制则根据任务类型而有所不同:
对于轮胎扶正、拖拽与堆叠等任务,系统采用基于采样的控制,通过模拟潜在的未来情境来发现最优操作策略。
对于轮胎滚动任务,则使用强化学习来捕捉维持物体稳定运动所需的细微动力学特征与反应性控制机制。
所有的高层方法,最终都会输出包括底盘速度、姿态参数(包括滚转、俯仰、高度 )、腿部控制以及手臂动作等指令。
在采样控制中,采样控制器通过并行模拟多个未来情境,寻找最有效的操作策略,从而选择最能实现任务目标的动作。
对于那些需要精确施力和多接触协调的任务,系统会运行32个并行CPU线程,每个线程使用MuJoCo模拟未来几秒内的不同动作序列。