奔跑吧，机器人！

发布时间：19年09月28日

编译俞晓晴

经过几十年的蹒跚学步，机器人终于开始学习如何优雅地行走、敏捷地奔跑和抓取物体了。这一最新进展拉开了具有物理灵活性的人工智能时代的序幕。

小动物们在野外奔跑，爬树，即使摔倒了，也能从容地站起来。和我们的灵长类表亲一样，人类可以利用手指操控精细动作，完成各种任务，比如剥橘子或在漆黑的过道里摸钥匙。虽然行走和抓取对许多生物来说都不是什么难事，但众所周知，机器人在这方面的表现一直不尽如人意，包括步态运动和手的灵巧度，但现在一切都不同了。

近期，黄明博（Jemin Hwangbo）等人在《科学·机器人学》（Science Robotics）上发表论文给出了非常有意思的新证据，证明运用数据驱动法设计的机器人软件有望解决机器人和人工智能研究长期面临的一大挑战——仿真﹣现实差距。几十年来，机器人专家一直通过基于预测性数学模型（也就是经典控制论）的软件引导机器人的肢体活动。然而，这个方法在引导机器人行走、攀爬和抓取不同形状的物体这类看似简单的任务时，已被证明无效。

一个机器人的生命总是先从仿真开始。如果机器人的引导软件在虚拟世界中表现良好，这个软件就会被置入机器人体内，之后被应用于物理世界。在物理世界中，机器人会不可避免地遇到无数难以预测的不规则内容，包括表面摩擦力、结构柔性、振动、传感器延迟和致动器时控不佳（致动器是将能源转化为运动的设备）。不幸的是，这一连串棘手问题无法提前利用数学模型一一描述出来。因此，即使是在仿真环境中应对自如的机器人，一旦在真实世界中遇到几次看似很小的物理障碍后，也会开始跌跌撞撞起来。

黄明博等人演示了一种可以消除这种仿真﹣现实差距的方法——将经典控制论与机器学习技术相结合。该团队首先设计了一个中型犬大小的四足机器人的传统数学模型，这个机器人名为ANYmal。接下来，他们从引导机器人肢体运动的致动器中收集数据，再将所得数据输入多个名为神经网络的机器学习系统，从而建立第二个模型。这个新模型可以自动预测AMYmal机器人肢体的特殊运动。最后，团队将经过训练的神经网络插入第一个模型中，并在一台标准台式电脑上仿真运行这个混合模型。

这种混合仿真器比基于分析模型的仿真器速度更快，也更准确。更重要的是，先将一种运动策略在混合仿真器中加以优化，再转入机器人体内到现实世界中测试，最后机器人的表现和与仿真表现一样成功。这项姗姗来迟的重要突破预示着看似不可逾越的仿真﹣现实差距是时候画上句号了。

黄明博等人使用的方法提示了机器人领域的新一轮重大变革，而混合模型正是这场变革的第一步。下一步则是要让所有分析模型都下岗，代之以通过机器人在现实环境中收集到的数据进行训练的机器学习模型。这类纯数据方法也被称为端到端训练（end-to-end training）越来越被青睐，创新应用也是层出不穷，如关节式机械臂、多指机械手、无人机，甚至是无人驾驶汽车。

就目前来说，机器人专家仍在努力抓住计算速度加快、传感器数据增多、机器学习算法质量提高所释放的巨大潜能。对于大学是否应该停止教授经典控制论，现在还不好说。但这一天迟早会来：将来的机器人专家无需告诉机器人如何学走路，而是让机器人利用自身收集得来的数据进行自我学习。

当然，还有许多挑战有待解决，首要的一个就是可扩展性。目前，端到端训练已被应用于致动器数量较少的实体机器人。致动器越少，描述机器人运动所需参数就越少，模型也就越简单。此外，在通往可扩展性的路上，可能还要使用层次更为分明的模块化机器学习架构。还需开展进一步的研究，以确定端到端控制是否可以扩展用于引导拥有几十个致动器的复杂机器，如类人机器人，或是制造工厂和智能城市这类大型系统，智能城市特指利用数字技术提高市民生活质量的城市地区。

另一个挑战技术含量略低，但因人而异。对于一些研究人员来说，从相对简单的数学模型向“黑箱”机器学习系统转变，无异于朝着内部工作方式未知的方向前进，这不仅意味着失去内部洞察，还会让他们感到丧失了掌控力。不过，对一般人来说，看着机器人像孩子一样学步是一件很有满足感的事。

黄明博团队带来的认知突破还可以放在人类思想这个神秘的概念之下审视一番。迄今为止，意识仍是洞悉人类本质征程上的一大未解之谜。根据经验，人类自己对自我意识的定义太过含糊，对机器人软件的开发几乎不具有任何实际价值。也许我们应该反其道而行之，在机器人软件的研究中汲取灵感，破解有关人类思想的古老问题。

我们可以推测，自我意识以及更广泛意义上的知觉，其本质就是自我抽象思考能力的一个象征，这种能力也是一种自模拟能力。笔者认为，一个人能预见的未来越远、他们脑中对未来行动的图像越清晰，这个人的自我意识能力也就越高。如今，机器人已经可以学习自模拟了。这次的突破不仅是一次具有实际意义的进步，让一些工程性劳动得以解放，它还标志着机器人自主时代的开启。

资料来源 Nature