机器人也路痴？丨智言智语

随着智能技术的发展，各式各样的服务机器人已经成为我们生活中的常客。那么，你有没有产生过这样的疑问：机器人会认路吗？它们是怎么探索新环境的呢？以目前已经在我们的日常生活中广泛使用的扫地机器人为例，作为非常需要具备“认路”能力的一类机器人，为了实现快速的环境清扫工作，它在到达新环境时的第一项工作便是——构建环境地图。

地图对于移动机器人来说非常重要，一方面，机器人需要通过地图估计当前时刻在环境中的位置；另一方面，地图为机器人的路径规划系统提供了搜索空间，以实现机器人在环境中安全，快速地移动。

因此，快速地构建精确的环境地图是服务机器人实现安全高效服务的前提。环境地图很重要，但机器人又是如何顺利构建地图的呢？这里我们就不得不提到解决这类问题的核心方法——未知环境探索，它是指机器人在一个全新的环境中，通过自主移动构建整个环境地图的过程。未知环境探索的关键在于机器人运动控制的计算，以保证机器人采取有效的动作构建精确的环境地图。

除了室内这种扫地机器人，未知环境探索方法也广泛应用于室外环境下的移动机器人上。例如救援机器人，需要在一个新的环境中搜救幸存者，通过自主探索希望能够快速地覆盖整个环境区域。矿井勘探机器人以及海底探测机器人上也常常用到这类技术，其任务目的都是尽可能地覆盖更多的区域，以完成特定的任务。

未知环境探索方法有着怎样的发展历史呢？未知环境探索问题在上个世纪90年代提出，其目标是使机器人在全新的环境中具有自主决策能力。目前常用的未知环境探索决策方法有三大类：基于边界的方法，基于信息的方法，以及基于深度神经网络的方法。

基于深度强化学习的未知环境探索方法近几年，Alpha Go, AlphaGo Zero等游戏AI在围棋领域取得巨大突破使其核心技术——“深度强化学习”——得到了广泛的关注。与此同时，深度强化学习也逐渐应用到机器人领域，而基于深度强化学习的自主探索成为未知环境探索领域的热点方向之一，这类方法通常是设计奖励函数，通过强化学习算法，训练传感器数据到动作的映射网络。

总结：未知环境探索使机器人在新环境中不再“迷路”，是进行自主工作的前提，也是机器人自主学习和进化的关键。未知环境探索不仅让机器人熟悉新环境，更重要的是为后续决策提供重要的环境地图信息。深度强化学习为未知环境探索提供了新思路，但也面临着学习效率低的问题。高效和鲁棒的学习算法仍然是今后努力发展的方向。