一种称为深度学习的人工智能技术目前正在用来模拟空间导航,这种人工智能系统建立了一种空间的表现,类似于在哺乳动物大脑内发现的网格细胞。

 

 

 

 

  深度学习是一种人工智能方法,它的灵感来自大脑神经网络。由于这种技术的贡献,催生了一系列的技术,从自动化视频分析到语言翻译。在《自然》杂志的一篇在线论文中,巴尼诺(Banino)等人使用这种框架获得了关于真实生命神经网络的新认识,尤其是关于空间的几何常规表示方法是如何促进灵活的导航策略的。
 
  可以训练深度学习网络怎样从输入得到特定的输出,例如,学会从许多张不同人的照片中识别一幅特定的脸形。深度学习网络由重复计算单元的连续层次组成,每个单元接收来自前一个层次的相似单元的输入,然后向下一个层次发送输出。从数学上来说,这样一个网络可以被视为一种高维函数,可以通过改变一层的输出在下一层的加权情况来调节。
 
  在训练阶段,网络对函数进行了调整,这通常依赖于一组输入-输出示例。例如,一个深度学习系统可能浏览了一系列相片,并知道哪张相片包含有它想要识别的脸形。深度学习系统的权重可以通过优化算法自动调整,直到其学会正确识别。深度学习网络具有惊人的能力:能认出和利用在例图中重复出现的最有用的容貌特征和模式,能区别不同的脸形。但深度学习网络的一个缺点是:最终的网络往往是一个黑箱,在训练过程形成的计算方案经常不能从各层之间分配的无数权重中得到解释。
 
  深度学习网络可以成功地执行感知任务,但对如同导航这样的复杂行为任务还研究甚少。现实生活中导航的一个关键方面是通过根据方位和旅行距离计算每一步的位移来估计每一步之后的位置,这个过程称之为路径整合。神经科学家、认知科学家和计算机科学家认为,这个过程对生成环境的认知地图至关重要。有几种神经元与大脑的认知地图相关联,包括位置细胞和头部方向细胞,前者在生物体占领了环境中一个特定位置时会激活,后者标志着头的方向。
 
  第三种神经元,即网格细胞,当动物处于环境中形成六角形网格模式的任何一个点时,它就会发出信号。一般认为:网格细胞是具有几何属性的认知地图,有助于规划和跟踪轨迹。这些细胞存在于大脑的海马体,在人脑内,海马体负责空间学习、自身记忆和关于世界的一般事实的认知。
 
  巴尼诺等人期望在深度学习网络中生成路径整合。因为路径整合涉及到记住以前处理步骤的输出,将其作为下一个处理步骤的输入,作者使用了一个包含反馈回路的网络。他们通过模拟觅食鼠类路径来训练网络。此系统接收了如下的信息:模拟鼠类的线性速度和角速度,关于位置细胞和方向细胞的模拟活动;后者可以看作鼠类目前位置和头部方向的“预言”。
 
  作者发现,在训练期间,类似网格细胞的活动模式自发地出现在网络中间层内的计算单元内,尽管网络或训练协议内没有明确这类模式。类似网格单元的出现是令人印象深刻的例子,说明深度学习在做其最擅长的事情,即发明一个原始、经常是不可预测的内部表示来帮助解决任务。

人工智能系统学会走捷径 在哺乳动物大脑中,位置细胞在动物处于某环境内特定位置时激活,头部方向细胞在头部处于某个特定方向时激活,而网格细胞则在动物在环境中形成六边形网格时激活。巴尼诺等人训练了一种称为深度学习网络的人工智能系统来进行导航,通过向其提供鼠类觅食方式的模拟来训练,包括训练位置细胞和头部方向细胞的活动。网络内的一些计算单元建立起了类似网格细胞的激活方式(没有显示)。a,当学习向某个目标进行导航时,使用网格细胞的系统(黑线表示一种样本路径)和使用位置细胞和头部方向细胞的系统(灰线)采用的是相同的路径。b,但是当导入捷径时,例如打开了以前关闭的门时,只有使用网格细胞的系统发现了较短的路线,彰显了类似网格细胞的活动改善灵活导航策略的能力

 

  类似网格的单元可以使网络在路径整合的基础上保持对位置的跟踪,这样的单元能否帮助深度学习系统学会有效地从其目前位置导航到目标位置呢?为了解决这个问题,巴尼诺等人添加了一个强化学习元件,使得深度学习网络学会赋值给特定位置的特定动作。作为奖励,更高的值赋与使模拟鼠类更接近目标的动作。类似网格的表示显著改善了网络解决目标定向任务的能力,优于起始和目标位置由位置细胞和方向细胞编码的对照模拟。当诸如关闭的门等障碍物被移除时,经过训练的网络会发现捷径,甚至能够在以前未被探索过的熟悉环境的附件内推测达到目标的路径。这些结果支持这样的观念:网格细胞使大脑能够执行矢量计算(关于路径的长度和方向的计算),以帮助在以前未被探索的环境中进行路径规划。
 
  将来,作者的深度学习网络可用来探索网格细胞和位置细胞之间相互作用的后果。在目前的网络内,模拟的位置层在训练期间并不发生改变。但是,在大脑内,网格细胞和位置细胞彼此相互影响,其途径还未被充分认识。尽管在缺乏网格细胞输入的情况下,真实生命的位置细胞可以保持对空间的选择;但是,当动物远离可用于定义位置的外部标志时,这些输入似乎会很重要。在这些情况下,位置细胞依赖路径整合,而网格细胞则保持对位置的精确估计。通过建立这样的网络,使得位置细胞层可以受到类似网格输入的调控,我们可以开始认识位置细胞与网格细胞的关系。
 
  从更广义的视角来看,如下的方面是非常有趣的,即深度学习网络可以发现类似大脑的路径整合的解决方案,该解决方案来自非常普通的计算假定,不考虑特定的生物学机制。网络集中于这样一种解决方案是令人信服的证据,表明网格细胞活动模式存在一些特殊之处,支持路径整合。但是,深度学习系统的黑箱特性意味着可能会很难确定那些特殊之处是什么。
 
  同样地,网格表示增强了目标定向的事实,令人信服地证明了大脑内网格细胞的作用的概念。但是,作者必须使用相关性分析,以定性的直觉为指导,间接推断出网络正在进行向量计算。由于在模型内无法直接操作这些计算,使得研究网格细胞成为有效导航方案的计算原理、算法和编码策略变得困难。因此,理论家最终陷入了与实验主义者同样的困境:试图将一个不太为人所了解的复杂体系拆开来理解它。使深度学习系统更能理解人类推理是未来一项令人兴奋的挑战。

 

资料来源 Nature

责任编辑 岳峰