深度学习网络中一个被忽视的特征可能会成为人工智能领域的重大突破口。

小时候,初步进入数学世界时,我们学会了一个苹果加另一个苹果等于两个苹果,我们还学会了为真实事物计数。直到后来,我们才接触到一个奇怪的概念:零,或者说一个空盒子里的苹果数量。

阿拉伯学者和意大利数学家斐波纳契把“零”的概念引入现代数字系统之后,给数学带来了革命性的变化。当今,尽管我们在所有数学运算中自如地使用零,但是“无(nothing)”或“零”的概念尚未进入人工智能(AI)领域。从某种意义上说,AI和深度学习仍然需要学习如何利用“无”的概念进行识别和推理。

是苹果还是香蕉?无!

从传统意义上来讲,深度神经网络(DNN)之类的深度学习算法在监督之下进行训练,以便识别特定种类的事物。在一项典型的任务中,研究人员可能会训练DNN以可视方式识别一定数量的类别,例如,识别苹果和香蕉的图片。一旦获得相当多的数据,而且数据具有相当高的质量,深度学习算法实际上非常擅长提供错误率低的、可信的精确分类。

当第三个未知对象出现在DNN的面前时,就会出现问题。如果引入了训练集合中不存在的未知对象,如橘子,那么网络将被迫“猜测”,把橘子归类为跟捕获的未知对象最接近的类别——苹果!

基本上,用苹果和香蕉训练的DNN系统完全由苹果和香蕉组成,它无法想象整个水果篮里都有什么水果。

进入“无”的世界

在所有应用中,尽管对“无”或者“类别归零”的用途还不是很清楚,但是在训练和部署DNN时,其概念在许多方面都是非常有用的。

在训练过程中,如果DNN能够将项目分类为“苹果”“香蕉”或“无”,那么算法的开发人员可以确定它是否学会了有效辨认特定的类别。经过培训识别了新鲜苹果和香蕉的DNN,如果出现与已学会识别的水果类型有偏差的水果,那么它就会回应“无”。从这个意义上讲,DNN可以充当异常网络检测——除了对苹果和香蕉进行分类之外,不用经过进一步更改,它就可以发出信号,表明它注意到了偏离规范的其他情况。

到目前为止,还没有简单的方法来训练标准DNN,使其能够提供以上功能。

一种称为“终身DNN(lifelong DNN)”的新方法会自然而然地将“无”的概念纳入架构中。通过过去所学到的东西以及巧妙地利用反馈机制,终身DNN可以确定某种输入是匹配还是不匹配,以此来辨识符合规范与否。

这种机制类似于人类的学习方式:在潜意识中,我们不断检查我们的预测是否符合真实的情况。例如,如果有人对你搞恶作剧,改变了办公椅的高度,你会立即注意到这一点。那是因为随着时间的推移,你了解到办公椅的高度,你对此有了一个“模型”——如果这个模型不规范,你将立即意识到异常。我们人类不断检查自己的分类是否符合实际情况,如果不符合,我们的大脑就会注意到,并且发出警报。终身DNN在发挥功能时会充分体现这种机制,因此,在确定已学到的模型不规范时,它会发出“无”的信号。

利用“无”的概念,杜绝问题出现

以苹果和香蕉为例对“无”的概念有了基本了解之后,现在我们来考虑一下这一概念在水果识别之外的实际应用中该如何发挥作用。

考虑一下制造业,该行业的机器负责生产大量产品。通过对传统的计算机视觉系统进行培训来识别产品中各种不同的异常情况(如表面划痕),这是非常具有挑战性的。在运行良好的生产线上,看起来没有多少产品属于“次品”,且“次品”以多种形式存在,根本没有可用于培训系统的大量次品数据。

但是,借助终身DNN,开发人员可以通过训练计算机视觉系统来识别“优质”产品的各种样品。然后,当系统检测到与优质产品的界定不符的产品时,可以将该产品归类为异常,使其等候适当处理。

对于制造商而言,终身DNN及其发现异常情况的能力可以为其节省时间并提高生产线上的效率。对于其他许多越来越依赖人工智能的行业来说,也会有类似的益处。没想到“无”的概念竟有如此的重要性!

资料来源 IEEE Spectrum