在历经了前几年的热潮后,神经网络研究开始步入实际应用的阶段。对神经网络的研究及将要问世的神经计算机并不能取代现有的计算机,尽管神经网络具有“学习”经验的独到功能,但它们并不能使现有的机器人演化成如电影“星球大战”中出现的C3PO那样的超智能机器人。现有的神经网络的本领绝超不过一般动物大脑的功能范围。然而研究人员和工业界却纷纷看好行将问世的这种新一代计算机,认为这种计算机能完成多种现有的计算机很难执行或根本不可能完成的任务。
这类任务中有相当一部分涉及到模式识别理解,包括辨读手写体的邮政编码数;将话语转化成计算机输入信号;评估借贷款的用途等。目前正在进行的一项试验是将神经网络用于评估即将收成的经济作物,如葡萄、咖啡、豆和洋葱,这些以前是靠经验由视觉判断作出的。
神经网络的作用机制
神经网络不是某种动物神经系统的电子化复制品,脑研究专家对如此一说付之一笑:即人工神经网络完全与脑相关,而非一般意义上的机械装置。实际上,今天正在应用的所有神经网络甚至都没有专用硬件,而只能借用一般计算机的软件(有时甚至是PC机)。Caltech公司的神经生物学家博厄(Jim Bower)认为,那种认为神经网络应模仿人脑的思路是无意义的。
当然,神经网络计算机的研制者们必定要从生物模型中得到某些灵感。人脑功能之所以复杂无比不是得益于其单一开关的速度而在于这些开关连接的方式。单个神经元每秒仅激发几次,这小于PC机中晶体管的速度(约慢几百万倍)_正是由于神经元间复杂的相互连接作用,才使人脑具有识别模型(并由此导致学习过程)的极重要功能。
如同人脑,人工神经网络的构造也力求简洁,每一电子神经元均负有简明的任务,一般情况下,它带有许多输入值,并将这些值相加,在累加运算后得出单一输出值。许多这种电子神经元能在同一时间执行运算,这种平行性类似于人脑的工作方式而不同于常用计算机的串行处理方式。另一与人脑相似之处是,神经网络的功能是由其拓扑结构决定的,在这一结构中,神经元彼此互相连接。这一点也与常用计算机判然有别,常用计算机基本上依赖于一系列编码指令或程序。
神经网络同现今很热门的构成“智能机”的专家系统也大不相同。专家系统包含了某些特定领域专家的知识、经验,这种知识一般以“if-then”形式出现,如医疗诊断专家系统可能就具有这条规则:“如果该患者发高烧、头痛并伴有颈强直症,那么可立即诊断为脑膜炎。”专家系统存在的问题是它完全依赖于规则,而人们不可能永远准确地知道他们何以要做某件事并如何做好这件事,即使人们能够表达这种知识,但要将其转换成可用的计算机代码也殊为不易。
反观神经网络,它不需要提出一组规则。在这方面,神经网络有点像孩童,孩童脑中形成某一规则的过程往往是将所接受的数据与被告知是正确的结果相连系起来。手写字体的辨认提供了一个范例。为了训练神经网络,你应示出数以千计的手写英文字母字体并告诉计算机,哪一种字体对应于哪一个字母。用这种方式训练的神经网络计算机能区别各种手写体的“a”字母,包括尚未反映在训练库中的手写体。美国邮政系统在贝尔实验室的帮助下,开发了一种用于辨别手写体邮政编码的神经网络,大大加快了邮件转运率,当然,这种神经网络机拒绝那种难以辨认的手写体。
在人工智能研究领域,神经网络和专家系统似乎总是处于对立地位。专家系统的支持者们认为,解决问题的关键步骤是搜集和整理知识。例如先进的话音识别系统包含一组语言学规则,这些规则能提供单词搭配的线索,譬如系统识得“very”一词,那它就能将下一词的搜索范围缩小到形容词或副词。而神经网络仅仅根据信息就可解决问题,这种信息是从重复的话语里得到的。从某一方面看,这种方法发展了解题的直觉能力,而不是记忆能力。这种内在的弹性使神经网络能自我调节以适应外部环境。
权重决策
不同于大多数计算机的是,神经网络能从自己的失误中找出原因。计算机科学家已经设计出大量的数学过程或算法,以便神经网络适应之,这些算法不尽相同,但大都遵循以下常用原则:
每一神经元可充任多次输入值,每次都用“权重”因子相乘,这些乘积再相加,得出另一组数值,这些数字可直接转换成答案,即等同于一个给出的单词或书写的文字符号。更复杂的系统能将一组神经元的输出值与大量的其他神经元输出值相连,再通过加权值相互连接起来。
神经网络通过变换连接权重值进行适应和学习,譬如,一台语音识别计算机首先将声音信号分成众多个短暂的时间间隔,每一时段能测量不同频带的相关能量。100~200赫兹可得到0.5这一数值,而在2000~3000赫兹范围内的更强信号则有0.7的值。神经网络用一个加权因子对这些数值各乘一遍,并在此基础上进行总和运算。语音计算机将最终得到的模式与它已经掌握的由其他语音、单词和短语构成的最终模式进行比较。
神经网络一开始随机给出权重值,然后在训练期间调整权重值使之与理想的值适应。计算机先关注误差值,了解需要调整的幅度。假设说出一个单词“yes”,如果系统能得出该单词作为“yes”的概率是80%,其误差率是0.2;如果这种概率为10%,则其误差率是0.9 。
系统不知道何种权重值将导致误差,所以它只能以很小的量沿据估计误差较小的方向对权重值作系统性的增减。如果这种变化减少了误差,则网络就能按同一方向再调节一些权重值,这一过程一直持统到每一次变化产生的误差更小时为止。当误差增大时,权重值可不予考虑。
不同的神经网络以不同方式计算误差,其中一些网络将系统的最终答案与真实答案加以比较,其他一些网络则能一步步自我调节。神经网络在进行数字运算的,先将权重总和与样品模型所得的总和加以比较,这样可得到更精确的权重调谐值,但这需要更强的计算功率。
运行中的神经网络
对神经网络研究的资助绝大部分来自军方,一种灵巧、通用的视觉计算机由于其便于改变程序、有可能导致图像制导武器的问世。神经计算机也有助于核武器条约的核查,通过分析地震学信号,神经网络能给出这种地面的振动是由于地震之故抑或是地下核爆炸的振颤所致。同样,神经网络也能通过分析声呐波,迅速确定是否有敌方的潜水艇。
由国防先进技术研究项目委员会(DAKPA)起草的报告提出一项为期4年,每年耗资1亿美元的神经网络研究计划。但现在看来,DARPA当初的雄心似乎减了不少,在未来2年半里,它只打算花费3.3百万美元,该项目主持人约恩(Barbara Yoon)说,正在审查神经网络研究能否带来巨大的收益。当DARPA正谨慎地考虑下一步的动作时,工业界却毫不迟疑地抓住这一机会,试图利用这一技术一举解决使传统计昇机陷于困境的诸多技术难题。现在在纽约、迈阿密、伦敦等国际机场对行李包裹均采取极为严格的安全检查,除了采用X射线外(可检测出金属类武器),这些机场现在已使用神经网络来检视塑料爆炸物。神经网络监测系统采用中子轰击待检的行李,通过由此释放出的伽马射线来作出判断。要作出正确的判断绝非轻而易举,因为不同的化学元素能发散出不同频率的伽马射线。例如爆炸物一般都富含氮,而氮元素的频率能释放出大量伽马射线,这往往就成了某种指认的依据,然而某些富含蛋白质的物质如羊毛和皮革,也含有大量氮,因此真假难辨,为使这一装置实用化,其爆炸物检测率必须达到95%以上,误报率必须尽可能地小。美国圣约瑟的“科学应用公司”曾用非神经网络方法,即鉴别分析方法来解释数据。这一方法不仅花费时间长(需要数天时间作校准),而且误报率高得多,即使借助离灵敏度的检测装置,仍有4%以上的误报率。其后,该公司尝试用神经网络方法,他们把测试读数输入网络同时将是否存在爆炸物的信息输入,然后就无人去照管它。两天后,计算机已经掌握如何从提供的材料中识别爆炸物。在95%检出率的基础上,它能将误报率降到2%,且每小时能检测600~700件行李(包)。
神经网络也在金融界激起强烈的兴趣。乍一听,您可能生奇:神经网络并不能提供出精确的答案,而精确又是金融交易业务的首要前提。但别忘记,金融业在某种意义上是一种推测游戏,正确的猜测将带来利润。
在首次将神经网络用于商业的尝试中,银行将这一技术用于评估抵押贷款的风险。美国普林维顿斯的Nestor公司报告说,神经网络风险分析仪比人类担保人在评估申请书方面更具相贯性。Nestor系统可分析、评估诸如申请人的收入、资产、供养的人口及信用程度及财产的价值等50~80个数据。为了训练这一系统,Nestor公司将前几年的抵押申请及申请人的情况一起输入系统。一段时间后,当系统处理了:C多的申请书并跟踪了借贷款的结果后,网络将随市场条件而调整,完善自己的模型。在这一点上,神经网络系统基本上与专家系统不同,后者基于一系列静态规则。已经开发出的这方面的神经网络能帮助发现金融数据中的将征曲线,能筛选信息,鉴别趋势;能发现某笔交易(即使是几十美元的小交易)的可疑之处。
神经网络的未来发展
事实上,当今所有的神经网络都是作为普通计算机的软件而存在的,这在神经发展的初期是无可非议的,因为改变一个程序较重布一条线路方便得多,但如果神经网络穷尽了普通计算机的潜能时,就需要设计新的硬件了。为使神经计算机实用化,硬件的变革一定较软件为快。
1989年,神经网络在贝尔实验室、Caltech等实验室已经制成类似于模拟芯片的集成电路块,它们能储存以连续数值形式出现的信息,典型地是作为电容器上的电压差而非由晶体管的通 - 断开关表示的二进制1 s和0 s。由于输入神经网络的经常是模拟数值(或声信号强度),模拟芯片能提供快速的计公司等开发的神经网络集成线路芯片现在已更接近于商业化。
在芯片上将权重编成压差码的神经网络较原先基于普通计算机软件工作的神经网络,其工作效率大大提高。专家们以刼秒的“连接”数来计量这些芯片的速度,一次“连接”被视作是一次乘积运算加加法运算——相当于用权因子相乘和将所有乘积相加成一总和。贝尔实验室研制成的最新芯片每秒的“连接”数达14亿次,这是一般计算机硬件所能达到数字的1万倍。
虽然神经网络芯片的出现令人鼓舞,但专家们期望计算机用户们认识到这种进展的递增性,即虽不断有进展,但很难在短时间取得重大突破,新近由斯坦福大学研制出了一种试验型神经网络程序,它位于计算机模拟的载重牵引卡车驾驶员的座位旁,以帮助支持水载车身平台。借助车轮上的神经网络,卡车与地面呈良好的垂直状态,不管卡车的初始位置如何,而这对于几乎所有驾驶员都是一种挑钟。再如科学应用公司正开发一种消除工业设备中的振动的神经网络,传感器能监测马达的振动,神经网络能从经验中学习识别振动的模式,从而预测马达在毫秒内的行为,并导引系统产生一种反向机械力抵消振动,提高设备的寿命。
语音辨识技术是目前备受关注的方向,现有的语音系统有赖于话筒,它所能做的是训练成具有与某人相似的音色,此外,它仅能识别前后无单词的单一“单词”,不能处理那些一个词以较快的速度进入第二个词时的正常语音。目前在麻省理工学院的林肯实验室、贝尔实验室和卡内基 · 梅隆大学正致力于这一问题,他们研制的神经网络系统将声音的多秒片断分成众多的更小间隔,并将其储存起来,然后神经网络能快速而同步地核查每一个小片断,看它是否与已知的单词或语音相配,它可能几乎是同时提出21个问题。
另一个鼓舞人心的领域是电讯。某些电讯网络将信号分成从不同通路到达同一目的地的小“邮包”,随着识别模式的出现,神经网络能选择每个小邮包经过网络的通道,目的是将通过时间降到最少并使网络不受干扰。
神经网络与其他计算机技术结合能发挥其最大潜力,譬如,机器人可用神经网络改善听觉、视觉、行走甚至建立味觉功能。在专家系统的配合下,神经网络机器人能完成复杂的决策行为。
生物学家认为人脑是对人类认识能力的挑战,因为人类至今只是模拟大脑的功能,这一看法当然是对的。但我们可以回想一下,100多年前,专家们认为人类绝不能像鸟类那样飞起来,这一看法也曾是对的。但在富有大胆想象力的人类看来,人类能弄清楚并实现如何以一种与鸟完全不同的方式实现飞行,今天的神经网络提示了这种可能性。
[Reprinted With Permission from Technology Review,Copyright. (C)1990]