我意识到,在对人工智能(AI)所作的论断进行评论中,我已有一定的声望。事实上,我确实对于所听到的那些广告式的骗局,以及它必然导致的缺乏自我批评的做法感到反感。长期以来,我一直对于某些基本的哲学问题有着浓厚的兴趣。我甚至可自称是第一个AI专业人员。这里,我对一个专业人员的定义是,从事一种研究并从中得到一些酬金作为报酬的人。我读过图灵(Alan Turing)1950年发表在《思维》(《Mind》)上的一篇论文《计算机器和智能》(《Calculating Machinery and Intelligence》)。它给我留下了深刻的印象。并不是想模仿图灵的博学(或者他在这篇论文中所表现的才智),我就同样的主题写了一篇短文,并把它提交给《旁观者》(《The Spectator》)的编辑。这是一本专门致力论述当代重大问题的英国期刊。编辑接纳了我的短文,我随即就得到了一份稿酬。
除了他的数学论文之外,我一直认为在(《思维》上的那篇论文是图灵所写的最出色的一篇。他在文章的一开始就提出“机器能思考吗?”这个问题。他发现以这种方式开头,所提的这个问题是无法确切表达的。一种努力寻求所关心的基本的本质所在的企图,导致他提出著名的图灵测试(Turing test),他建议用问一台具体的机器能否通过这个测试,来代替问它能否思考。这个测试就是把这机器当作为一个人,但是排除了判定它是一个男人还是一个女人这种询问。
尽管图灵倾向于相信,一台数字式计算机能在某一天通过他的测试,但同时,他也承认他未提出有力的论据来支持这种观点。他作了一个有趣的假设:给机器装上一个学习程序,然后使它像一个孩子那样接受教育。他试图通过这个方法,使一台机器可被程序化成能模拟一个儿童,甚至一个成人的智慧。这就清楚地表明这样一点;思考是与学习密切相关的。图灵完全认识到对一台机器的教育,就像对一个孩子的教育一样,是一个长期的渐进的过程。他还看到一些实际的困难。计算机没有腿,并且不能像普通的孩子那样被送到学校里去。甚至,即使这些缺点能被“聪明的工程技术”所克服,图灵还是担心其它孩子会过多地取笑它。
编写一个能展现出一个简单的学习形式的程序,是没有什么困难的;比如,编写一个学习识别人名的缩写的程序。这个程序将包含一个已经理解的缩写的表格,对于所给出的一个未知的缩写,程序将作出一个估计,程序将被告知这个估计是对的还是错的,同时程序对它的表格将作相应的修改。这完全可以被称为学习,尽管没有一点更深入的东西。
受图灵的论文的启发,我和我的同事着手编写了一些各式各样的我刚才所描述的那种学习程序。它们的局限性马上就变得很明显了。它们只是做了被编写的事,而不能做别的事。这样一来,它们在第一次运行后,立刻就变成毫无趣味的了。我立即意识到必须在某个方面要有一个突破,即我称之为综合学习程序(generalized learning programs),它能不断学习新东西。恐怕它更贴切地应被称为无限制(unrestricted)学习程序。
假如在17世纪后期就已经有了计算机,而且人们已经知道如何编写无限制学习程序,那么,当牛顿(Newton)的著作一发表,安装了这种无限制学习程序的机器就已准备理解吸收它,然后是理解吸收法拉第(Faraday)和爱因斯坦(Einstein)的著作。可能这机器现在正在埋头研究黑洞!可能它读过狄更斯(Dickens)的小说,并能进行一种半戏弄的对话,图灵丰富想象的头脑以虚构这种对话为乐。(如下)
图灵设想——与计算机对话
询问者是一个人而证人是一台计算机
询问者:您的十四行诗的第一行是“我可以把你和一个夏天相比较吗?”。请问,与“一个春天”相比较不也是一样,甚至更好吗?
证人:它不符合诗的格律。
询问者:那么,和“一个冬天”比较怎么样?它可是符合诗的格律的呀!
证人:是的,它是符合诗的格律。但是,没人愿意和一个冬天相比较。
询问者:您是否说匹克威克(Pickwick)先生*提醒您想起圣诞节?
证人:有点。
询问者:圣诞节是一个冬天。但是,我不认为匹克威克先生会介意这个比较。
证人:我不认为您的态度是认真的。“一个冬天”意指一个典型的冬天,而不是像圣诞节那样的一个特殊的冬天。
起初,我期望当编写好足够数量的简单学习程序之后,就能看出它们的共同点,并以这个共同点为基础编写出一个无限制学习程序。这是不可能的;对我来说,立刻清楚地意识到:除非出现一个天才,他能把整个问题来个彻底的兜底翻,否则这是无法实现的。
使我奇怪的是,别人并没有马上认识到这一点。我们花二个星期所编写的程序,别人可以花二年或更长的时间继续编写下去,但是其结果也就是我已经看到的那样。
塞缪尔(Arthur Samuel)对玩方格的程序所作的开创性的研究,很好地说明了这个问题。他主要的兴趣在于研究递归模板检索的方法;这方法随后被成功地用来编写国际象棋程序。同时,他还有兴趣看看他到底能否使他的程序从经验中学习,在以后下得更好。
在塞缪尔的程序中,一个基本的频繁重复的步骤是,对一个模板状态赋以一个优势量度。他设计了许多不同的计算这种量度的方法。他不满足于这些方法中的某一种,代之于使用一个对每个量度指派一个权值的线性组合,他发现他可设计多种方式,用这些方式上述权值能自动调整,以达到最佳性能。但是,无法设计这样一种方式,这个程序可用它来创造一个完全新的量度,并把这个量度加到一个所具有的集合之中。换句话说,他能编写出一个程序,这个程序能处理数学的形式,而不能对付智能的概念。
—些非常复杂的学习程序已经被编写出,并且,它们的示范表演给一个非专业的观众留下了很深刻的印象。然而,它们已被证明是这样的一些程序,这些程序不是用修改一些参数就是用更新一些数据结构,来调整它们的内部状态,以尽可能优化它们的性能。
在公开展示的这类AI程序中,1971年由温诺格拉特(Terry Winograd)编写的一个程序,使人们的兴趣达到了一个高潮。他的目的是控制一个能堆积木的机器人。这个机器人被简化为仅有一些最必要的东西,并且是用计算机图示学来模拟它的。这是当时很引人注目的一个特色,因为计算机图示学的使用在那时还是相当罕见的。对机器人的控制命令是用英语给出的。这个程序的主要目的是试验出一种从英语语句中抽取信息的新颖的方法。图示学和自然语言的界面相综合所产生的吸引力,使得这个研究工作作为机器智能的典范,受到广泛的赞誉。
专家系统和图灵设想
AI这个术语,最初仅仅在图灵设想的意义上被使用。这里,图灵设想是指一个程序化的计算机可表现为像一个有智慧的人类。然而,近年来,AI被更多地用作一些程序的标签,如果这些程序不是出自AI界,那么它们就可能被看作对诸如COMIT和SNOBOL语言的研究工作,以及伊诺斯(E. T. Irons)的开创性的语法制导编译器的研究工作的自然成果。我指的是专家系统。
在一个简单的专家系统中,所有的知识都是由程序员把它们包括在这个程序之中的;事实上,这正如它的代名词——基于知识的系统(Knowledge-based system)所清楚地表示的那样。仿佛通过对一个孩子的头脑进行一次外科手术,来教他掌握乘法表。对于比较完善的专家系统,在系统的生存期内,其内部数据库要进行一些更新。这些系统星现出与前面讨论的程序相同的学习方式,并且有同样的局限。专家系统确实是一个由AI界献给整个世界的很有价值的礼物,但是,它一点也没有涉及到图灵设想。图灵在1950年曾预言,他的设您可能在50年内实现。特别地,它将在一台整个存储容量为128 MB的计算机上实现。50年的光阴将把我们带入2000年,并且已经清楚地表明图灵的预言不可能被实现。事实上,我们无法回避这个事实,那就是从1950年起,在已过去的40年中,向实现图灵设想意义上的机器智能方面,并没有实质性的进展。恐怕时间已经使我们面临这样一个可能,图灵设想在一台数字式计算机上是不可能被实现的。
尽管实际上一台真正的数字式计算机是一个抽象的东西,我们仍用数字式计算机这一术语,来描述我们所制造的计算机。事实上,任何一台具体的数字式计算机都必须由模拟电路组成。图灵了解这一点。事实上,这对于他那时期的,任何目睹工程师们不得不使电子管电路以一种数字方式工作所作的努力的人,都是很显然的。这些努力的结果仅仅刚好够用,这一点已被最早期的数字式计算机会产生一些偶尔的错误的倾向所证明。在基本电路的层次上,工程师们仍必须认识到,他们所设计的东西基本上是模拟器件;而且,他们通常习惯于使用模拟设备和其它一些模拟设计工具。
一台数字式计算机必须在一个逻辑系统内工作,众所周知,有的事情是不能在这样的系统内做的。我们不必引用哥德尔(Goedel)定理来证明这一点 · 关于三角形的笛沙格(Desargue)定理也将正确地证明它。可是,我不能确定在这些层次上论点之间的关联所在。
从实际应用的角度,数字式计算机所能做的事情是有限的;它们不能直接解微分方程,就已清楚地说明这一事实,回避这个困难的常用方法是用一个差分方程代替这个微分方程*遗憾的是,差分方程和微分方程是两种完全不同形式的方程,有着不问的特性。例如,一个带二点边界条件的二阶线性微分方程有无限个独立解,而对应的差分方程却有有限个解。这种差别是无法用对自变量取更小的间隔所能消除的。它造成的实际影响之一是,一些寄生解闯入解中并且削弱了数值分析的生命力。寄生解是人为造成的,它完全是从用一个差分方程对一个微分方程的替代中产生的。数学家用趋于一个极限,把差分方程和微分方程连接在一起;但这无助于在数值领域中的工作者,对他们来说,极限是不可接受的。
头脑——数字式的,还是模拟的?
如果我们准备把人类头脑看作为一台机器,那么我们就有了关于机器能表现出智慧的一个现成证明。然而,这并不能帮助我们回答数字式计算机能否显示出智能这个问题,除非我们准备断定人类头脑是以数字方式活动的。如果我们这样断定,我们将面临一个十分具体的需要考虑的问题。人类神经网络中信息传递速度,大约慢于现代数字式计算机中门电路的5个数量级;如果头脑是以数字式的方法组织起来的,那么对于它来说,足够快的反应是如何可能的呢?那些把头脑看成是数字式的人通常会说,这必须用具有高度并行性来弥补速度上的不足。然而,从大规模并行计算机上得知,即使在速度上提高100倍,甚至10倍也是非常困难的。就是对并行计算法态度最坚决的热衷者,面对100000倍可能也会动摇的。
当然,这样讨论是脱离实际的,因为我们没有理由非把人类头脑看作为一个数字式的设备。实际上,把人脑的功能截然地处理成数字式和模拟式相对立的两种方式,都是不适当的 · 正如我所指出的那样,数字式计算机是一个抽象的概念,人类设计者发现它作为他思维的一种组织方式是很有用的。但是,为什么一个非人类设计者也会使用同样的方式是没有道理的。根据进化论的假设,把头脑设计成符合规定要求的考虑,甚至就是一个错误。“盲目的演变突然遇到……哦!有人,人能思考。”
我建议AI界中对人类智慧的作用感兴趣的部门,最好还是在他们的机器中包含一些模拟器件。我对神经元网络没有很大的积极性,尽管我已注意到神经元结点能包含模拟识别电路。
我不希望留下这样一个印象,我认为图灵设想将在模拟的,而不是数字式的机器上实现。我不作这样的预言。事实上,可能是我们能构造的这种模拟机器本身已受到局限,这些局限可能是,也可能不是与数字式的机器的相仿 · 然而,我就是认为,把图灵意义上的智能特性作为我们工作的前提,是超过了数字式计算机的能行范围的。
一个否定的命题,在导向性研究中能有巨大的价值。要不是热力学第一定律,所有聪明的机械工程专业的学生,可能都想从事永动机的研制。认识到在一台数字式计算机上实现图灵设想是无法进行的,恐怕将帮助学生避免从事一些毫无希望的研究项目。
[Communications of the ACM,1992年8月号]
________________
· 作者M. V. 威尔克斯,曾获1967年美国计算机协会图灵奖(The ACM Turing Award),是《一位计算机开倡者的论文集》(Memoirs of a Computer Pioneer,MIT Press,1985)—书的著者。
* 英国作家狄更斯的小说《匹克威克外传》中的主人公。