机器能思维吗?这个问题几十年来吸引了许多发明家、哲学家和逻辑学家。1938年,英国数学家阿兰 · 图灵(Alan Turing)证明了现在称之为图灵机的很简单的计算模型能够进行很广泛的计算;它能模拟任何其它图灵机的计算。这种模型是存贮程序计算机的基础。看来,存贮程序计算机最终能模拟人的动作。因为根据每个神经元的状态及神经元的刺激机制,有可能计算出某人每个神经元的下一状态,因而可以预测这人的下一个动作。当然实际上,不可能获得充分够的信息来做出精确的测试。但是,从理论王讲看来有可能为机器编制程序使之像人那样动作。

1950年,图灵提出一个方法以决定一台机器的动作与人的相近度。他的方法目前被称为图灵测试法。该方法假设有一个作为提问员的人,通过电传与两个实体通讯,其中一个是人,另一个是计算机。提问员要花费多长时间才能决定出哪个是人,哪个是计算机?'这个决定会有多么可靠?图灵断言,在50年内,计算机有可能相当出色地表演这个游戏以至于70%的提问费在提出五分钟的问题之后,仍不能做出正确的识别。这条思路构成了目前评价专家系统能力的方法。一个人类专家区别出一个程序的动作与他的一个同行的动作所需的时间越长;该程序就被认为能力越强。这条思路还导致某些人工智能(AI)程序员容忍程序中出现的错误,只要错误率不高于人类专家。

图灵成功地把“机器能思维吗?”这个问题转换为“一个数字计算机程序能在多大程度上模仿人?”原来的问题所用的术语概念太广,会导致无穷无尽的哲学探家,如什么是机器?什么是思维?图灵提出了一个相关的但不等价的问题,这个问题可以通过实验科学地解决。一个回答原来问题的实验与一个决定“是否我有思维”这样的实验,其意义是一样的。

这个新的问题好到什么程度呢?计算机程序最终确实会模仿人的动作吗?这个问题不能单纯用辩论或实验去解决,只有逻辑学和科学为这个问题的解决照亮了光明之路,认识到这一点是很重要的。

人工智能研究在处理这个似乎更易回答的问题上,积攒了多年的经验。1967年麻省理工学院的马尔文 · 明斯基(Marvin Minsky)曾经推测,一个用100万个日常生活事实合适地组织起来的计算机会表现出很高的智能。今天的计算机已能存贮几倍于这个信息量的信息,然而却没人能设计成功一个智能程序。大约在1970年,象棋大师大卫 · 列维(David Levy)预言下棋程序会达到大师级水平。他悬赏给能在10年内编出击败他本人的下棋程序的人。但是直到今天,没人能够设计出这样一个程序能在10盘比赛中赢列维一、两盘以上。1980年左右,日本人扬言他们将会设计出许多计算机程序,这些程序会在选定的领域内处理专家级水平的技能。他们会成功吗?

智能对于模拟者说来,一直是一个动态的目标。大多数人把复杂机制与创造它的思维过程区别开来(专利法就是如此)。自动飞行员是专家级的飞行器;但它们不是飞行员。能够提前看出四步的下棋程序可能会是很难对付的象棋运动员,但它们不是象棋大师。1966年,麻省理工学院的约瑟夫。韦森鲍姆(Joseph Weizenbaum)编制了一个称为爱莉莎(Eliza)的程序,其中一个模型可以模拟心理学家的对话。爱莉莎在输入正文中预先定义的关键字上进行简单的变换;若输入“我现在觉得X”,它会打印“为什么你现在觉得X?”通过爱莉莎程序,韦森鲍姆表明有可能不用给程序任何真正的理解,就可以做出智能的有说服力的演示。只要人们找到一个方法使人类某些活动机械化,人们就不认为那些活动具有智能;确实,人们经常希望机器来完成那些令人乏味的工作。

人工智能研究人员的数量日增,但研究领域的基本问题却如此的含糊不清,实在令人不安。答案的混淆不清表现出怀疑论倾向。大卫 · 巴纳斯(David Parnas)和约翰 · 索尔(John Shore)已经批评了专家系统程序设计中的试错法;胡伯特 · 德雷福斯和斯塔特 · 德雷福斯(Hubert and Stuart Dreyfus)已经断言,二十五年居人王智能研究就会放弃自己的诺言;而且也没有证据表明人工智能会兑现自己的诺言;道格拉斯 · 霍夫斯塔特说许多人工智能问题的提法是浅薄的。人工智能研究人员问道;为什么从机器得出智能行为是如此困难呢?它是乏味的工程吗?其目标太大了吗?或者是否有什么基本东西使目标超出了我们的研究?正在持续的争论对于机器在人类社会中的作用产生了新的看法。

近来出版的三本书对这些老问题作出了新的回答。头一本书名是《人脑比机器强》,作者就是胡伯特 · 德雷福斯与斯塔特 · 德雷福斯,该书分析了机器获得人的技能的能力。第二本书名是《理解计算机与认知》。作者是特里 · 威诺格拉德和费尔南多 · 弗洛斯(Terry Winograd and Fernando Flores),该书分析了人与机器之间的可能的关系,提出了计算机设计的新的基础。第三本书名为《大脑、行为与机器人》,作者为詹姆斯 · 阿尔卜斯(James Albus),该书分析了智能行为的特点和模拟它们所需的计算结构。你们将会看到这几本书是交相辉映的。

德雷福斯兄弟表明人类所拥有的智能,不是机器能与之匹敌的。为了证明他们的论断,他们分析了智能的一个重要状况——人类的技能,他们由此区分了五个层次:初学者、有经验的初学者、有能力的执行者、熟练执行者和专家。初学者知道某个主题的基本事实以及使用这些事实的规则,不考虑规则的来龙去脉。有经验的初学者能够基于例子把动作构成规则,并且考虑规则的来龙去脉。有能力的执行者对该主题具有丰富经验;他的行为具有强烈的目标性,他通晓规则不需要多加思索就可以行动,还能对情况进行分析推理。熟练执行者能够回忆起全部情况,不必把它们分解为部分就可以应用到当前情况。专家则全面掌握情况,对技能则知道得很少,也不是有意识地使用分析推理;当运用技能时,专家在观察到的大范围内进行工作,并且对全部客体和情况进行处理。

我这里有一个很恰当的例子来说明这些观点,这个例子就是写作。初学者要依靠详细论述语法、标点符号和拼写规则的手册。他要达到书写正确的句子与段落是一个需要不时地查看规则手册的乏味的过程。有经验的初学者则知道相当多的重要的规则,并且能从一些好的示范例子中学到其它规则。有能力的写作者则在思考写作的细节的同时;更多地思考交流的动作,他已经学会了文体的规律,并且自觉地使用它们,他还善于构思和使用提纲。熟练的写作者在写作上已经运用自如;他几乎不会在语法或文体上出现差错;他能分析并且删改他自己的作品;他能模仿其它人的文体,他很善于使用讲演方式和其它修辞方式;他能计划并且写作长篇大论。一个作家则生活在一个他有着强烈的愿望去交流思想的世界里;他不断地想出叙述新事物的手法,并且用新手法叙述旧事物;他能与读者交流感情;他能模仿许多文体,但是他又有着自己独特的风格。以致编辑哪怕只变动了他著作中的一个词,他也能立即觉察到。作家能够在头脑中构思大部著作,在全局与细节的穿插中如鱼得水。

在以上这个分类中,规则与符号的熟练使用,是最低的技能水平的特点;高度抽象模式的回忆,则是最高的技能水平的特点。初学者能够毫不含糊地写下最低层水平的规则,并且直接使用这些规则;而最高水平的技能则需通过许多次重复才能学得会。德雷福斯兄弟把最高层水平的能力称为“知道怎么干”(know-how),这与熟练地使用符号与规则的能力是不同的。德雷福斯兄弟认为,存贮程序计算机擅长于熟练使用规则与符号,但不能快速计算全部模式,这种计算机不会明显超越低微能力的阶段。根据德雷福斯们的论断,“知道怎么干”包含有完全不同的计算形式。现有的具有某种“知道怎么干”性质的设备是全息图,全息图中全局图像被编码为每个局部区域,可以利用光穿过两个全息图以决定它们的相似性。实际上,对这种模式计算机的体系结构与功能尚不清楚,至于这些计算机是否会具有像人那样的能力,把其它图像给予抽象以形成新的图像,更是一无所知。

德雷福斯兄弟最后指出存贮程序计算机,当使用规则来处理事实时,不能完成高级技能。这种计算机的内部结构不能用与人类专家一样的方式来处理信息。德雷福斯兄弟警告说;把研究程序基于这样的信仰之上,即认为处理事实的计算机是聪明的,具有潜在的危险。这除了浪费大量投资外,人们在任何情况下总是企图去利用专家系统。具有很小能力的程序会被安排在非需要完全的专家技能不可的场合。德雷福斯兄弟还说,用于教学与训练的专家系统会把学生们的进步限制在使用规则与符号上面,而专家技能则远远超出了这个范围;进入到“知道怎么干”的阶段。

与德雷福斯兄弟相同,威诺格拉德和弗洛斯也对目前的人工智能研究不能兑现它的诺言感到困惑。通过分析目前研究得以进行的框架、所提出问题的实质、以及解决这些问题的方法,他们希望开拓新的视野。

根据他们的观点,与计算密切有关的基本问题是设计的问题:在人类实践的环境中计算机到底服务于什么目的?设计不仅仅涉及计算机如何运算的问题,还涉及到它们怎样影响人的问题。例如,一个字处理器对于不同的观察者来说,它是不同的:对厂家而言,它看上去像一台电子设备;而对于程序设计人员来说,它又像一个软件包;对作家而言,它则是进行有效交流的工具:对这三者来说;当字处理器坏了时,这是最明显的。

威诺格拉德与弗洛斯发现我们的设计方法要强烈地受到我们的传统的影响。这些传统包括:全部经验的环境与观察世界的方式,没有直接表达出来的假设的集合。传统被无缘无故地隐藏起来。西方的科学传统——科学方法——认为知识是客观的,它衡量出能够被系统地用来预言各部分客观现实的明确的理论的价值。威诺格拉德与弗洛斯称之为理性的传统。而计算机的传统则是由理性传统导出的,它衡量信息,表示和决策的价值;它还强调了与大脑和智能的类比,以及其它拟人方法。

曾经为西方科学家所高度推崇的理性问题求解过程由三部分组成:根据客体及其间的关系给出情况的精确论述;枚举出可供选择的解法;计算每种可供选择的解法,直到找出一个费用最低的解法。存贮程序计算机理想地符合这个过程:客体、关系与规则可以明确地表示为程序设计语言;诸如演绎与搜索的方法可以用于枚举可能的解法;计算与比较可用来选择一个低费用的解法。当前许多人工智能研究都有一基本方针,那把曾能与使用启发式过程的理性问题求解等同起来。如果这些就是人类认知的唯一基础,威诺格拉德与弗洛斯问道,那么为什么类人的性质属于计算机,却不属于能提供信息与处理信息的其它设备呢?

威诺格拉德和弗洛斯已提出了许多证据表明,认知不仅基于对表示的系统化使用上。德雷福斯关于技能水平与“知道怎么干”的论断表明了这一点。理性问题求解至多不过是人类求解问题的部分描述:人被置入环境之中,又同时对环境有反作用。世界连续不断地被其内的有机体解释。给定的有机体的结构在决定有机体所能进行的解释时起着主要的作用,类似的有机体引申出可以使它们之间的交流够用的解释。这里恰表现出存贮程序计算机与个人之间的严格差别:计算机处理符号时;不考虑符号的意义;而一个人处理每一件事情时都是在解释的框架内进行的。存贮程序计算机进行计算的结构与人是完全不同的。

威诺格拉德与弗洛斯提出了新的方针:我们不要想着怎样使计算机更像人那样动作,而过该更多地考虑怎样使计算机更有效地帮人做事。计算机所擅长的事是执行算法、查询信息、处理并过滤信号、辅助通讯、监控工艺过程。把计算机用于这些方面可以对社会做出有益的影响。强调创造性地使用机器来帮助人的设计过程是会成功的。

威诺格拉德与弗洛斯的书给人们留下这样一个印象,研究能思维与理解的机器是不会有收获的。德雷福斯兄弟则不这样肯定:虽然他们觉得存贮程序计算机不能获得与人类似的性质,但它们并没有排除其它结构的计算机能够获得这种性质的可能性。

阿尔卜斯对于机器能够进行类火的行为则显得更为信心十足。他对于能模仿人的神经系统的机器结构极其感兴趣。(这使人想起了威诺格拉德与弗洛斯的论点:结构决定功能。)就能够在智能领域与人匹敌的机器而言,图灵于1950年讨论了两种构造方法。头一种是进行非常抽象的活动,如逻辑推理与下棋。第二种是给机器提供复杂的感觉器官及存贮用来表示经验的代码的机制,通过重复地显示感觉模式,机器就能渐渐地认出熟悉的模式并完成有关的动作。阿尔卜斯说相当多的人工智能研究都依循前者的途径,这也许是因为早期的人工智能研究人员都是精于抽象推理的数学家的缘故。事实上,在人工智能研究上所做出的全部贡献都致力于给会思维的人脑的抽象推理能力作一个模型。

阿尔卜斯提出依循图灵第二方法的方式。他不是从生物功能的最高层出发,而是从最低层出发,重新生成昆虫、鸟类、哺乳动物和灵长类的控制功能和行为模式。他又使用这些作为人类更高层功能的积木块,最终理解人脑中具有智能与抽象思维的机制。作为这个方向上迈出的一步,他分析了人类的神经系统的组成部分,并且描述了一台“小脑模型算术计算机”,其体系结构能够重新生成许多神经系统的行为,他还为此申请了专利。他的书的许多内容都用来表明怎样教会这台计算机,以及这台计算机在学习后怎样完成各种神经系统的功能并对复杂的刺激作出反应。他甚至还说明了怎样教会这台计算机像存贮程序计算机那样动作。

我发现这几本书的作者的论断都是新鲜而又动人的。他们没有循着目前人工智能研究的老路走下去,而是另辟蹊径。他们的某些研究成果将导致能够更像人类专家那样处理信息的新的计算机,另一些成果则会导致更为系统化的设计问题。但是我仍怀疑关于计算机是否能够模拟思维的争论会就此停止住。也许存贮程序计算机确实不能思维,但也可能会有别种计算机……

[American Scientist,1986年第4期J