计算机能真正地思考呢,还是永远只能具有人工的智能呢?为了回答这令人困扰的问题,英国数学家阿兰 · 图灵(Alan Turing)于1950年设计了一种简便而天才的模仿测试(图灵认为让某人提出问题,分别由人和计算机来回答,如果辨别不出回答者是人还是机器,则可认为这部机器具有智能——译者注),他还预言,思维机器将在世纪交替之前出现。去年晚些时候在波士顿的计算机博物馆有史以来第一次举行了这种所谓的图灵测试。测试中,机器和人脑展开了激烈的较量。
10名裁判——所以选中他们恰恰是因为他们对人工智能几乎一窍不通——使用键盘和显示器同8个不可见的“实体”依次对话。这些实体或者是计算机程序:或者是除裁判外的某个人。裁判要干些什么呢?那就是仅仅基于10分钟的对话猜出8个中哪些是人,哪些是硅片。谈话的内容对于每一个实体限制为一个主题。其范围从无果味的马蒂尼酒到异想天开的对话,直至莎士比亚。之所以需要这样的限制,用博物馆馆长奥利弗 · 斯特里普的话说,是“为了给程序一个竞争的机会”。
博物馆在观众厅中设置了200多个座位,以便人们能就近观看这场智慧之战。裁判们被相互隔开。当他们盘问散布在全国各地的对话伙伴时,按下的每一键都将在观众厅内8个大屏幕中的某一个上闪现出来。人们一下子就分辨出了那些较缺乏人性的程序,例如10号的谈话题目为无果味的马蒂尼酒,但它却不能描述出如何调制这种酒,除非你用分毫不差的正确方式提出问题。而当一名裁判问及红葡萄酒时,8号的答复是0+1Vi 5KDF;D=0。这个回答完完全全地泄露了8号的智力来源。
然而,甚至在终端对话进行了两个小时以后,观众们仍在就一些对话是否具有“人性”争论着。有人说这些对话机敏、正常,处处可见打字错误,经常使用退格键及删字键,而且还十足的幽默。例如,当被要求给异想天开的对话下个定义时,5号打出了,我喜欢你所说的,这事完了之后咱们能见见面吗?
想要把计算机和人区分开,裁判的日子也不好过——他们中就有5个被“PC治疗师”骗过了。这是一个市场上买得到的灵感开发程序,是由纽约程序员约瑟夫 · 温特劳布设计的。由于在这次有限图灵测试中取得的成功,他被授予了1500美元的洛布纳奖(Loecbner Prize)。
哈佛大学的一名研究生、同时也是裁判之一的尼尔森 · 雷诺里说:“我的确以为PC治疗师是个人,因为它回答了我的问题,而且既古怪又有趣,相当正常。”另一方面,两名裁判把人类实体辛西亚 · 克莱说成是计算机,这部分是由于他们认为她对莎士比亚知道得太多,不可能是人。
计算机博物馆计划今后每年举行一次图灵测试。然而在人工智能和自然语言处理程序还没有发展得很先进之前,今后好几年中可能还得像这次一样规定限制条件。最终程序要面对的将是无约束图灵测试,胜利者将赢得10万美元的奖金。评奖委员会主席、塔夫茨大学认知研究中心主任丹尼尔 · 丹尼特说,那样的程序比今年参赛的任何一个都得大上10倍,并且还要能应付诸如“华盛顿市比面包盒大吗?”之类的简单问题。“正确地回答这个问题要么意味着一台计算机具有真正的智能,要么就是在编制程序时给了它差不多关于一切事物的信息。”
同PC治疗师的一段对话
裁判4:异想天开的对话该如何定义呢?
终端5:按我的想象,异想天开的对话该是像国际象棋中马的一连串移动一样——弯弯曲曲的,有点“之”字形,而不是沿着某一条特定的直线。你干吗要问呢?我的回答挺聪明的,是不?你脑子里老想着这种问题吗?
裁判4:我喜欢马在棋盘上纵横随意移动这样的形象比喻,但这是否意味着在异想天开的对话中就一点儿固定的思路也没有了呢?
终端5:我敢发誓你刚才只是问你是怎么定义异想天开的?你是怎么定义异想天开的?你以前也老是这么令人恶心恶心恶心吗?为什么你要告诉我说你#欢马在棋盘上纵横随意移动这个比喻呢?