日本科学家造出电脑人脸

发布时间：94年11月28日

Andrew Pollack 编译龚静

数字化造脸术使电脑有了新用途。

凡是来到日本索尼电脑科学实验室Ankikazu Takeuchi博士办公室的客人，都会感到自己好像被人监视了。原来，Takeuchi博士的电脑屏幕上正呈现一幅人脸，它试图用眼睛与客人保持接触，当客人在房内走动时，它还会左右跟踪呢！

这个人脸是由电脑图像创造出来的，并由软件加以控制，在日本、美国和欧洲，创造人造脸以使人类与机器的交往更简易是科学家正在努力的诸多事情之一。

有些电脑科学家认为，不久，人类将与在电脑屏幕上的人脸交谈。电脑与人类能够通过面部表情，诸如微笑或皱眉、点头、扬眉或凝视达到相互之间的理解。

同时，运用客观的逻辑，电脑还可以通过它的脸来表达感情。

“面部表情的传达是一种更高级的通讯方式。”Takeuchi博士认为，“我们所追求的不是智力，而是人性。”

Takeuchi博士和他的同事已经研制了一个初级系统，人们可以通过与一个在电脑屏幕上的脸交谈，获得某些索尼产品的信息。如果电脑的声音识别系统不能理解人们对它说的话，电脑人脸将会告诉你，并且露出迷惑不解的表情。如果人们提的问题超出了电脑储存的知识范围，屏幕上的电脑人脸将会露出一脸的无可奉告状。

将一个和善的人脸呈现在电脑上仅仅是工作的一个方面；其他的研究人员正试图用电脑来识别人脸以及面部表情。日本电报电话公司是日本最大的电话公司，这里的工作人员正在从事“人像读者”项目的研究，这是一个电脑系统，它将识别人的面部表情，懂得手势，甚至阅读时的口型。

的确，“面部信息科学”就其本身而言正在日益成熟，它不仅吸引了电脑科学家和动画专家，而且还引起了心理学家的兴趣，因为他们需要掌握这些知识，以了解人们是如何通过面部表情达意，以及如何解释这些现象的。

去年11月，美国国家科学基金会赞助了费城宾夕法尼亚大学第一工作室的项目，那里的人们正在从事电脑面部动画的研究，日本东京大学的Hiroshi Harashima教授已经主持召开了三届主题为“面部”的年会，将工程师、心理学家、电视游戏制造者，甚至艺术家都召集在一起了。

将面部作为人脑与电脑的接口是所谓“代理”的发展方向，亦即将电脑程序设计成个人的助手。现已具备的“代理”仅具有最简单的功能，将来人们设想它能够自己进行工作，诸如从数据库中取出数据，将重要的信息和安排的约会通过个人电子信箱进行挑选等，这种类人助手是逼真的，每张脸都可根据个人的爱好而选择*可能是使用者所钟爱的男女演员或者自己的配偶。

当然，电脑所产生的脸可能具有许多其它的用途，例如在教育和娱乐中等。“我们喜欢创作出历史人物，让儿童们与他们进行讨论”，宾西法尼亚大学人类模拟和仿真中心主任巴德勒（Norman Badler）说，“你能想象与富兰克林或华盛顿对话的情景吗？”

电脑所创造的人物也能用于电影，使它有可能成为一名已经死去的新的电影明星。

人脸动画也可提供更多花费不多的可视电话工具。将人的电视图像通过电话发送，现在所需要的或者是特殊高容量的电话线路，或者是经过数学计算来压缩图像。

但是，将打电话者的人脸图像传至电话线路那一端仅为一次，在那里人脸将在一台电脑屏幕上显示出来。然后，代之以今天每秒钟发送30次的一幅电视画面，人们所要传输的仅是告诉电脑化的人脸如何移呀的指令而已，对于在另一端的人来说，看到的如同电视图像一样。

已经使用的是某种程序，它包括电脑操纵人脸的静态图像。这比试图创造一个人工脸更简单些，它会自然地移动，并且充分表达出人类的表情。

创造电脑人脸

图像处理可用以帮助发现若干年前失踪的儿童。失踪前儿童的照片被送入电脑，然后电脑模拟出这个人现在该是如何的模样。

Matsushita电气工业公司是日本最大的消费电子公司，它已开发了一台“爱情仿真”的机器，这台机器会预告人们，一对夫妻将要出生的孩子会是怎样的模样。它产生的“人脸”是根据“父母”人脸的数学平均值，加以缩小而成的。（当然，在现实生活中，事情并非总是那样简单）。

为了产生人工合成脸，研究人员开始在电脑上制作一个线框模型，它通过软件可以变化和旋转。其次，将一个真人脸的电视图像输入电脑，同时对该模型再加以改变以与人脸的形状相匹配。然后，该人脸的电视图像被包进一张类似墙纸的线框中，其结果是线框模型戴上了人的画皮。

复杂事情正在移向这个脸。大多数电脑科学家正是基于现在旧金山加利福尼亚大学医学院工作的心理学家埃克曼（Paul Ekman）和福利森（Wallace Friesen）于70年代所提出的面部行为编码系统进行工作的。他俩定义了44种基本的人类面部运动作为行为部件，诸如提高眉毛内侧，提高眉毛外侧，降低领头等等。不同的行为组合可以产生不同的人类表情。

提高眉毛或降低颌头看上去会自然些，有些电脑模型试图模拟人类面部肌肉的行为。索尼公司的Takeuchi博士使用一种由剑桥数字设备公司研究中心面部动画家KEITH WATERS所制作的模型。它可以模拟16块肌肉，每块肌肉可以分别加以控制。

人造脸不必受到屏幕的限制。东京科学大学的Fumio Hara教授已经研制了一个机械脸，它能表达诸如愤怒、厌恶和失望和表情，这向类人机器人的方向迈出了一步。这个“人脸机器人”是由金属铝制成一副牙齿，硅橡胶制成皮肤。它的“肌肉”含有18个小传动机构，由一台个人电脑所控制的空压机进行工作。

超出了工程领域

这个人造脸能展示大多数人可以感受到的愤怒、快乐、悲哀或者惧怕。没有人会误解这个电脑人脸。当然，更微妙的表情，电脑模型仍然还望尘莫及。

“我们从Audrey Hepburn的脸开始进行实验，”Takeuchi博士说，“她的微笑是如此美丽、微妙和复杂，它已超出了工程的领域，我们不能得到它。”

制造头发也相当困难，嘴唇运动亦如此。人的嘴唇动起来非常快，通过精巧的控制，有些事对电脑程序的复制来说非常困难。例如，Takeuchi博士所研制的这个会说话的头仅仅会装成元音声音的形状，而不会辅音的形状。观看电脑人脸的讲话，犹如在观看一部外国电影一样。

数字设备公司的Waters博士已经研制成了一种称为“dec脸”的更先进的模型，其口中词是由“DEC话”所提供，这是一个将文字转变成说话的程序。对于每一个语素或基本声音，“DEC脸”具有不同的口型。

利用这一系统，任何存储在电脑中的文字能由一个会讲话的人头所大声朗读。但是，嘴唇动作仍然没有逼真到专业阅读者的水平，虽然声音已经结束，但“DEC脸”或许还在说话呢。

合成人脸还不够。对于真实而自然的谈话，电脑还必须识别人的面部表情和手势。但是，这比制造电脑人脸更困难。

一种识别类型包括试图通过他或她的脸来确定一个人。它允许这张脸用作标识符卡，比如，由它控制每一个进入大楼的人。警察可以将一张被怀疑者的照片输入到人脸数据库以确证该怀疑者是否能被证实。

为了做到这一点，电脑在获得了一个或更多个电视人像后，便开始测量其眼睛、嘴巴和不同脸型之间的距离。然后，电脑将这些测量的数字与存储在数据库中的脸型进行比较。

尽管连5儿也能从各个角度识别脸型，但是，电脑却极易被头部位置的改变所蒙骗，例如灯光和脸上的阴影。有时，眉毛会被误认为眼睛。研究人员现已达到了相当高的识别速度，但是还仅在小数据库中。并且识别还不是即时进行的。“现在还没有人在识别人脸上是成功的。”Yasuhito Suenaga这样说，他领导着N. T. T. 中的人像读者项目。

另一种识别类型是人的面部表情，这将使电脑成为一个很好的谈话对象。它要求勾画出眉毛、鼻子、嘴巴、眼睛和面颊的方向。

N. T. T. 的一个研究人员Kenji Mase，利用一种被称为“光流”的技术，让电脑分析打在人脸上的光亮变化，以发现面部的运动。电脑能够识别夸张的面部表情，并且通过识别一个人的嘴数一到九的数字，能达到70%的识别成功率。

还必须决定的是人们对人造脸的反应如何。一组秘密数据已被波士顿大学心理学家通过“DEC脸”的实验后发现了。

众所周知，当人们在回答电脑所提出的某些诸如他们“是否曾经欺骗过人”之类的问题时，会比回答人所提出的类似问题显得更为诚实。和一个会讲话的电脑人脸相处，其结果在某种程度上好像处于他们正在与一个真实的人讲话之间。

也存在这样的问题，即人脸的接口是否必须针对不同的文化背景。有些人原则上反对这个观点。“有人认为，机器人仅仅是一台机器，它并不具有感情，”设计机械人脸的HARA博士如是说。

[The New York Times，1994年6月28日]