计算机如何识别人类肢体语言

眨眼机器人

 

  在谈话过程中,即使从头到尾都是一个人讲话,那也是一种交流。一方面,听者通过说话者的表情、姿态和动作来领会说话者所表达的意思;另一方面,说话者描绘的所见所闻并决定着听者能否理解其语言。然而,计算机却无法做到这种程度的交流。或者说,到目前为止,计算机还无法做到这一点。
 
  但是,南加利福利亚大学的研究人员路易斯·P·莫伦斯(Louis P.Morency)及其同事所做的研究可能改变这一历史。在最新一期《替代代理和多重代理系统杂志》上,他们证明计算机可以具有理解人类一种极为重要的肢体语言的能力。这种肢体语言就是“点头”。
 
  “点头”是人类传递信息时所使用一种最重要的信息符号。如果适当的时候点头,其意思则为“我明白你讲的话”,或者“我明白了”。对于设计用来与人类交流的计算机程序和机器人而言,如果能注意到人类的“点头”动作并自动做出点头回应(通过计算机屏幕呈现面部特征,而实际的点头动作由机器人来完成),那就再好不过了。遗憾的是,至今还没有人取得成功。
 
  心理学家已花费数年时间来分析人类的交流过程,以期找出触发人类“点头”的机制,但结果并不理想。研究人类的交流过程不仅令人筋疲力竭而且耗时甚久,哪怕是仅一分钟有关大拇指伸缩规律的录像资料,也要耗费长达1小时的时间去分析。此外,许多社会性的暗示都是阈下刺激,即便是最敏锐的心理学家也难以注意到。
 

嘎然而止话音可能是点头信号

  莫伦斯博士正在开发一套能自动完成上述分析过程的计算机系统。这套系统可以对视频和声频记录进行分析,以识别人类的肢体语言(比如以特定的方式摇头)和语音语调(比如音调的高低变化)。该系统可以记录下信号序列,然后与不同的说话者所呈现的信号序列进行比较,从中找出使听者点头或不点头的共同信号模式并进行标示。这套系统所包含的共同信号模式就像是一部描述详尽的“烹饪书”,只要按照书的讲解就能烹制出美味佳肴(“点头”动作)。
 
  为了测试这套系统,该项目组挑选了100名被试者进行一项实验。他们将被试者分为两组,第一组先看一段视频然后描述所看到的内容,第二组先听一段文字描述然后说出所听到的内容。莫伦斯从以前的研究中了解到,突然压低的嗓音和嘎然而止的话音可能是听众点头的信号;而这些信号正是他们所设计的软件所要捕获的。
 
  然而,莫伦斯及其同事所质疑的是,“点头”的触发机制要比先前所做的这些研究所显示的结果要复杂的多。因此,莫伦斯等人所编的程序包括了大量的人类其他姿态,比如说话时的身体姿势、凝视方向,甚至一些特别的字眼。
 
  他们的论文揭示出“点头”诱发信号不仅仅包括突然压低的嗓音和嘎然而止的话音。尽管这些信号当然与点头有关,并且新的系统能识别出两种以前从未注意的信号,一种是讲话者在点头之前,视线会在听者身上频繁移动;另一种是经常用“and”这个词来生成“应答性点头”动作。
 
  莫伦斯博士计划在此基础上分析人类其他的肢体语言,比如触发“点头”动作的凝视和“and进行时”。他希望能将他的研究成果整合进教育软件中,甚至认为这可能改变目前课堂传授知识的传统方式。军方也希望从中受益。美国陆军部已经采用这项技术来分析其他国家民众的交流模式,以期设计出一套包含这些信息的程序,用来训练在国外驻地的士兵适应当地文化。
 
 

资料来源 The Economist

责任编辑 则 鸣