面部识别软件可以通过任何一张照片确认你的身份
抗议游行队伍里,一家同性恋酒吧里,或一家堕胎诊所里的一张照片,都有可能让你的朋友认出你来。但机器不能,至少现在还不能,除非一台配备了多张你的高质量图片资料的计算机一直在负责搜索你,你的隐私始终是安全的。也没有计算机可以通过随机的、没有标签的图片在互联网上搜索找到你。但在收藏了至今为止世界上最大个人照片集的Facebook的“花园围墙”内,这样的前景正在开始慢慢展现在我们面前。
Facebook的脸部识别系统DeepFace在一些受限制的面部识别任务中,其准确程度堪比人类。纽约大学计算机科学家、领导Facebook人工智能研究的雅安·勒存(Yann LeCun)坚持认为,Facebook并非意图要侵犯其超过13亿用户的隐私,而是意在保护个人隐私。一旦DeepFace在每天上传新照片的4亿用户中“认出”了你的脸,“你会得到一个来自Facebook的警告,告诉你你出现在了这张照片中。”他解释说,“你可以选择模糊你在这幅图中的脸,以保护你的隐私。”然而,很多人根本不希望被认出来,特别是在陌生人的照片中时。Facebook已开始使用该系统,虽然其面部标记系统只向你显示你“朋友”的身份。
DeepFace不是这场隐私保护赛中的唯一“黑马”,美国政府为大学人脸识别研究投入了大笔资金,如谷歌等一些私营公司也在开发确定个人身份的照片和视频自动识别技术。
自动面部识别技术如何付诸实际应用,以及法律如何加以限制等,目前仍不清楚。但是一旦技术成熟,在解决许多隐私问题的同时,也必将产生同样多的新的隐私问题。“隐私问题这个妖魔或许很快就要破瓶而出,而我们已经没有退回去的路了。”爱荷华州立大学研究隐私问题的信息系统研究员布莱恩·梅尼克(Brian Mennecke)说道。
简单的脸部识别对于计算机来说,是一件轻而易举的事情,至少比识别一些常见物体要容易得多,如花朵、毯子和灯具等。几乎所有的脸部都有相同的几个特征:眼睛、耳朵、鼻子和嘴,而且都在同样的相对位置,这种一致性为计算机识别提供了有效的途径。“图片的脸部识别技术已经存在有大约20年时间了。”勒存说道。如今即使是普通相机里的微型计算机也早就具备了脸部识别和聚焦的功能。
但是“确定一张脸比探测到一张脸要困难得多。”勒存说。你的脸代表了唯一的你,但与你的指纹不同的是,它是在不断动态变化着的。只是一个简单的微笑,你的脸就会发生很多变化,你的眼角会皱起,你的鼻翼会轻轻张翕,你的牙齿会露出来。当你仰头大笑时,你的脸型甚至会明显扭曲。即使你努力保持同样的脸部表情,你每张照片上的头发也不尽相同,特别是当你进了一趟理发店后,出来后更是形象大为改观。但是大多数人都能在一系列照片中毫不费力地认出你来。
就感知周围世界而言,面部识别可能是人类大脑做的最简单也是最了不起的事情了。马萨诸塞州立大学的计算机科学家埃里克·莱恩德-米勒(Erik Learned-Miller)说道,相比之下,计算机识别人脸时对于多个方面的考虑要困难得多:年龄、姿势和表情等,这些方面的一些微妙差异都会干扰计算机对一个人脸部特征的区分辨认。
照片上那些人真的都是你吗?
这些照片,你只要瞥上一眼,就能立即辨认出来,照片上的人显然都是同一个人(计算机科学家埃里克·莱恩德-米勒)。但是对于计算机来说,用来识别人脸的几乎每一个参数,在每幅图像上都不一样,极大地妨碍了计算机识别面孔的能力。一种称为“深度学习”的技术,可以抑制和排除这类干扰,揭示这些面孔的共同点,从而让计算机做出正确的判断:这些照片上的人都是同一个人。
所幸的是,如今有了一种名为“深度学习”的技术,令计算机的人脸识别能力突飞猛进。像所有其他的机器学习技术一样,深度学习从一组训练数据开始,每张脸都做有标签的大规模数据集,最理想的是包括了每个人多张照片的数据库。莱恩德-米勒帮助建立了一个人脸数据集,名为“户外脸部检测数据库(Labeled Faces in the Wild Home,LFW)”,其中包括了从网络上收集到的5 749位名人的13 000张面孔图片,有的人只有几张,有的人甚至多达几十张。这是一个可以免费使用的在线数据集,很受专门研究面部识别算法的计算机视觉研究者的欢迎。
对于计算机来说,人的面部只不过是一些或深或淡像素的集合而已,深度学习系统的培训首先让系统自行对比和发现脸部特征,例如,眼睛和鼻子的统计学特性,这些对于人类来说,并没有直观上的意义。“让机器和数据说话好了。”DeepFace首席工程师雅尼夫·泰格曼(Yaniv Taigman)说道。
系统首先将脸部像素分成一些元素的集合,如构勒出面部轮廓的边缘等,然后将一些相同但足以辨别出区别的脸的元素根据非直观的统计学的特性进行层层分类组合的处理。这就是深度学习的“深度”:每个处理层次的输入都是其下面一层的输出,通过这种培训,最终结果是一个具有代表性的人脸模型,统计机器可以将面孔图像进行比较,猜测它们是否属于同一个人,系统训练的面孔越多,猜测结果就越准确。
DeepFace团队去年3月在Facebook网站上发表的一篇论文描述了他们的这个创意,在机器视觉社区引起了很大的反响。人脸识别的一个基准是确定LFW数据库里两张照片中的脸是否属于同一个名人。人类的准确率约为98%,DeepFace的准确率为97.35%,比同领域的其他技术高出27%。
DeepFace的一些优势源自于其更灵巧的编程,例如克服和完善了脸部信息不全的问题,如果照片只显示了人的侧面,程序利用它可以看到其他一些脸部照片的优势,重建可能的脸部正面图。这种“对齐”步骤可以令DeepFace的识别效率更高,泰格曼说道,“我们可以将系统容量的大部分集中于一些细微差别上。”
“这种技术在单核计算机上运行只需要几分之一秒。”泰格曼说。因此,DeepFace可以有效地运用于智能手机上。原则上,一个拇指驱动器就足以装下一个10亿人的面部照片识别数据库。
但是DeepFace最大的优势是其训练数据。DeepFace论文中提到一个“社会面孔分类(SFC)”数据集,里面包括了从Facebook页面上收集到的4 030个用户的440万张有标签的脸部照片。Facebook允许注册用户使用他们的个人资料库,但论文却未提到要得到照片主人的同意。
“这听起来令人毛骨悚然,太可怕了。”在DeepFace现身一周后,发表在《赫芬顿邮报》的一篇文章如此形容道。《赫芬顿邮报》的一位读者在评论中写道,“很显然,警察和其他执法部门将使用这种技术,在我们根本没有意识到情况下搜索我们的照片。”Facebook承认,在法庭传票责令下,确实为执法部门提供了访问用户数据的权限。
“人们都非常害怕,”莱恩德-米勒说,但他认为,这种担心是多余的,“像Facebook这样的公司,如果真的越过了社会规则能够接受的界限……他们可能将面临倒闭。如果他们触犯了法律,那么他们会被勒令关闭,涉案人员将可能被逮捕。”他认为,人们的疑虑源自于缺乏透明度。学术研究者要使用隐私数据进行研究,必须得到明确的同意,那些在Facebook上点击“同意”签署带有一些附加条件的许可协议(EULA)的用户授予公司许可使用他们的数据,这样的在线合同“是完全违背透明度原则的,”莱恩德-米勒说道,“没有人真正知道他们访问数据的权限有多大。”去年,该公司推出了一个寻找恐龙的卡通图片,会不时在屏幕上弹出来,提醒用户注意他们的隐私设置。
个人隐私数据已形成了一个繁荣的交易市场,其中一些是合法的,其他是不合法的,面部身份识别将成为另一种热门商品,梅尼克预测道。例如,面部身份识别可以让广告商在有摄像头的地方追踪你的购物行为,迎合你对商品的喜好,甚至根据了解到的你的购物习惯或人口统计学特征的数据,提供不同的价格标准。但“真正令人们不安的是,”梅尼克指出,“是大街上的一些陌生人,他们随时可以在人群中将你认出来……无处不在的面部识别让你避无可避。”
美国的一家公司FacialNetwork利用其深度学习系统,开发了一款名为“名签”的应用软件,通过智能手机或像“谷歌眼镜”这样的可穿戴设备,“名签”不仅能够透露某个人的姓名,还有其他更多的个人隐私,如来自社交媒体、交友网站和犯罪数据库等的信息。Facebook很快丑闻缠身,它给FacialNetwork发出停止和阻止收集用户信息的命令。“我们不提供这种信息给其他公司,未来也没有任何这样的打算。”Facebook通过电子邮件告诉《科学》杂志道。
面部识别技术潜在的商业应用将有可能制造出更多的“麻烦”来,莱恩德-米勒说,但他更担心的是政府可能会滥用这项技术。莱恩德-米勒说道,“我100%赞成斯诺登的观点。”他指的是前国家安全局承包商斯诺登于2013年透露的美国政府大规模监测美国公民电子邮件和电话记录的事件,对此“我们必须保持警惕。”他说。
莱恩德-米勒语出惊人,他的分级面部识别研究项目是由美国情报高级研究项目署部分投资的,也许正因为此,我们有更多的理由认真思考一下他的警告。
资料来源 Science
责任编辑 彦 隐