看脸识罪犯是洗白相面术？对于美国学者的质疑，上海交大教授这样回应

浏览：254 来源：时间：2023-04-09

三位美国学者的文章并非学术论文，在万字的篇幅中，他们讲述了相面术发展的历史，解释了机器学习研究领域的一些基本情况，并以武筱林和张熙的研究为靶子，指出就像他们的研究是披着机器学习外衣的相面术。

“通过机器学习，分类器能比较可靠地区分罪犯与非罪犯这两个群体的照片。平均来讲，罪犯的内眼角间距要比普通人短5.6%，上唇曲率大23.4%，鼻唇角角度小19.6%。”去年11月上载在预印本网站arXiv上的一篇论文里的研究结论让学界和舆论界都瞬间“炸锅”。

半年后，三位美国学者撰写万字长文隔空喊话：机器学习不应洗白相面术。

“机器相面术”，新瓶装旧酒

三位美国学者的文章并非学术论文，在万字的篇幅中，他们讲述了相面术发展的历史，解释了机器学习研究领域的一些基本情况，并以武筱林和张熙的研究为靶子，指出就像他们的研究是披着机器学习外衣的相面术，人类社会中的许多歧视也可能会被算法洗白。

他们认为，上述的这类研究在人工智能时代的新形态就是武筱林式的。“在计算机和大数据无处不在的时代，‘机器相面’开发出了许多前所未有的用途。因此，人工智能的开发者、评论家、用户们都急需了解技术的边界和相面术的历史，如今它披上了现代的外衣。”

纳粹“种族科学家”在做容貌测定。

“看脸识罪犯”研究无实用可能性

这篇饱受争议的论文题为《基于面部图像的自动犯罪概率推断》（Automated Inference on Criminality using Face Images）。在实验中，武筱林和其博士生张熙选取了1856张中国成年男子面部照片，其中730张是已经定罪的罪犯身份证照片（330张来自网上的通缉令，400张由一家签署过保密协议的派出所提供），其余1126张是在网络上抓取的普通人照片。经过机器学习，算法鉴别出犯罪嫌疑人的准确率达到87%。

武筱林研究使用的照片样本。a组为罪犯，b组为非罪犯。

在论文的导语部分，武筱林和张熙声明：“在本文中，我们无意也不够格去讨论社会偏见问题。我们只是好奇，全自动的犯罪性推定能有多高的准确率。一开始我们的直觉是机器学习和计算机视觉会推翻相面术，但结果是相反的。”

而论文中的87%准确率，只是在学术层面上得到了比较显著的相关性。一方面，这并不能解释任何因果关系，即到底是长相决定了天生的犯罪性，或者是人类社会对长相的歧视促成了犯罪概率的差异，都留待社会科学的解读。另一方面，这个数据也完全不具备应用可能性。舆论对其研究实用性的关注，甚至有网友建议他把这项研究交给纪检委，都让武筱林觉得哭笑不得，十分“跑偏”。

这是因为，基于中国千分之几犯罪率的背景条件，实验中87%的真阳性若用于实用，判断正确率将非常低。此外，这项研究本身就存在许多值得商榷的地方。比如，实验样本不够大，容易造成机器过度学习。

平均来讲，罪犯的内眼角间距要比普通人短5.6%，上唇曲率大23.4%，鼻唇角角度小19.6%。

虽然武筱林团队的研究成果无意也无法用于现实应用，但近来，人工智能领域确实出现了类似应用的苗头。而在人脸识别上惹出伦理官司的也绝非别无分号，这次站在政治正确性高地的Blaise Agüera y Arcas和Alexander Todorov供职的谷歌就曾栽过一个大跟头。

黑人被识别为 “大猩猩”

2015年，谷歌推出了相册应用Google Photos。该应用除了备份、整理照片之外，还会自动为照片添加标签，以便用户快速查找。

然而，就是这个基于图像识别技术的自动标签功能捅了篓子。纽约的一名黑人程序员Jacky Alcine惊讶地发现自己和黑人朋友的自拍照被Google Photos打上了“大猩猩”（Gorillas）的标签。他将截图放上了推特，谷歌第一时间做出了道歉，将“大猩猩”这个标签暂时撤出系统，并以最高优先级解决这个问题。

黑人自拍照被Google Photos打上了“大猩猩”（Gorillas）的标签

相关技术人员指出，谷歌可能并没有提供足够的大猩猩照片供机器学习到其中的差别。不过，也有其他网友安慰Alcine道，自己的照片也曾被识别为“猫”或“马”。

以色列初创企业“看脸识恐怖分子”

2016年夏天，一家名为Northpointe的密歇根公司被推向了舆论的风口浪尖。美国各地都有法庭在使用这家公司的AI产品COMPAS，以评估某个犯罪嫌疑人再次犯罪的概率。法庭作出判决或保释决定时会参考COMPAS的评估意见。

COMPAS的评估系统基于超过100个因素，包括年龄、性别、犯罪历史等，给嫌疑犯给出一个1到10区间内的评分，分数越高越危险，但因素里并不包含种族。然而，非营利性民间新闻网站ProPublica指出，对于那些实际上没有重复犯罪的嫌疑犯，黑人被打高分的概率要比白人大。因此，ProPublica指责COMPAS作为内嵌有种族歧视的AI系统，不应再作为法庭的参考。

COMPAS预测重复犯罪概率

《华盛顿邮报》撰文称，如果COMPAS算法按照公司本身的定义确实是“公正的”，即给予同等分数的黑人或白人嫌疑犯重复犯罪的概率相同，那么造成ProPublica测得的偏差的实际原因，是黑人嫌疑犯的整体重复犯罪率确实更高。

而Blaise Agüera y Arcas等三人的文章里还点名批评了一家以色列初创企业Faception。据《华盛顿邮报》报道，该公司已与某国土安全机构签署合同，协助识别恐怖分子。Faception宣称他们开发的系统能通过人脸分析鉴别恐怖分子的成功率超过80%，并能成功识别出2015年11月巴黎恐怖袭击11名犯罪嫌疑人中的8人。

Faception识别人脸

Faception的首席执行干Shai Gilboa告诉媒体：“我们的个性是由DNA决定的，也会体现在脸上。这是一种信号。运用先进的机器学习技术，我们开发出了15个分类标准，每种标准都代表了一种人格，是一些个人特征和行为的集合。我们的算法可以针对每个人对这些人格的契合程度打分。”

除了恐怖分子之外，Faception宣称他们的算法还可以用于识别恋童癖和白领罪犯。

不是算法有歧视，而是人类有偏见

基于美国特殊的历史和文化，种族问题一直容易挑动敏感的神经。而在上述的谷歌人脸识别BUG和COMPAS断案系统中，媒体都分外关注黑人族裔这一“少数派”遭受不平等的算法。Blaise Agüera y Arcas等三人的文章中也一再强调，不应用看似客观公正的算法替人类的歧视“洗白”。

事实上，近年来已有越来越多的学者开始认识到算法并不客观。英国巴斯大学教授Joanna Bryson上个月发表《科学》杂志上的一项研究指出，AI也会表现出各种偏见和歧视，这些偏见涉及种族、性别、年龄等。Joanna Bryson说道，“人们会说实验说明AI有歧视。不是的。这其实说明我们人类有歧视，被AI习得了。”

武筱林也告诉澎湃新闻，“我们说机器作判断时，没有偏见，当然是假设数据的标记是公平的。机器不会纠正人在输入数据标记中的偏差。”

人类偏见会作为数据被人工智能“习得”这一点，在聊天机器人上体现得淋漓尽致。2016年3月，微软的聊天机器人Tay（小冰的美国姊妹版）在推特上线，被设定为可以与任何@她的推特用户聊天。短短24小时后，一个甜美、礼貌的“小姑娘”竟然开始脏话连篇，甚至爆出不少种族主义和性别歧视的言论。这个被网民调教速成的“AI希特勒”引发网民震惊，被微软草草关进“小黑屋”。

被“教坏”的Tay

另有一部分研究者指出，黑人这样的“少数派”可能会遭受不平等算法的最主要原因是，训练数据集中代表这些“少数派”的样本太少了，因而算法对这部分人群的训练不够成熟，往往会做出不准确的结论。而许多算法开发者自己没有意识到这一点。

机器人觉得白人更美？

武筱林告诉澎湃新闻，他在学界听过一个说法，说现在关于人工智能伦理的会议比关于人工智能本身的会议还要多。

由于研究犯罪概率遭受了许多压力，武筱林虽然仍将继续挖掘计算机视觉在模拟人类感知上的潜力，但会将研究主题转向其他方向。他在那篇论文之后上传在arXiv上的研究题为Automated Inference on Sociopsychological Impressions of Attractive Female Faces（《自动推断有吸引力的女性面孔造成的社会心理学印象》）。

这项研究考察了计算机视觉在学习人类审美的能力。实验结果发现，经过训练后的算法可以大概率区分性感（hot）与可爱（cute）美女，审美与中国高校男生非常接近。

“我们必须要认识到这一点，就是人工智能有这个潜力，人工智能已经到这一点了。”武筱林说道。

不过，他的这项计算机“审美”研究放在美国社会可能也会面临一些麻烦。2016年，包括英伟达、受微软支持的青年实验室（Youth Laboratories）在内的数家机构共同举办了第一届国际人工智能选美大赛（International Beauty Contest Judged by Artificial Intelligence）。全球范围内的用户只需在相关APP上传自己的自拍照，机器人裁判员员员员员员员员员员就会根据面部对称性、皱纹等因素选出最美的获胜组。令人尴尬的是，在来自100多个国家的近6000张自拍中，机器人裁判员员员员员员员员员员挑选出来的44个最美的获胜者几乎全是白人，有一小部分亚洲人，只有一个拥有深色皮肤。

“机器人不喜欢深色皮肤。”当时许多新闻报道以此为标题。

活动推荐：“5G物联峰会”

作为信息社会通用基础设施，时下5G产业建设以及发展如火如荼，并将最终带动数十万亿规模的社会经济发展。但5G在正式进行商用化普及应用前的态势如何发展？5G将为哪些领域的变革带来有益赋能？5G将在各行各业掀起什么样的市场风暴？系列问题依然困扰着各界人士。

为进一步深入了解产业发展脉络，理解5G产业现状以及未来趋势，让各界人士更清晰的洞察5G产业发展过程中的机遇点。6月14日，经上海市经济和信息化委员会、上海市商务委员会、上海市长宁区人民政府指导，由亿欧公司联合承办的“5G物联峰会”将于上海虹桥世贸展馆举办。

亿欧“5G物联峰会”将特邀政府、学界、商业、投资机构等领域的专业人士，以多领域视角切入，深究5G产业发展脉络，探索5G赋能各行各业的新思路、新方法，供行业内外各界人士参考。活动详情请戳：https://www.iyiou.com/post/ad/id/824

上一篇: 千亿级市场的肿瘤早筛，还需突破三个难关

下一篇: 云天励飞参与起草的多项人工智能标准正式发布