本文系网易沸点工作室《哒哒》栏目(公众号:dadatime)出品,每周五期,用独特视角解构不可描述的最In话题。
所谓“相由心生”,但也“知人知面不知心”,说的就是看相识人与看相不能识人。
需要指出的是,本文所讨论的“相由心生”与“人不可貌相”是从相关性上思考,而不是从因果性上思考。
2016年起出现两起新型看相术,看相的结果出奇得准,让我们先来了解一下。
第一起,听音识人。
“如果你让我听到一个人说话,那么,我就可以找到这个人!”
经过多轮严格的测试,证明王英梅副教授真有这项匪夷所思的的神奇能力,居然真的拥有。
华人神探、著名刑事技术专家李昌钰连连感叹:“她可以改变(刑侦破案的)历史!”
王英梅是四川大学健康心理系的副教授,她自述“听音识人”,成功率有七成。在解释听到声音,如何判断声音主人时说,有些人发音的特点,影响了颌面部的发育,包括人的心理状态也会影响人的声音。一个人的情绪不同,声音的音频、音高、节奏都会有很大的不同。同时性格和情绪也影响了长相,不同的情绪下激活的脑区完全不同,这些都可以反映在人的表情和面部。因此根据声音,可以判断出一个人的长相。
第二起,计算机看脸定罪
看相能识别女博士,看相能不能识别犯罪?不妨来作个实验。
第一眼看到上图你认为哪个罪犯?
正确答案是左边的人。
2011年,康奈尔大学的心理学研究团队做过类似的实验,将普通人的面部照片和犯罪者的面部照片混在一起,让人观看。结果是参加实验者都会看相,能分出所给定的面部照片是普通人还是犯罪者。
仅靠人的面相就能断定罪犯这显然是不靠谱的。
这项研究引起了上海交通大学的武筱林教授的怀疑。于是他带着他的博士生张熙开始研究。
他们首先建立了一个人脸图像数据库,包含有1,856张 80x80 像素的中国男性面孔近照。这些男性年龄介于 18 至 55 岁之间,面部没有长毛(浓密的络腮胡子),也没有疤痕或其他明显痕迹。
图库中, 730 张是公安或警察部门提供的“罪犯”照片。其中,235 人犯有包括谋杀、强奸、殴打、绑架和抢劫等暴力罪行;其余 536 人被定罪为非法暴力罪行,例如盗窃、欺诈、腐败、伪造和敲诈勒索罪。
其他 1126 张人脸图像则是:“使用网络爬虫从互联网获取的非犯罪分子头像,职位广泛,包括服务员、建筑工人、出租车和卡车司机、房地产经纪人、医生、律师和教授;……大约有一半的人拥有大学学位。”
要特别强调的是,所有这些人脸图像都来自证件的照片——这些被视为“犯罪分子”的图片不是犯罪现场照片。
接下来,他们建立了四个不同的分类器(逻辑回归,KNN,SVM,CNN),以面相有关的多种参数作为判断关键点,让计算机区分犯罪者和非犯罪者。实验结果表明,计算机会看相,而且很准。
最让武教授惊讶的是计算机比普通人更能看相,准确率居然接近90%。
这个结果就是“颅相学”和“天生犯罪人”理论,武筱林坦言,这样的结果,武筱林感到很吃惊。经过反复交叉验证,始终没有推翻原始的结论。有人提出,可能是照相机性能的不同,他们故意在照片的光学信号上加了很多噪音。但之前的结论依然成立,机器识别仍有75%以上的准确率。
最终,武教授在预印本网站arXiv 上非正式的发表了其研究结果,文章名为《利用面部图像自动推断犯罪行为》(Automated Inference on Criminality using Face Images)。
随着文章的发布,在国内外引发了轩然大波,不论是媒体,还是科研机构,或者是政府相关机构都表达了关注。
5月7日,谷歌人工智能研究员布莱斯、玛格丽特和普林斯顿大学神经科学教授亚历山大发布的《相面术的新外衣》(Physiognomy s New Clothes)一文,质疑武筱林研究的可信性,并称其研究结论可“具有误导性,洗白科学种族主义”。
针对该文的质疑,武教授给哒哒君发了一篇他们刚写的回应文章《在人工智能伦理的讨论中停止谩骂和歪曲》(Stop Name-Calling and Distortions in AI Ethics Discussions)可以看出两位中国学者似乎相当的难受与委屈。
其实,普通人都可以识别罪犯,凭什么计算机不可以。武教授的研究过程没有问题,但是标题以及图库存在很大的问题。
设想下,如果你参加康奈尔大学实验,毫无疑问会选面恶的人的照片。
反过来,如果专门挑面善的罪犯的照片和面恶的普通人的照片混在一起,你去选,基本上都会选错。
上图,大部分人一眼就可以看出,上排的三位面恶,不是好人。下排的三人有蒙娜丽莎般不易觉察的微笑。同时请注意,头像中的衣服,上排的是没有衬衫的,下排的是有衬衫的。不要小看这个白衬衫,虽然白衬衫不属于面部,但是照相时由于白衬衫会反光,所以下巴部分会更亮一点,平常人看不出,电脑却会认为此人更“阳光”。
机器思维是人思维的延伸,机器只是更精确,更高效的替代了人的判断,这种判断是相关性的判断。
为什么机器能如此准的识别罪犯呢?——导致这个结果的原因是数据来源的问题。
1. 犯罪分子的照片来源于警察部门。
2. 非犯罪分子的照片来源于互联网。
可以反问几下。
1. 来源于互联网上的证件照片这些人难道没有犯罪分子吗?
显然可能有。但是按照中国千分之三的犯罪概率来看,图库中是罪犯的可能性非常小。所以对结果影响不大。
2. 警察提供的照片难道不会偏向提供面恶的证件照吗?
(1)警察部门会倾向于提供面恶的照片,这是集体无意识。如同影视剧中坏人总是面恶之人。警察由于职业的原因,提供犯罪分子的照片,总是会不自觉的选一些凶相的照片,会不自觉的心理暗示自己,自己的职业就是惩恶扬善。
(2)证件照的拍摄环境使得照片偏向面恶。
证件照无非是身份证、户口本、护照的照片。这类证件照要求免冠,笑不露齿。笑不露齿很关键。不少人咧着嘴,抿着唇,皮笑肉不笑保持端庄的样子,看上去其实很吓人。
如果证件照是警察拍的,加上排队的环境,很多人会不自觉地摆出一副臭脸,这样的照片能面善?
综合以上的情况,有理由认为警察提供的照片,有偏向提供面恶的照片。
互联网上的照片难道不是偏好提供面善的证件照吗?
比如不管你是什么职业,都会在找工作时提供面善的照片。
笑脸迎客,这个集体无意识在互联网上的表现更为明显。
由于样本数据来源的巨大偏差,这样会导致判定时候的标准会更明显,即面恶的特点更突出,面善的也更突出。所以计算机判断起来也更容易,准确率也会更高。
有人把计算机的面相术与王英梅副教授的听音识人与常见的看相术联系在一起。认为支持武教授的研究就是支持相面术,就是支持迷信,就是支持纳粹的种族主义者。
其实不管支持还是反对,正确的姿势是:“相由心生”与“人不可貌相”是对立统一的。
也就是说:假定所有的犯罪分子=歪瓜裂枣的脸,但是绝大部分歪瓜裂枣的脸都不是罪犯。同时歪瓜裂枣的脸比相貌堂堂的人更可能是罪犯。
计算机辨识面相只是从相关性的角度去提供分析结果。
根据概率论,也就是贝叶斯公式,判定犯罪倾向的公式为: 犯罪倾向 = S*N /( S*N + Z*(1-N) )。
其中: S=电脑识别正确率, N=某条件下的犯罪率, Z=电脑识别错误概率, S+Z≤1,一般来说 Z=1-S。根据公式,我们来看看下表。
上表说明,由于因为中国的犯罪率只有0.3%,所以计算机90%的准确率在实际的运用中还是会有很大偏差,所以只有到正确率接近99%的时候,才可以真的运用到识别犯罪。
要说武教授还是一个挺能玩的老司机。去年他又在预印本网站arXiv上非正式地发表了一篇文章,这次的文章没有引起太大的争论。老司机的新玩法为:妹纸上传一张图,计算能判断出你是“妖艳货色”还是“纯情萝莉”。
其实,通过相貌与个人品性和行为的相关性来断定一个人,是很可怕的事情。它和地域炮一样,都是通过较大的相关性祸害了其他的一波人。
就像美团的田源在工作大群中发布招聘信息时表现的那样。所有没有绝对可靠根据的判断都不符合理性,而以非理性的结论去否定相关的人和事,则更加可笑。
但还有一种情况,一些单位与个人就是歧视女博士,歧视河南人,歧视东北人,歧视妹纸,但是他只做不说。这种憋在肚子里的歧视其实比明处的歧视更加可怕。
后记:本文完稿之前与武筱林取得联系。武筱林认为,哒哒君的很多观点是有效的,他也意识到了。随后双方进行了电话沟通。
欢迎各位积极留言,哒哒君愿意转达网友的意见与建议。
参考文献:
[1]arxiv,X.L Wu, Z.Xi. Automated Inference on Criminality using Face Images
[2]央视:挑战不可能]大学教授王英梅挑战听音识人
[3] [https://medium.com/@blaisea/physiognomys-new-clothes-f2d4b59fdd6a]
[4]arxiv,Xiaolin Wu Xi Zhang Chang Liu Automated Inference on Sociopsychological Impressions of Attractive Female Faces
[5] B. Fink, K. Grammer, and P. J. Matts. Visible skin color distribution plays a role in the perception of age, attractiveness, and health in female faces. Evolution and Human Behavior, 27(6):433–442, 2006.
[6] X. Geng, Z.-H. Zhou, and K. Smith-Miles. Automatic age estimation based on facial aging patterns. IEEE Transactions on pattern analysis and machine intelligence, 29(12):2234–2240, 2007.
[7] A. Krizhevsky, I. Sutskever, and G. E. Hinton. Imagenet classification with deep convolutional neural networks. In Advances in neural information processing systems, pages 1097–1105, 2012. [8] J. H. Langlois and L. A. Roggman. Attractive faces are only average. Psychological science, 1(2):115–121, 1990
《哒哒》,传说中聚焦青年文化研究的神秘组织,关注哒哒公众号(dadatime),每天用最短的时间,看最酷的世界。