使用计算机生成的图像创建无偏见的面部识别

尼古拉斯·努西奥和玛加利·格鲁埃| 2023年1月3日

信息科学研究所的研究人员利用机器学习发明了一种公正的人脸识别方法

设计单元格/盖蒂图像

设计单元格/盖蒂图像

面部识别技术曾经接近科幻小说,是一种戏剧性的工具,主要出现在间谍电影和警匪片中。仅凭照片和搜索引擎就能找到一个人的身份,似乎更像是幻想,而不是事实。

然而,科技每年都越来越先进,面部识别软件已经渗透到日常生活中。当你的脸被用来解锁手机,甚至支付餐馆账单时,实现这一功能的软件往往漏洞百出,可能会犯下严重错误。如果你是一个或多个少数群体的成员,这一点尤其正确,而软件在识别这些群体方面是出了名的差。这不仅是不公平和令人恼怒的,而且基于政府定义的受保护特征之一(如种族、性别或残疾状况)的偏见可能违反联邦法律。

虽然政府尚未对面部识别软件提出任何规定,但研究人员正在努力寻找消除这些软件偏见的最佳方法。在他的研究中南加州大学信息科学研究所(ISI),研究生研究助理李佳芝发现了一种创造公平、公正项目的新方法。

在他2022年的论文中,题为“CAT:公平面部属性分类的可控属性转换,李打破了面部识别软件中减少偏见的传统方法。通常,研究人员会使用一组现有的真人面部照片来测试一个程序。然后,他们观察结果中可能表明偏见的相关性,比如来自特定身份群体的人被不成比例地认定为拥有面部特征。

虽然这种策略是适度成功的,但它并不能涵盖所有可能的偏见类型。有时问题出在用于校准软件的照片样本集中。少数群体的人,包括受保护阶层和那些拥有红头发等罕见属性的人,在样本数据集中通常代表性不足。不幸的是,学术部门收集样本照片的能力有限,原因有很多,包括侵犯隐私。

的帮助下高尼姆AbdAlmageedUSC ISI研究主任兼电气与计算机工程副教授,开发了一种填补数据集空白的方法:人工生成新图像。如果数据集缺少金发的受试者,李的程序可以简单地创建更多。AbdAlmageed解释说:“我们能够创建合成训练数据集,结合真实数据,包含均衡数量的具有不同属性(例如年龄、性别和肤色)的面部图像示例。”

通过创建包含较少常见特征的计算机合成照片,该程序可以学习以更小的偏差分析数据,因为样本照片具有相同数量的所有属性。

在他的研究中,李很高兴地发现,这些程序能够学习合成图像,就像他们学习真实样本一样。

由于这种方法依赖于一个自动系统来生成图像,而不是由研究人员单独创建图像,因此Li认为它可以扩展到许多应用程序中,使用多种类型的数据集。AbdAlmageed希望:“开发人脸识别算法的实体(如研究小组和公司)可以使用这项技术综合平衡他们的训练数据,这样最终的算法对少数族裔更公平。”该方法也应该适用于所有类型的面部属性,而不仅仅是李论文中讨论的那些。这项工作的下一步将是“扩展研究,使人工智能算法对少数族裔的少数例子不敏感,而不必扩大数据集,”AbdAlmageed总结道。

李的研究得到了美国国家情报总监办公室的部分资助(ODNI)情报高级研究项目活动(IARPA)。Li在2022年欧洲计算机视觉会议(ECCV)关于有偏见或稀缺数据的视觉(VBSD)研讨会上介绍了他的研究。

2023年1月3日出版

最后更新于2023年1月9日

分享这个故事