南加州大学在NAACL ' 22会议上:人工智能中的性别偏见,研究新闻修订的工具,以及避免有毒内容的方法

| 2022年7月11日

值得注意的研究还包括减轻反酷儿偏见和改善电子商务商店的工作。

人类与机器人对话的动画

图片来源:Muqamba/iStock

计算语言学协会北美分会2022年年会(NAACL),将于2022年7月10日至15日在华盛顿州西雅图在线和现场举行。,USC’s Information Sciences Institute (ISI) researchers will present 18 studies spanning a variety of topics including reducing gender bias, avoiding toxic content creation, improving search capabilities in low-traffic e-commerce stores, using LGBTQ+ tweets to mitigate anti-queer bias and more.

NAACL为北美、中美洲和南美洲的计算语言学协会(ACL)成员提供了一个区域焦点,年度会议是自然语言研究的首要会议之一。

NAACL 2022收到了创纪录的2103份参赛作品,超过了去年1797份的纪录。今年,442篇论文的录取率为21%,比去年的26%下降了5个百分点。

在442篇被录用的论文中,5篇最佳论文和3篇优秀论文已经公布。其中包括亚历山大Spangher,一个ISI研究生研究助理,谁的论文?”NewsEdits提供了第一个公开的新闻修订历史数据集。这篇论文因其在编辑和研究报纸文章修订方面的开创性工作而被授予“资源贡献荣誉奖”。

四个亲善团体也在大会上举行了为期一天的研讨会。在AI工作室里的酷儿,ISI的凯蒂·费克纳,一名研究生研究助理,将会介绍她的论文讨论了对酷儿和变性人的偏见被编码在大型语言模型中,以及如何减轻这种偏见。Felkner是仅有的两位被选中在研讨会上进行口头报告的研究人员之一。

乔纳森可能bob国际首页登录ISI基于自然和有意义的证据增强语言应用的有用技术中心的研究副教授和主任,他今年与人合著了四篇NAACL论文,自2019年以来一直担任该组织的财务主管。在此职位上,他帮助维护NAACL的财务健康,同时也支持倡议促进公平分配在美洲进行大规模的研究作为美洲地区基金(Regional Americas Fund)的主席,他参与了每年捐赠数千美元的活动,以支持中美洲和南美洲大学促进自然语言处理研究的计划。此外,May还帮助促进低成本的会议子女抚养费,并为NAACL会议提供会议旅行补助金。

梅说:“我们努力确保缺乏资金不等于缺乏机会。”

佩德罗Szekelybob国际首页登录南加州大学维特比研究教授和ISI人工智能部门主任指出:“在NAACL发表论文是很有声望的,并为ISI所做的研究提供了显著的可见性。”

Szekely是今年将发表的一篇关于微妙的表到文本生成的论文的合著者,他很兴奋地看到ISI的下一代研究人员在会议上的论文取得了如此大的成功。“我们在NAACL的历史上发表了许多论文,可以追溯到NAACL成立之初。很高兴看到我们的年轻研究人员正在遵循ISI在自然语言处理方面的卓越传统。”

研究聚光灯,NAACL 2022

避免产生有毒物质

聊天机器人、对话系统和会话代理(如Siri或Alexa)每天与数百万人互动,这使得这些系统避免产生有毒内容变得越来越重要。

在这篇论文中, ISI研究人员研究了对对话代理产生难以察觉的攻击的可能性,尽管流畅连贯,但会引发有毒反应。然后他们提出了一种防御机制,以避免产生有害内容,同时保持对话顺畅。

根据亚兰Galstyan南加bob国际首页登录州大学维特比研究副教授、ISI机器智能和数据科学小组主任和他的合著者表示,这项工作的重要性在于关注自然的、类似人类的对话语言,这种语言可能会引发有毒反应。“这样的触发器可能会被用户在与聊天机器人的自然对话中调用,这将给那些谦逊的用户带来不愉快和冒犯的体验。”Galstyan说。

这与该领域的现有工作不同,现有工作主要研究不像人类语言或人为生成的攻击,因此代价高昂且不可扩展。Galstyan和他的团队设计了一种防御机制来减轻攻击并保持会话流。这种方法依赖于两个层次的推理。首先,该模型确定了导致攻击的关键对抗性令牌(即单词)。然后,该模型在生成过程中掩盖了这些标记,这允许一个听起来自然的反应,没有毒性。

这项工作有明显的主流应用。

“我们希望看到我们的工作被纳入对话系统,比如Alexa,”他说研究生研究助理和合著者,Ninareh Mehrabi。我们希望确保这些系统对自然发生的触发器具有健壮性。”

使用LGBTQ+推文来减轻反同性恋偏见

随着人工智能变得越来越普遍,人们越来越担心其算法对边缘化人群存在系统性偏见。大多数关于减轻这种类型偏见的研究都是为了减少种族和二元性别偏见。

这篇论文有助于填补文学中关于酷儿的空白。ISI的研究生研究助理凯蒂·费尔克纳(Katy Felkner)说:“在大型语言模型中,没有合适的指标来衡量反lgbtq +偏见,所以我们决定建立一个。”结果是WinoQueer,一个新的基准数据集,模仿其他偏见检测基准,但解决了恐同和恐跨性别偏见。

使用WinoQueer来衡量反酷儿偏见,研究人员发现大型语言模型显示出明显的异性恋规范偏见。然而,当这些模型根据酷儿人群的数据进行微调时,偏差就会减轻。

通过收集LGBTQ+社区的推文(反映了其成员的语言),研究人员能够显著减轻反酷儿偏见。有趣的是,这比根据主流新闻媒体关于酷儿问题的数据进行微调的模型表现得更好。

费尔克纳将在今年大会AI研讨会上的酷儿。

提高新开业电子商务商店的搜索能力

教授可能和合著者与亚马逊合作,为低流量的电子商务商店改进搜索系统。亚马逊团队中有资深作家拉胡尔·巴加特(Rahul Bhagat), ISI博士校友。

问题在于电子商务中用于根据客户行为检索产品的系统需要大量的客户行为数据(例如查询、点击、购买)进行培训。不幸的是,对于低流量的电子商务商店,如新推出的商店、网站或产品,行为数据是有限的,这影响了这些系统的性能。

“该团队想知道是否有办法将他们现有的少量客户行为重新制定为更综合的客户行为。例如,如果我们在一个产品页面上有‘红色跑鞋’,我们可能还想将‘红色跑鞋’或‘红色跑鞋’与同一页面关联起来,这取决于地区。”

深度学习模型可以重新制定文本序列(如“红色跑鞋”)转换为其他文本序列(如“红色跑步运动鞋”和“红色跑步运动鞋”)。这个过程称为查询重构。在这篇论文May和合著者提出了一种技术,该技术使用查询重构来增强低流量电子商务商店的行为训练数据。

研究人员发现,使用他们的技术,即使一个特定的网站流量较少,他们也可以获得数百万个高质量的查询重构示例,这些示例可用于训练模型。“然后我们使用训练过的模型来生成大量数据,”May说。

此外,研究人员在一个流行的电子商务网站上进行了真实世界的测试,发现使用他们的方法,业务指标显著提高。他们研究的两个指标是“搜索点击率”和“客户重塑率”。搜索点击率是指至少点击一次的搜索所占的百分比;更简单地说,它表示客户至少点击查询结果之一的频率。通过研究人员的技术,这一指标上升了。客户重新表述率是指由于客户对最初的搜索结果不满意而不得不重新表述的搜索的百分比,这个指标下降了。

梅希望看到这项技术被用于提高客户满意度和减少挫败感。

浅析新闻文章性质的变化

新闻文章随着时间的推移而发展。首先是突发新闻简介出版。这是更新的新闻,直到它成为一个完整的文章。这篇论文, Spangher和其他作者提出了“NewsEdits”,这是第一个公开的新闻修订历史数据集。它包括来自22家新闻媒体的120万篇文章,460万个版本,发表时间超过8年。

现有的在线修订历史领域的研究主要集中在维基百科上的文章更新,其中的编辑通常是小的语法或语法错误。然而,本文的研究表明,大多数新闻文章的编辑包含了新的信息,更新事件,或拓宽视角。根据Spangher的说法,这项研究表明:“文章随着时间的推移而大幅增长,通常在两次草稿之间增长10%或更多;文章更新更有可能包含语录、事件和主旨信息;这些文章中的事件可能会发生变化和更新。”

这项研究进一步表明,在某种程度上,新闻文章的更新是可预测的。Spangher说:“要向社区证明这个数据集是可建模的,而不是完全不可预测的,向他们展示我们可以建立可以捕捉这些模式的模型需要很长的路要走。”这种可预测性表明,“这个数据集是一种很有前途的建模方法,可以用来研究新闻文章之间发生的变化过程。”

这篇论文被naacl22评为“资源贡献荣誉奖”,其最佳论文委员会表示,“这种新的资源可以促进自动修改文章的研究。”

减少人工智能语言模型中的性别偏见

人工智能越来越多地通过生成自然语言来与人互动,这使得理解和减轻人工智能可能引发的各种危害变得更加重要。

“当我们教计算机语言时,我们会使用人们在现实世界中所说的例子,”研究副教授说格雷格·弗·斯蒂格.”不幸的是,现实世界中有很多偏见,而计算机学会了模仿这种偏见。”

人工智能中使用的语言模型可能在很多方面存在偏见,包括毫无根据地将男性和女性与中性职业联系起来。为了解决这个问题,Ver Steeg和同事们使用反事实信息来训练他们的模型。换句话说,它们自动地生成和强加相同的事实,但性别角色颠倒了,这样模型就能接收到男女相同的输入Ver Steeg说:“系统能看到‘他是护士’的例子和‘她是护士’的例子一样多。”

在这篇论文中, Ver Steeg及其同事提出了他们的方法,并证明它可以大幅减少性别差异。此外,Ver Steeg强调了这项工作的重要性,“今天训练人工智能的方法主要集中在数学优化问题上,这并不一定能反映设计者的价值观。如果我们打算让人工智能造福社会,我们需要找到一种方法,让这些系统学习的东西与人类价值观相一致。”

一种改进的实体类型的新方法

助理研究教授陈慕浩在NAACL ' 22上发表了惊人的8篇论文和教程。其中包括这篇论文, Chen和合作者提出了一种新的实体类型化方法。

实体类型化任务为这是自然语言处理中一个基本且长期存在的问题。合著者李邦正解释说:“给定一个句子,这样的任务试图预测合适的单词或短语来描述上下文中提到的特定实体。例如,在'杰伦目前正在筹备他的09年春季系列,由YKK集团赞助,'实体' Jay '应该被标记为'人,' '设计师或'创造者而不是'组织或'位置“这项任务的关键挑战在于理解句子的上下文信息,这对人类读者来说很容易,但对机器来说很复杂。”我们的模型利用自然语言推理的力量来实现这一目标。”

研究人员从一个预先训练过的模型开始,该模型可以回答正确或错误的问题。然后,他们将实体类型问题重新定义为一系列对或错的问题,每个问题都询问候选单词或短语是否很好地描述了实体。使用这种方法来改进模型,研究人员在实体类型任务上取得了最先进的性能。

以下是接受USC ISI论文的完整列表:

归纳知识图完成的结构和文本
Elan Sopher Markowitz, Keshav Balasubramanian, Mehrnoosh Mirtaheri, Murali Annavaram, Aram Galstyan, Greg Ver Steeg。NAACL, 2022年。

通过反事实角色反转减轻提炼语言模型中的性别偏见
Umang Gupta, Jwala Dhamala, Varun Kumar, Apurv Verma, Yada Pruksachatkun, Satyapriya Krishna, Rahul Gupta, kaiwei Chang, Greg Ver Steeg, Aram Galstyan。NAACL, 2022年。

强大的对话代理对抗难以察觉的毒性触发
Ninareh Mehrabi, Ahmad Beirami, Fred Morstatter, Aram Galstyan。NAACL, 2022年。

口语理解的时间泛化
朱迪斯·加斯珀斯,阿诺普·库马尔,格雷格·弗·斯蒂格,阿兰姆·加尔斯廷。NAACL, 2022年。

基于自然语言推理的间接监督超精细实体类型化
李邦正,尹文鹏,陈慕豪。计算语言学学会会刊(TACL), 2022年。NAACL, 2022年。

阅读理解模型对实体重命名的鲁棒性研究
闫军,肖杨,Sagnik Mukherjee,林雨辰,贾斌,任翔。NAACL, 2022年。

统一语义类型与有意义标签推断
黄雅宇,李邦正,徐佳树,陈慕豪。NAACL, 2022年。

我们应该依赖实体提及进行关系提取吗?基于反事实分析的去偏关系提取
王义伟,陈慕豪,周文轩,蔡宇军,梁宇轩,刘大勇恒,杨宝松,刘俊成,胡布莱恩。NAACL, 2022年。

基于结构感知的等值学习的鲁棒(受控)表到文本生成
王飞,徐哲伟,Pedro Szekely,陈慕豪。NAACL, 2022年。

答案巩固:制定和基准测试
周文轩,宁强,Heba Elfardy, Kevin Small,陈慕豪。NAACL, 2022年。

DEGREE:一个数据高效的基于生成的事件抽取模型
徐毅宏,黄宽浩,Elizabeth Boschee, Scott Miller, Prem Natarajan,常凯伟,彭南云。NAACL, 2022年。

低流量电子商务商店中大规模语义匹配模型的增强训练数据
Ashutosh Joshi, Shankar Vishwanath, Choon Hui Teo, Vaclav Petricek, Vishy Vishwanathan, Rahul Bhagat, Jonathan May。NAACL行业跟踪, 2022年。

NewsEdits:一个新闻文章修订数据集和一个新颖的文档级推理挑战
Alexander Spangher,任翔,Jonathan May,彭南云。NAACL, 2022年。

信息提取的新前沿
陈慕豪,黄立夫,李曼玲,周本,纪恒,罗斯丹。NAACL教程, 2022年。

具有混合高阶近似的悬垂感知实体对齐
刘俊成,孙泽群,胡布莱恩,王义伟,刘大恒,杨宝松,肖晓奎,陈慕豪。NAACL的发现, 2022年。

GraphCache:作为句子级关系提取缓存的消息传递
王义伟,陈慕豪,周文轩,蔡宇军,梁宇轩,胡布赖恩。NAACL的发现, 2022年。

面向WinoQueer:在大型语言模型中开发反酷儿偏见的基准
Virginia K. Felkner, Eugene Jang, Ho-Chun Herbert Chang, Jonathan May。酷儿在AI工作室NAACL, 2022年。

库沙尔·舒拉,盖尔·卢卡斯,乔纳森·梅,乔纳森·格雷奇。NAACL的发现, 2022年

发布于2022年7月11日

最后更新于2022年11月11日

分享这个故事