疫苗犹豫存在于哪里?南加州大学人工智能研究人员可以实时预测邮政编码级别

| 2022年5月16日

在衡量公众意见方面,新的软件可以胜过地方和全国的调查数据。

注射器和疫苗瓶

图片来源:Thirdman/Pexels

“疫苗犹豫”一词几乎出现在围绕COVID-19、其最新变种和疫苗研发进展的每一次对话中。几乎很难想象有一天这样的话题不会出现在午餐时的闲聊和我们清醒时的想法中。

随着新的变种不断出现,疫苗犹豫的现象只会变得越来越强大,并在美国各地的社区中出现。但在公共卫生官员能够了解和参与这些社区之前,他们必须首先解决一个初始问题:如何有效地确定大规模疫苗犹豫个体社区的居住地点。

一篇新论文发表在公共科学图书馆数字健康,南加州大学维特比工程学院的研究人员提出了bob国际首页登录一种自然语言处理(NLP)软件,可以实时了解对疫苗的怀疑态度。

南加州大学信息科学研究所(ISI)工业和系统工程研究助理教授、研究团队负责人Mayank Kejriwal受到了目前在预测疫苗犹豫方面的不足的启发。该软件对NLP策略进行了改进,包括检测疫苗相关关键字的词嵌入算法。这些进步使得邮政编码级疫苗犹豫的数据收集非常简单、快速和准确。

该研究的系统使用公开的推特数据和现有的机器算法来处理这些数据,在反映公众对COVID-19疫苗的意见方面胜过了地方和国家的调查数据。

并非所有的数据都是平等的

南加州大学维特比工程学院计算机科学硕士研究生、ISI研究助理Sara Melotte评论了该研究获取此类数据的指标,以及bob国际首页登录它如何进一步实现在社区层面上进行此类预测的目标。

Melotte说:“我们证明,只有文本推文和标签足以以合理的准确性预测邮政编码级别的疫苗犹豫,即使这些推文并不都与COVID-19大流行有关。”

它还消除了调查中固有的偏见的可能性,当人们知道他们的个人信息正在被收集时,这是一个不可避免的后果。事实上,该算法不需要额外的个人信息,也不需要阻止人们表达纯粹的观点。

“从历史上看,很多事情都取决于调查。当你看到民意调查数据时,这些数据是由调查收集的,这很昂贵。”不仅成本成为限制因素,而且及时性和不断变化的意见使获取准确和最新数据的问题进一步复杂化。

凯杰里瓦尔说:“通常情况下,我们必须等待调查结果出来,到那时,已经太晚了。”“但我们证明,你可以使用公开的Twitter数据,并使用程序将其提取出来,”并实时获得结果。

该模型在真实词汇直觉的指导下,还使用外部数据作为来源,例如附近的医院或科学机构的数量。Kejriwal说:“我们调查了使用这些独立的特征集在多大程度上有助于改进模型。”

然而,收集此类数据的一个注意事项是,各州和城市的不同法规限制了公共信息的可用性。尽管如此,这项研究提供了可靠的方法和数据来预测大城市(推特交通繁忙地区)的疫苗犹豫,这些方法和数据可以使用独立的调查数据进行复制和确认。

政策制定者的工具

这项研究为当地社区、公共卫生专家和政策制定者提供了发现和解决对疫苗保留意见的补充来源。在为时已晚之前,制定有利于最需要的社区的政策的工具。

Melotte继续说道:“我们提供了一个早期预警系统。

从历史上看,联邦政策往往忽略了每个社区组成和历史背景的细微差别。这导致了人们对联邦机构及其衍生政策的不信任。Kejriwal强调了利用这项研究的方法,以社区驱动的、自下而上的方式帮助恢复这种信任的重要性。

Kejriwal说:“我们可以帮助社区制定地方政策,帮助他们做出自己的决定,从而促进信任。”阐明疫苗不情愿突出表明需要重新考虑当前和广泛的疫苗政策方法。这种从新的角度处理情况的尝试有助于创建更有机的解决方案,以满足每个社区的需求。

如果疫苗的不确定性在强度和邮政编码方面波动,政策和资源可以适当地重新评估和修改疫苗管理和传播方法。

凯杰里瓦尔说:“对于任何公共卫生危机,社交媒体上总会有信号。”“这项(研究)是一个机会,因为它是一个活生生的记录,可以为我们在任何公共卫生危机中获取信号提供蓝图。”

出版于2022年5月16日

最后更新于2022年5月16日

分享这个故事