大流行预测的下一步是什么?

| 2020年8月17日

bob国际首页登录南加州大学维特比研究人员回答有关他们独特建模工具的问题,并为未来的预测者分享建议。

维克多·Prasanna教授(左)和高级研究员Ajitesh Srivastava的预测模型正被美国疾病控制与预防中心用于帮助制定COVID-19政策。(图片来源:维克多·普拉萨纳)

维克多·Prasanna教授(左)和高级研究员Ajitesh Srivastava的预测模型正被美国疾病控制与预防中心用于帮助制定COVID-19政策。(图片来源:维克多·普拉萨纳)

今年初夏我们覆盖的工作维克多Prasanna他是Ming Hsieh电气与计算机工程系的Charles Lee Powell主席,也是南加州大学维特比高级研究员bob国际首页登录Ajitesh斯利瓦斯塔瓦他在Prasanna领导的数据科学实验室工作。他们两人在流行病预测方面拥有丰富的经验,已经开始使用他们的一些独特模型来增进我们对COVID-19传播方式的理解。现在,两个月后,他们在模型中添加了更多的功能,并开始与疾病预防控制中心密切合作,制定新的策略。

下面,Srivastava回答了一些关于他们的工作、预测的重要性和挑战,以及他们计划的COVID-19研究下一步的问题。


你多年来一直致力于流行病预测。为什么这是抗击流行病如此重要的一部分?

预测是资源管理和政策制定的一个重要方面。当大流行迅速传播时,最大的挑战之一是它给毫无准备的卫生保健系统带来的压力。由于医院人满为患,无法提供适当的护理,死亡率上升得更多。这就是今年早些时候在纽约发生的事情。这种病毒在那里比现在的加州更致命,尽管加州今天有超过50万例病例。

通过观察受灾较早的地区,科学家利用预测工具预测其他地区的严重程度,并在最严重的袭击发生之前做好准备。由于封锁等决定会影响经济,政策制定者必须考虑对公共卫生、医疗保健系统和经济的影响。


您的预测工具因其特别快速和适应性而脱颖而出。自今年早些时候发射以来,又增加了哪些新参数来进一步提高其能力?

我们增加了县级的预测,现在可以公开获得。除了提供阳性病例的预测外,我们还预测了自6月以来的死亡人数。我们还对算法本身做了一些调整,这使我们能够更快地进行预测。现在,我们可以在25秒内对3000多个美国县进行训练和预测。快速预测对于在不同的“假设”场景下运行算法非常重要。比如,“如果目前的趋势继续下去,三个月内我们会有多少人感染”,或者“如果我们实施一个月的封锁,并在接下来的两个月部分重新开放会怎样”。

我们甚至不需要任何昂贵或最先进的设备。我是在家里的一台旧回收台式机上运行这些预测的!


你现在每周与CDC分享你对美国每个县和州的预测。你的预测是否直接导致了政策或行为的改变?

我们不应该独占功劳。我们是“预测中心”的一部分,其中包括来自15-20个其他团队的模型。根据所有团队的预测,疾病控制与预防中心生成报告,描述我们在不久的将来可能走向何方,以及哪些州可能出现严重的爆发。6月中旬,预测显示,由于许多州部分开放,病例数迅速上升。7月,许多州恢复了更严格的保持距离规定。我们不能肯定地说,这些决定直接是因为我们的预测,但它们之间是有关联的!


你还参加了与疾病控制中心官员和全国各地的其他预报员的定期会议。在这些谈话的基础上,你能分享一下下一步的想法吗?

与疾病预防控制中心的会议无疑推动了我们的一些预测决策。我们之前每天都报告未来的预测,但根据他们的建议,我们改为每周报告一次。我们认识到,对日预报进行评估并作出合理的结论是困难的。疾控中心的另一个影响是产生县级预报。虽然我们已经计划了一段时间的县级预测,但我们开始在疾病预防控制中心的要求下生成它们。你可能听说过一些正在计划中的大规模疫苗试验。由预报中心提交的县级预报指导这些试验应该在哪里进行。

我们还了解到,在全国范围内,如果可能的话,在全世界范围内,建立一个更加标准化的数据报告系统将是有帮助的。非标准化的数据报告使得在不同地区之间进行预测和比较变得困难。作为研究人员,我们需要帮助找到更好地解决这个问题的方法。


一段时间以来,您一直在为预测工具稳步添加新功能。接下来你想补充什么?

你很快就会看到一个关于假设场景的更新。我们可以使用我们的模型来回顾过去,以衡量哪些封锁和隔离措施最有效。当然,我们也可以用同样的方法来衡量哪些区域战略是最无效的。然后我们可以根据这些最好和最坏的情况进行预测。我们已经在我们的公共存储库中生成了这样的场景。你可能会在本月晚些时候的互动网页上看到这个功能。最终,我们将添加更多用户可以在线探索的场景。对住院情况的预测也在考虑之中。

我们也一直致力于为洛杉矶的社区提供预测,希望本月能在我们的互动页面上公开。最后,我们正在研究不同类型的企业如何影响病毒的传播。


在技术和/或战略上,你对未来研究流行病预测模型的工程师有什么建议?

依靠你对情况的细微差别的理解,但也要保持简单。媒体喜欢用“人工智能解决了”一个问题或“人工智能失败了”之类的大标题。现实情况是,用人工智能/机器学习解决问题可能有10亿种可能的方法,但可能只有少数几种是好的。这取决于人类科学家做出正确的决定,并最终得到一个“好的”解决方案。

具体到流行病预测时,保持简单尤为重要。

是的,通过引入更多的未知数使模型变得越来越复杂,我们可以拟合任何数据。但由于我们所说的“过拟合”,这些模型在长期预测方面表现不佳。在最近的一篇论文中,我们将在即将到来的会议上分享知识发现(KDD)会议,我们展示了过于复杂的模型如何适合大量数据,但实际上从未了解到真正的值,因此永远不会产生正确的预测。

简单性也是使算法运行更快的关键。当然,为了探索数千个县的许多情况,预测需要快速。但是速度对于测试和调试同样重要。想象一下,如果不是25秒,而是25秒小时得到结果。然后,如果您意识到结果没有意义,则需要重新运行所有内容!


探索团队的国家和州级预测通过他们的交互式web界面。

发布于2020年8月17日

最后更新于2020年8月17日

分享这个故事