“维特比与大流行病”第六讲:向疾控中心预测COVID-19

| 2020年10月23日

bob国际首页登录南加州大学维特比数据科学家帮助决策者超越数据迷雾,提供更好的大流行预测和拯救生命

(艺术/ SHUTIANYI李)

(艺术/ SHUTIANYI李)

“疫情什么时候结束?”is the trillion-dollar question of 2020.

数据科学家已经成为我们所依赖的不太可能的英雄,至少是对答案的暗示。他们的波浪形COVID-19模型展示了病毒轨迹的“最佳”和“最坏”情况,在新闻报道中随处出现,在新闻发布会上也出现在州长身后的屏幕上。但随着图表变得越来越复杂,病毒激增和消退,有一件事变得越来越清楚:冠状病毒模型不是水晶球。那么,它们有什么好处呢?

南加州大学维bob国际首页登录特比教授登场了Vasilis Marmarelis维克多PrasannaAjitesh斯利瓦斯塔瓦

他们明白,从大量复杂的数据到准确可靠的流行病预测,不仅关乎选择或开发正确的模型,还关乎人工智能应用中数据预处理、模型简化和可学习性的许多决策。换句话说,这些模型越容易阅读和解释,决策就越好,拯救的生命就越多。

10月15日,院长生物医学工程教授,南加州大学生物医学工程学院创始人Marmarelis生物医学模拟资源,他和Prasanna一起,担任Ming Hsieh电气与计算机工程系工程系主任的Charles Lee Powell数据科学实验室;数据科学实验室的高级研究助理斯里瓦斯塔瓦就决策者如何利用各自开发的新方法克服流行病预测的挑战进行了演讲。

今年秋天,在美国国家工程院(NAE)呼吁工程师“众包并集体集思广益针对COVID-19的工程解决方案”之后,南加州大学维特比将提供“维特比与大流行病!bob国际首页登录这是南加州大学维特比分校的新系列讲座,旨在全面提供一个bob国际首页登录以工程为中心的框架,以应对和理解大流行。

在为期10周的免费课程中,学生们将接触到无数的主题,从通过定向进化估算风险和蛋白质工程,到计算机科学和电气工程学院在自动化人类安全技术、检测错误信息和数字接触追踪方面所做的贡献。一到两个小时的课程在周四下午6点举行。

我们采访了马尔马雷利斯和斯里瓦斯塔瓦,当时他们正在结束“维特比vs.流行病”的虚拟讲座,回到他们及时的研究工作中。


对于那些错过的人,你能简单地总结一下你的演讲吗?

(V.M.)我在演讲中使用了意大利数学家雅格布·里卡蒂(Jacopo Riccati)在三个世纪前提出的一个数学方程,描述了一个孤立社区(我们称之为“感染池”)内感染过程的时间过程,提出了一种自适应统计方法,从时间序列数据中提取出可能的“级联感染波”。这是通过多个相互关联的感染池发生的,其中每个感染波由一个里卡蒂方程(模块)表示,其系数由数据自适应估计。提取的连接或链接的Riccati模块构成了感染过程动力学的预测模型,并对其时间过程进行了深刻的分解。我们将这种方法应用于美国每日确诊的COVID-19病例的时间过程,并揭示了一些有用的见解和可操作的预测,以帮助决策者进行决策过程。

(促销)我们讨论了从数据到预测的挑战,并强调“建模”只是生成预测的一小部分。我提出了“学习”中的一个基本问题,即是否可以从给定的数据中可靠地学习模型的参数。我介绍了一种建模方法,它可以捕获各种复杂性,并在数学上进行简化,以确保可以可靠地学习模型。由此,我证明了数据预处理中的简单决策可能比建模本身的选择具有更高的影响。


为什么这项研究很重要?它将如何帮助抗击COVID-19?

(V.M.)在我们说话的时候,它可以成为制定政策的决策者手中非常宝贵的资源。它还可以揭示有关应用政策的流行病进程动态结构的宝贵见解,例如某些政策是否比其他政策更有效。它还提供了一种定量工具,用于比较不同国家、美国各州或地方社区的流行病时间过程的结构分解与其政策的关系。

(促销)预测是资源管理和政策制定的一个重要方面。随着在流行病预测方面出现大量研究,了解哪些决策会产生良好的预测并定期与他人的预测进行比较是至关重要的。维克多·普拉萨纳教授和我每周都会与疾控中心开会,还有30多个研究团队,他们正在向疾控中心提交预测报告。疾控中心根据这些预测生成报告,描述我们在不久的将来可能会走向何方,以及哪些州可能会出现严重的疫情爆发。这些预测也被用于计划疫苗试验。


你如何将你的研究与类似的研究进行比较?

(促销)许多建模策略试图通过复杂的模型进行预测,这些模型可能涵盖大流行的许多方面。这种模型容易过度拟合,也就是说,它们可以很好地拟合先前看到的数据,但可能无法产生准确的预测。相反,我们从一个复杂的模型开始,并简化它,以确保我们避免过拟合。在用于为cdc生成预测的许多不同方法中,我们观察到,与复杂的模型相比,简单的模型确实表现得最好。

(V.M.)这是一种与常用的方法完全不同的方法,后者主要是sir类模型的变体,大约在一个世纪前首次引入,并用于特定目的的各种复杂形式,或线性自回归型模型。


就你的工作而言,接下来的步骤和/或里程碑是什么?

(V.M.)我们希望分析来自多个国家或美国各州的数据,并将结果与各自适用的政策进行比较。未来的一个重要延伸还涉及到每个国家的“确诊COVID病例”和“确诊COVID死亡”之间的动态关系,作为衡量各自卫生保健系统有效性的定量指标。

(促销)我们正在为人工智能-机器学习社区构建一个平台,这样就可以对预测方法进行适当的比较,并获得见解,以了解有关建模和其他影响准确性的关键决策。


跟我们说说你的合作者吧。你们觉得远程工作怎么样?

(V.M.)我期待在不久的将来有更多的合作。到目前为止,这项工作是在老式的“单独研究”传统下完成的,偶尔与同事讨论一般相关问题。

(促销)对我们来说,与疾控中心的定期会议让我们在预测需求和评估指标方面保持正轨。


你能分享一个封锁期间你生活中的故事吗?它对你的工作和家庭有什么影响?你在做什么来保持理智?

(V.M.)我和我的家人很感激能保持安全,享受彼此的陪伴。在家工作时,我们会就广泛的问题进行多次热烈的讨论。我发现,创造性的工作是缓解这种自我强加的“在家监禁”压力的最好办法。一个有趣的历史笔记:艾萨克·牛顿在他那个时代的英国鼠疫期间发明了“微分学”。我一直对这样一个事实感兴趣:即使在可怕的情况下,这种大流行病当然属于这种情况,一些“好的”发展也会实现,因为只要我们保持安全,我们内在的创造力就会受到刺激,以对抗强加的压力。

(促销)我很幸运,我的工作没有像其他工作那样受到大流行的影响。虽然虚拟工作确实节省了时间,但也会对健康产生负面影响。为了在被限制呆在家里的同时确保理智和健康,我在后院建了一堵12英尺高的可调节的独立攀岩墙。在炎热的八月里做如此艰巨的任务是否意味着头脑清醒还有待商榷。


你认为这种病毒或整个大流行最令人惊讶或最违反直觉的方面是什么?

(V.M.)我观察到的最奇特(在很大程度上仍无法解释)的现象之一是“快乐低氧血症”,它导致许多不幸的COVID住院患者死亡,尤其是在大流行的初始阶段。正常情况下,血氧的下降会启动几种自动调节或稳态机制,而在一些严重的COVID病例中,这些机制似乎没有被激活。我正在研究这个有趣的问题,在我的其他研究活动,有关内稳态心肺调节组织氧合。


如果你只能分享一张幻灯片,你会选择什么,为什么?

(V.M.)下图显示了从2020年3月11日到2020年10月14日,美国COVID每日病例的时间过程分解为7个感染波。该图显示了在5月中旬前3波感染之后(图中约为第70天)过早和迅速取消缓解政策的严重影响。请注意在第130天左右出现的两个较大的组件,以及由此引起的图右侧的两个仍在上升的组件。

Vasilis Marmarelis提供

(促销)我最喜欢的幻灯片是“应用医学硕士的颂歌:许多人可以适应,一些人可以预测,很少/没有人揭示真相”。一种方法可以很好地符合过去的情况,但却无法准确预测。另一方面,一种预测准确的方法并不一定意味着它能够正确估计一些潜在的事实。在应用人工智能/机器学习中,必须明确使用算法拟合、预测和正确估计潜在真相之间的区别研究。

由Viktor Prasanna和Ajitesh Srivastava提供

相关论文:

Ajitesh Srivastava, Tianjian Xu和Viktor K. Prasanna,“使用SIkJalpha模型快速准确地预测COVID-19死亡人数”。预印:https://arxiv.org/abs/2007.05180

Ajitesh Srivastava和Viktor K. Prasanna,“数据驱动的COVID-19未报告病例数识别:界限和限制”。ACM SIGKDD知识发现和数据挖掘会议,健康日跟踪(KDD 2020)。https://arxiv.org/abs/2006.02127

Ajitesh Srivastava和Viktor K. Prasanna,“学习预测和从COVID-19大流行中学习预测”。预印:https://arxiv.org/abs/2004.11372

Vasilis Z. Marmarelis "美国Covid-19数据的预测建模:自适应相空间方法

2020年10月23日出版

最后更新于2020年10月26日

分享这个故事