COVID-19 疫情发展的状态评估与预测分析
2020 年 2 月 17 日
北京航空航天大学复杂数据分析研究中心 2020年02月17日
北京航空航天大学学术委员会副主任、经管学院学术委员会主任、致真书院院长王惠文教授,曾任民建北京市委副主委,主要从事经济管理中复杂数据统计分析的理论、方法与应用研究。在这场抗击COVID-19 疫情的战役中,她带领团队的老师和学生在另一条战线上,也在共同奋斗,努力贡献自己的力量。
王惠文团队从大年二十九到今天,专注地做了一件事,就是每天收集和分析关于 COVID-19 疫情的数据和信息。在此期间,通过持续的数据跟踪与分析,他们初步了解到了一些疫情发展的特征与规律,也收获了很多新的知识和感悟。最终形成上报了 20 多个提案,提交了5 篇研究报告。本文是王惠文、卢珊老师和张严文、吴祁颖同学主笔的若干研究报告的综述性简介。
2020 年 2 月 17 日,这是学校原定寒假结束后上班的第一天。放假前曾经计划了许多假期想做的事情,然而从大年二十九到今天,我们实验室的老师还有许多同学们却一起专注地做了一件事,就是每天收集和分析关于 COVID-19 疫情的数据和信息。在此期间,通过持续的数据跟踪与分析,我们初步了解到了一些疫情发展的特征与规律,也收获了很多新的知识和感悟。
在抗击 COVID-19 疫情期间,总是有朋友问:什么时候后能到“拐点”,什么时候抗疫形势会出现转折?这启发我们去思考和探讨:究竟什么是“拐点”,用什么指标去测量和观测它(们)?一场疫情发展的全过程可以划分成几个基本阶段?我们现在正处于那一个阶段之中?
本文试图通过对数据的观察和分析来解释上述问题。但需要说明的是,从 COVID-19 疫情爆发至今,各地区的疫情发展阶段不同,而湖北地区的情况比较特殊。由于篇幅所限,本文将重点对全国(除湖北)的 30 个省市的情况进行讨论。下面,我们将在第一节简要介绍对疫情防控全过程的阶段划分方法;在第二节,通过对实际数据的观察,说明全国(除湖北)地区目前所处的是哪一个阶段,并对其未来发展进行预测分析;在第三节,我们将进一步对一些重点地区的情况进行分析;最后在第四节,给出了全文的总结。
一、疫情防控全过程的阶段划分方法
为了运用统计分析方法来研究疫情发展的状态和过程,我们主要采用了国家每日公布一些基础数据,例如:当日新增确诊人数、当日新增出院人数、当日死亡人数等,并由此计算“当日在院治疗人数”:
当日在院治疗人数= 当日累计确诊人数–当日累计治愈出院人数 – 当日累计死亡人数 结合 SARS 时期的研究经验我们发现,一场大规模流行病的疫情发展过程可以被划分为 4 个阶段,即:爆发期、受控期、缓和期、收敛期。
“爆发期”通常是在流行病爆发的初始阶段。由于社会系统对疫病的认识不充分,社会的反应和动员过程存在一定的时滞,因此这时的疫病防控能力较低,传染率很高,每日新增确诊人数的增加速度非常快,累计入院的患者人数会呈现指数增长的态势。
经过爆发期的震撼,社会管理系统开始积极反应,通过采取一系列紧急措施,快速建立了疾病防控体系,使得每日传染率出现明显下降,于是每日新增确诊病例也开始下降。所以在疫情防控过程中,一旦形势有所好转,我们将首先会看见第一个拐点的出现,即:“新增确诊人数”指标从爆发期快速上升后达到峰值,而后进入下降通道。所以,第一拐点的出现,意味着是 “爆发期”结束的时刻。这是一个十分积极的信号,表示政府公共卫生管理措施明显见效,疫情已经进入“受控期”。不过,由于此时治愈出院的人数还比较少,所以每日在院治疗的人数还会继续增加一段时间。
随后,即将出现的是第二个拐点,即:“每日在院治疗人数”指标达到峰值后开始下降。这时,治愈出院人数的增长速度已经大于新增确诊人数的增长速度,整个疫情形势开始进入“缓和期”,全社会具有传染能力的人群基数不断缩小,医疗资源的压力也将得到明显的缓解。再接下来,还将相继出现两次“零点”现象。第一次,是社会上的新增病例出现“零报告”。这时,除医院外,整个社会的防控工作压力基本解除,抗疫工作将进入“收敛期”;而第二次“零点”到达的时刻,是指在院治疗人数等于零(或者还有少部分人正在康复中)。至此,疫情基本结束,可以解除警报。
综上所述,我们提出在划分爆发期、受控期、缓和期、收敛期的时候,有 4 个“里程碑”的观察点,即上面所说的:“两个拐点”和“两个零点”。其中,“第一拐点”是新增确诊人数达到峰值后开始下降,意味着公共卫生防控措施初见成效,疫情已脱离爆发期进入受控期;“第二拐点”是在院治疗人数达到峰值后开始下降,疫情进入了缓和期;“第一零点”是指新增病例的零报告,全社会可以恢复正常的生产生活;而“第二零点”是指在院治疗人数等于零,疫情结束。(具体划分方法,请参见表 1)
阶段划分 | 爆发期 | 受控期 | 缓和期 | 收敛期 |
该时期开始的 | 新增病例 | 新增病例 | 在院治疗人数 | 新增病例 |
该时期结束的 | 新增病例 | 在院治疗人数 | 新增病例 | 在院治疗人数 |
二、全国(除湖北)地区的抗疫阶段分析与预测
下面,首先根据 2020 年 1 月 22 日至 2 月 15 日国家公布的数据,来观察和分析全国(除湖北)地区的 COVID-19 疫情目前正处于哪一个阶段。如上所述,在疫情的爆发期,最典型的特征是新增确诊病例数量急速增加,累计确诊病例数量呈现指数增长趋势。这种指数曲线的特点是,一开始看起来比较平缓,而一旦越过“奇点”之后,每日新增确诊病例的数量就会飙升,因而对医疗资源的需
求每日剧增,防疫斗争也将变得极其艰难。爆发期结束的标志性特征,是达到了“第一拐点”。根据实际数据报道,我们在2020 年 1 月 30 日就观察到,全国(除湖北)地区的新增确诊人数达到峰值,之后连续两天持续下降。后来,因为受节后复工的影响,自 2 月 2 日起,每日新增确诊人数又出现小幅波动,但随后很快又开始持续下降。由此可以判断,从 2020 年 1 月底开始,全国(除湖北)地区疫情已经脱离爆发期和进入了受控期,第一阶段抗疫工作已初见效。(参见图 1)
图 1 全国(除湖北)新增确诊人数的观测数据
接下来,继续观察“第二拐点”是否到来。这时,重点要观察的现象是:“在院治疗人数”是否达到峰值后进入下降通道。从全国(除湖北)地区 2020 年 2 月 11 日的数据可以观察到,当日在院治疗人数已经达到了峰值,之后开始平稳下降(参见图 2)。由此可以判断,该地区已越过了“第二拐点”进入缓和期,抗疫形势实现了关键转折。
图 2 全国(除湖北)地区的第二拐点的观察数据
利用全国(除湖北)地区的现有数据,我们还可以对“第一零点”和“第二零点”这 2 个里程碑时间点进行预测建模。从目前的预测结果来看,如果这些地区能持续保持现有防疫力度,则预计在 3 月初就可以看见“第一零点”,实现新增病例零报告,因而可以恢复正常的生产生活;不过,届时在医院治疗的病人数量还比较大,只要切实保证不再出现大规模的院内感染,以及不出现医院的感染源再次输入社会,则大约在3 月中旬左右,有望看见“第二零点”,这些地区的疫情可基本结束。
图 3 全国(除湖北)地区疫情发展阶段的模拟预测分析
三、重点地区的抗疫形势分析
为了进一步了解各地区抗疫形势的具体状况,我们采用 2020 年 2 月 11 日到 2 月15 日的数据,以“在院治疗人数 5 日均值”为横轴,以“新增确诊人数 5 日均值”为纵轴,绘制了全国(除湖北)的 30 个地区的散点图(参见图 4)。
图 4全国(除湖北)在院治疗人数 5 日均值—新增确诊人数 5 日均值的散点图
从图 4 可以看出,除湖北外,全国防控任务最为艰巨的 6 个地区分别是广东、浙江、河南、湖南、安徽、江西;事实上,这些重点地区的抗疫形势的走向,会在很大程度上决定全国(除湖北)地区的工作局面。因此,我们来看一下这 6 个重点地区的新增确诊人数和当日在院治疗人数的动态趋势图(分别参见图 5 和图 6)。从图中可以看到,这 6 个重点地区都已经先后达到了第一拐点和第二拐点,这也从微观数据上印证了我们在第二节所得到的结论。
图 5 6 个重点地区的新增确诊人数
图 6 6 个重点地区的在院治疗人数
此外,如果再仔细观察图 4 还可以看出,山西、甘肃、辽宁、吉林、内蒙、宁夏、新疆、西藏、青海等地区的患者基数较小,并且近五日内新增确诊人数的平均值小于 5人,已经可以考虑恢复正常的经济社会生活。
四、小结
本文利用国家每日公布的数据信息,把疫情发展的全过程划分为 4 个阶段,即:爆发期、受控期、缓和期、收敛期。同时,指出有 4 个“里程碑”的观察点,它们分别是两个拐点和两个零点。其中,“第一拐点”是新增确诊人数达到峰值后开始下降,意味着政府防控措施初见成效,疫情已脱离爆发期进入受控期;“第二拐点”是在院治疗人数达到峰值后开始下降,疫情进入缓和阶段;“第一零点”是指新增病例的零报告,全社会可以恢复正常的生产生活;而“第二零点”是指在院治疗人数等于零,疫情结束。
通过对现有数据进行观察可知,自 2020 年 1 月 30 日开始,全国(除湖北)地区的每日新增确诊人数就开始下降;随着治愈出院人数的不断增加,在 2020 年 2 月 11日,该地区的当日在院治疗人数达到峰值后也开始下降。各方面数据都可以显示,这些地区的抗疫工作已经取得显著成效。而根据现有数据进行预测建模,预计大约在 3月上旬,会出现新增病例的零报告;然后,大约在 3 月中旬左右,疫情有望基本结束。
需要说明的是,由于没有收集到详细的“疑似病例”排查的数据系列,所以本文仅仅使用了每日新增确诊人数的指标。不过,我们曾经考虑过最坏的假设,把所有的每日疑似病例都放到每日确诊人数中。而尽管如此,有关第一拐点、第二拐点以及第一零点的分析结论都没有太大的变化。只是由于届时住院人数太多,要达到第二零点,大约需要到 5 月上旬了。当然,如果医院管理和诊疗水平很高,一方面绝对不再出现院内感染,另一方面患者治愈出院的速度进一步提高,那么疫情结束的时间还将提前。
还特别需要强调的是,在疫情发展的四个阶段中,所谓的“拐点”的出现,只意味着抗疫形势出现了转折,但并不意味着“安全点”的到来!因为这时候恰恰是住院人数的高峰时期,并且每日还会有相当数量的新增病例。所以抗疫工作依然不能放松警惕,一定要谨防传染率有再次走高的风险。
从本文分析中还可以看到,比如山西、甘肃、辽宁、吉林、内蒙、宁夏、新疆、西藏、青海等地,这些地区的患者基数小,而且近五日内新增确诊人数的平均值已经小于 5 人,因此可以考虑恢复正常的生产生活秩序。同时也建议国家在继续做好密切监测和防控措施的基础上,指导各地区分期、分批地恢复社会经济活动,从而更好地实现今年的经济社会发展目标任务。
最后,还希望借此机会,衷心感谢我们团队所有的老师和同学们!在这场抗击COVID-19 疫情的战役中,大家在另一条战线上,也在共同奋斗,努力贡献自己的力量。到目前为止,我们团队的老师和同学们已经通过各种渠道上报了 20 多个提案,提交了5 篇研究报告。这篇文章则是王惠文、卢珊老师和张严文、吴祁颖同学主笔的若干研究报告的综述性简介。
责任编辑:刘海梅