利用国际疫情数据的统计规律来解读中国数据合理性

王惠文 刘正闫    2020年05月20日

字体大小:

  Covid-19疫情在全球迅速蔓延以来,国际上一些政客因为本国的抗疫失败而操纵舆论和无端指责中国,其中就有人宣称中国的累计确诊人数、病亡人数以及病亡率都应该远大于目前统计报道的数据。为此本文提出:应该从国际数据的统计分析出发,探讨影响抗疫成效的主要因素,并从世界主要国家数据所反映出来的一般规律,来论证中国统计数据的合理性。

  数据的选取和疫情“拐点”的定义方法

  人们通常认为,一个国家的经济越发达、医疗资源越充裕,就会更有能力应对疫情,从而降低疫情引发的死亡率。然而从国际抗疫斗争的实际情况来看却并非如此,一些医疗条件十分优越的西方国家,其病亡率却位列全球最高。实际上,由于COVID-9疫情的传染性非常强,有效防控的窗口期很短,所以一旦拖延了宝贵的防控时机,这些国家的医疗资源就会很快告罄。本文选取了15个在5月初已经基本达到疫情拐点的重点国家数据进行分析,研究结论表明:各个国家的累计确诊人数和病亡率,是与其达到疫情拐点所需要的时间是强相关的。举例而言,在本文选取的15个已经达到疫情拐点的国家中,意大利、法国、西班牙等国由于防控策略不当,严重拖延了到达拐点的时间,从而造成很高的疫情峰值和不堪重负的医疗救治压力。因而,即便它们现有的医疗资源十分优越,但是也没能避免医疗系统被击穿,从而造成严重的病亡状况。

  在此次全球的抗疫过程中,人们普遍都在关心的一个问题是:疫情的拐点时刻何时会到来,因为拐点就意味着整个抗疫形势的转折点。然而目前看来,在医学统计学和流行病学中并没有关于“拐点”的明确定义,各国政府部门和研究人员所使用的指标也不尽相同,其中包括:新增确诊人数、累计确诊人数、死亡人数、重症病例数、ICU床位数等等。而笔者认为,观察疫情拐点最简单和合理的指标是“现有确诊人数”,因为一个地区现有确诊人数的下降,意味着整体的传染基数人群开始减少,疫情进入收敛阶段;而且至此之后,医疗资源压力会明显缓解,全社会也可以开始考虑为恢复生产生活秩序做出规划。因此,本文将现有确诊人数达到峰值的时刻称为疫情的“拐点时刻”,把到达到峰值所需要的时间称为“拐点周期”。相关概念的具体定义如下所示:

   ·现有确诊人数=累计确诊人数-累计治愈人数-累计病亡人数
   ·病亡率=累计病亡人数/累计确诊人数
   ·疫情峰值:某地区的现有确诊人数所达到的最大值
   ·拐点周期:某地区现有确诊人数从起点到达峰值所需要的时间

  截止当前,由于许多国家的疫情还处于持续上升阶段,其数据还没有达到比较稳定的状态,还很难判断其疫情防控成效的基本状况,所以本文选择了15个已基本达到或越过疫情拐点的、比较有代表性的国家作为样本点进行分析,其中包括:英国、法国、意大利、西班牙、德国、瑞士、澳大利亚、新西兰、土耳其、奥地利、伊朗、日本、韩国、泰国以及中国。

  由于目前各国的疫情发展阶段不同,直接比较它们当前的数据是不合理的。为此,本文统一采用峰值时刻的数据进行国际比较,其中包括:疫情峰值、拐点周期、峰值时刻的累计确诊人数,以及峰值时刻的病亡率等。论文研究指出:此次COVID-19疫情的防控效果主要与各国防控策略的有效性是极其相关的,具体反映在统计指标上,就是该国达到拐点所需要的时间(简称:拐点周期)。也就是说,一个国家或地区的拐点周期越长,其累计确诊人数和病亡人数就会越多,而且其病亡率也会越大。下面,我们就将从这15个国家的实际数据出发进行分析,并重点观察中国统计数据在其中的基本状态。

  累计确诊人数与拐点周期之间的关系

  我们首先分析和比较了15个国家的拐点周期与峰值时累计确诊人数这两个变量之间的关系,它们的Pearson相关系数很高,达到0.835。而且从图2可以明显看出,除日本的拐点周期较长、但峰值时累计确诊人数很少之外,其他所有国家的数据基本都在对角线上;如果删除日本的数据,拐点周期与累计确诊人数的Pearson相关系数可以高达0.949。

拐点周期与峰值时累计确诊人数之间的关系

图1:拐点周期与峰值时累计确诊人数之间的关系

  从图1中可以看出,英国、意大利、法国、西班牙这4个国家的拐点周期最长,同时在峰值时期的累计确诊人数也最多。由此可见,这些国家正是由于防控策略迟迟不到位,疫情蔓延态势拖延的时间过长,才造成本国超大规模的累计确诊人数。

欧洲五国的现存确诊人数的时间序列数据比较

图2:欧洲五国的现存确诊人数的时间序列数据比较

  将英国、法国、意大利、西班牙的现存确诊人数的时间序列数据与德国进行对比,在图2中可以看出,德国早期的现有确诊人数甚至高于同时期的法国和英国,这说明早期德国的传染率高于这两个国家。然而正是由于德国很快就达到了疫情峰值,其拐点周期要远小于这4个国家,结果德国的累计确诊人数也远远少于这些国家(可参见图2中德国的位置)。

  在图1中,中国数据的位置是在对角线上的。也就是说,按照国际数据的统计规律,中国的拐点周期与累计确诊人数是完全相匹配的,并且也十分明晰地反映中国抗疫斗争的特点以及抗疫策略的成功之处。事实上,中国恰恰是因为及时采取了武汉封城的措施,而与此同时全国各地在积极防控疫情的过程中全力驰援武汉,才有效地缩短了各地区到达疫情拐点的周期,极大地压低了疫情峰值和总的累计确诊人数。

  病亡率与拐点周期之间的关系

  在COVID-19的抗疫过程中,各国的病亡率差异极大,而对其影响因素的研究也是一个令人关注的问题。面对类似COVID-19这样烈性传染病,简单去比较相关国家的医疗资源条件,是很难解释其死亡率状况的。

  为了探索这个问题,本文进一步分析了拐点周期与病亡率的相关关系。在图4中可以看出,一个国家在峰值时刻的病亡率是与拐点周期强相关的,其Pearson相关系数为0.881。这其中,还是日本的情况比较例外,其峰值周期很长,但病亡率却非常低,这与其保持了很低的累计确诊人数是直接相关的。而在图3中,如果删除日本的数据,则峰值周期与病亡率的Pearson相关系数可以高达0.95。这也表明:一个国家到达疫情拐点所需要的周期越长,往往疫情的峰值就会越高,医疗机构超负荷的艰难时刻就会越持久,而为此所付出生命代价也会越大。从数据中也可以看到,在欧洲国家中,由于德国、瑞士、奥地利等国的拐点周期明显较小,因此其病亡率均显著小于英、法等国。

  在图3中,中国的数据依然是处在对角线上,完全符合各国抗疫成效的统计规律。结合图2就不难理解:与英、法、意等国相比,正是由于中国的防控策略及时有效,其拐点周期比较短,所以在峰值期间的累计确诊人数就比较少,因而病亡率也相对较低。而且仔细观察图3还可以看出,德国的拐点周期比中国稍微长一些,但是其病亡率却略低于中国。换句话说,在拐点周期长短类似的情况下,中国统计报道的病亡率其实是略微偏高的。

拐点周期与峰值时期病亡率的相关性

图3:拐点周期与峰值时期病亡率的相关性

  如果进一步把中国大陆的数据分成“武汉”和“中国(除武汉)”,那么拐点周期与病亡率之间的相关关系就会更强。在图3中,删除日本的数据之后,Pearson相关系数高达0.957。从图4中还可以看出,中国大陆(除武汉)地区的峰值周期很短,而且病亡率也很低;而武汉的峰值周期较长,其病亡率水平也明显较高。

峰值周期与病亡率的相关性

图4:峰值周期与病亡率的相关性

  研究结论

  研究结论表明:各个国家的累计确诊人数和病亡率,与其达到疫情拐点所需要的时间是强相关的。举例而言,在本文选取的15个已经达到疫情拐点的国家中,意大利、法国、西班牙等国由于防控策略不当,严重拖延了到达拐点的时间,从而造成很高的疫情峰值和过度超载的医疗负荷。因而,即便它们现有的医疗资源十分优越,但是也没能避免医疗系统被击穿,从而造成严重的病亡状况。与之形成鲜明对照的是,同是欧洲的德国、瑞士、奥地利等国,却由于较早实现了疫情形势的转折,从而明显降低了累计确诊人数和病亡人数。此外,新西兰、澳大利亚、韩国等国由于达到拐点的周期最短,其疫情峰值最低,因而病亡率的水平也是最低的。

  由此可见:此次COVID-19疫情的防控效果主要与各国防控策略的有效性是极其相关的,具体反映在统计指标上,就是该国疫情达到拐点所需要的时间(简称:拐点周期)。也就是说,一个国家如果能将拐点周期控制得越短,其累计确诊人数和病亡人数就会越少,而且其病亡率也会越小。上述统计分析结论客观反映了COVID-19疫情防控过程的一般规律。

  而在本文的总体分析过程中,中国数据完全与国际统计数据规律相吻合,证实了中国数据的合理性。特别是把中国的数据分成“武汉”和中国大陆(除武汉)”两个部分,可以更加清晰地反映中国抗疫斗争的特点以及抗疫策略的成功之处。事实上,中国恰恰是因为及时采取了武汉封城的措施,快速斩断了疫情传播途径;而与此同时,全国各地在启动一级响应抗击疫情的过程中全力驰援武汉,从而有效缩短了各地区到达疫情拐点的周期,极大地压低了疫情峰值,并且最终有效控制了整体的病亡率。而本文统计分析的结论,也有力地驳斥了某些西方国家对中国数据的臆想猜疑是缺乏科学依据的。

  (王惠文系北京航空航天大学学术委员会副主任、经管学院学术委员会主任,民建北京市第八届、九届委员会副主委)

责任编辑:刘海梅