EN 中文
首页 > 研究 > 研究评论 > 【美国来信】4.19 | 疫情中的数学
Home > Research > Research Comment > 【美国来信】4.19 | 疫情中的数学

【美国来信】4.19 | 疫情中的数学

作者Author:高占军 2020-04-19 2020年04月19日
美国时间4月18日傍晚,白宫举办例行疫情发布会。期间,负责疫情应对的总协调人Deborah Birx博士给大家展示了一张图,试图说明不同国家在应对疫情中的表现。她所用的指标是每10万人口中有多少人因感染Covid-19而病亡。根据这个指标,比利时最高,每10万人口病亡45.20人,其次是西班牙42.81人,再之后是意大利37.64人,然后是法国、英国和荷兰,分别为27.92人、21.97人和20.14人。表中还有美国、德国和中国,分别为11.24人、5.25人和0.33人。笔者特意把原图照样重做一遍,复制如下。(见图1)

美国时间4月18日傍晚,白宫举办例行疫情发布会。期间,负责疫情应对的总协调人Deborah Birx博士给大家展示了一张图,试图说明不同国家在应对疫情中的表现。她所用的指标是每10万人口中有多少人因感染Covid-19而病亡。根据这个指标,比利时最高,每10万人口病亡45.20人,其次是西班牙42.81人,再之后是意大利37.64人,然后是法国、英国和荷兰,分别为27.92人、21.97人和20.14人。表中还有美国、德国和中国,分别为11.24人、5.25人和0.33人。笔者特意把原图照样重做一遍,复制如下。(见图1)

1.png

Birx博士称,在做这张表时,还是把中国放在里面了,但特意加了个星号。她的意思很明显:发达经济体都那么高,甚至美国也超过11,而中国却只有0.33,这么小的数字,肯定有问题,不可信;但又不可能没有中国,所以标注星号以示不可比。

疫情中的数据因检测的标准和要求不同、统计口径的差异和不断更新以及确认上的滞后等原因,不但国际上不完全可比,甚至一国数据的动态变化有时也令人困惑。这是可以理解的,在这方面,找得到无数的例子。比如,日本因标准高所以检测范围有限,美国因工具缺乏而一度检测不足,韩国检测覆盖范围明显高

于大部分国家,所以在不同时期看到的病例数据并不能反映实际情况。再比如,在病亡数据的统计上,纽约4月14日一次性增加了3778个病亡数据,都是以前未经检测就死在家里,而事后根据推测和检测怀疑死因是感染了Covid-19的。美国疾控中心(CDC)对数据统计也不时更新标准,每更新一次,数字自然就会有相应的变化。

但Birx博士是有国际声誉的传染病专家,她在发布会上对于中国的数字反复置疑,百般不信,不禁令笔者十分好奇。但靠近电视机简单分辨,马上就发现Birx博士所选择的统计口径明显有违直觉和常识;而她(及其他人,包括总统)对这组数据的强烈反应,让人意识到很多人可能永远都理解不了中国。

我们先来看看统计口径有什么问题。最大的疑问是:能用一个国家的病亡人数占这个国家总人口的比重这个指标,来进行国别比较吗?国家间国土面积可能有巨大差异,人口数量也会天壤之别,比如中国和瑞士。很难想象一个有着14亿人口的中国和859万人口的瑞士,非要选择用全部人口做分母来一较高低,那该要有多强的想象力。弹丸之地的瑞士可能全境都是疫情中心,而960万平方公里的中国这种概率则很小。不仅瑞士,其他欧洲国家也如此。

有人也许会问:欧洲国家自然都小,那么美国够大吗?这是个好问题。美国面积与中国相似,但人口3.3亿,只有中国的23%。所以,如果想要中国的指标与美国相同的话,中国的病亡人数需要达到美国的5倍才行,美国现在的病亡人数是3.87万人,乘以5则是接近20万人;若相应地病例人数也是美国的5倍,则要达到365万人。这显然是荒唐的。

一个重要的事实是,中国只有一个真正的疫情中心——武汉,而美国的疫情中心何止十个。截至4月18日,病例超过2万人的州就有9个,其中最多的纽约州超过24万人,第二的新泽西超过8万人;另有超过1万人的州7个;此外,有10个州虽在1万人以下但都超过了4000人。虽然国土面积差不多同样大,但美国多点爆发,加之人口基数明显小,用这个口径比较自然相差很大。

适当的统计口径应该是病亡率,也就是病亡人数占染病人数的比重。按此口径,笔者计算了全球病例人数排名前十五个国家的病亡率数据(参见表1)。根据这个指标,病亡率最高的6个国家均在欧洲,分别为比利时(14.7%)、英国(13.4%)、意大利(13.2%)、法国(13.0%)、荷兰(11.4%)和西班牙(10.5%)。德国和加拿大比较低,分别为3.1%和4.1%。瑞士、美国和中国相当,分别为5.0%、5.3%和5.5%。而从全球看,病亡率6.9%,大体处在中间的位置。

2.png

最后,从数据还能发现另外两个值得关注的特点:一是每10万人口的病亡人数就全球看是2.06人,全球排名前十五之外的其他国家平均为0.24人;二是病亡率就全球看是6.9%,而全球排名前十五之外的其他国家平均为3.4%。将这两组数据对比能够揭示另外一个现象,即不同国家的疫情发展阶段完全不同,在这个时候进行国别比较,需要格外小心。

在美国,知道中国是怎样控制住疫情的人不多。要我说,相比之下,普通的中国人更懂得防疫的常识:耐得住寂寞,尽量少出门;如果不得不去有人聚集的地方,如超市,一定要戴口罩;在不戴口罩的情况下,不用太较真两个人应相距6尺还是7尺,尽量远离就好。

有时挺替美国着急。我们在哈佛的华人学生学者,不少人2月中下旬就开始担心早晚学校会关闭,3月初就预感到春假后疫情会失控。但在疫情迅速蔓延和扩散中,很迟了大部分人还都没有反应,检测不足也掩盖了事态的严重。事态发展后,缺少防护的常识和习惯更为致命。我们很早就不再去超市购物了,因为不戴口罩危险;但又没办法戴,因为周围的人都不戴,如果你蒙住了脸,大家可能都会觉得奇怪。

其实若不去公共场合口罩也不太用得上。我们第一次戴口罩是在4月6日,因为波士顿市长要求从这一天起出门要戴口罩,所以就去了趟超市。但至今也就戴了这一次口罩,因为虽然每天出门运动,但去的地方人都少。

有意思的是,现在走在街头,我们反成了最多不戴口罩的一族,常见到的倒是美国人独自一个人戴着大口罩遛狗或散步——最近一两周这成了街头一景。看到这些时,心里逐渐踏实些了,大家意识强、方法对了,疫情受控则是早晚的事。但电视中也不时播放着一些州着急开放、市民上街游行要求上班的镜头,又让人感觉不确定性还挺大。

再回到正题:在数据方面,除了Birx博士的指标不太靠谱,实践中,很多预测疫情的模型可信度也不高。疫情中的数学,正成为一个令人困扰的问题。笔者曾一直想写一篇有关“疫情中的模型“的评论,还没腾出手来,就且留待下次分解吧。