数据不足,方法简陋,仅供参考。

以下内容是介绍整个预测过程,略长且枯燥,可以不看。

从11月开始,越来越多的地区的病例出现了大幅度失真。我们虽然能在网络上看到石家庄、保定、北京等大面积感染的情况,但是在卫健委的病例发布中却看不到这样的数据:


(资料图)

可以看到,北京的新增病例正在逐渐减少;石家庄的新增感染者数量在11月24日时达到顶峰,随后迅速下降。而保定……保定根本看不出有任何疫情,除了在11月26日新增了33个感染者以外,其他时间保定的新增感染数量基本稳定在个位数。

不仅是这三个城市,从全国范围看,新增感染者数量也在11月27日达到顶峰,并在最近十天来快速回落了。疫情防控的指挥棒消失后,病例增长数据立刻失效,此时我们怎样判断一个城市是否出现了群体感染?

可以使用搜索指数来看中国各地疫情。

在全世界范围内,可以看到目前这些依然在如实监测、报告病例的各个东亚国家、地区的搜索指数和当地病例情况高度相关:

其中香港特别行政区和台湾地区的搜索指数是“發燒”,日本则用了“発熱”。可以看到,当这些地区进入与疫情共存的阶段后, “发烧” 搜索指数的上升, 从时间上看 基本都和当地的新增病例数同步,或者领先一周左右。

那么,此时的北京、石家庄、保定的“发烧”搜索指数,分别是什么样的呢?

上图列出了六个城市在不同时间的“发烧”搜索指数,且根据每个城市的2022年前两周进行了标准化。

可以看到,在今年的3月初和4月初,长春与上海分别出现了一个短期高点,长春在3月9日达到1.74,上海在4月10日达到1.57。这两个城市此时的“发烧”搜索,分别达到了基准水平的1.74倍和1.57倍。在时间点上,上海的“发烧”搜索最高的一天,与上海市新增感染者最多的一天完全一致,都在4月10日。

那么,当我们看到保定、石家庄和北京的“发烧”指数,以惊人的速度突破了基准值的3倍、4倍甚至5倍,且完全没有停止的迹象时,当地的实际情况到底如何,也就不难想象了。

要注意到的是,此时大部分没有出现群体感染的城市暂时还没有出现“发烧”指数的上升,因此城市之间的差异是可以去除掉政策改变带来的预期变化使得搜索指数提前改变的。

在分析了多个地区的数据后,我试着用 “发烧”搜索指数给出每个地区疫情开始的信号,主要包括两个部分:

1,“发烧”搜索指数在过去7天内的平均值大于过去五年内该季度平均值的2个标准差。

2,“发烧”搜索的Cox-Stuart检验在95%水平上出现显著上升趋势。这里的Cox-Stuart检验我们用到了7天数据。Cox-Stuart检验需要将一个区间内的数据依次排列后取出所有的数对,看这些数对的正负情况,并根据一个二项分布 来判断是否有显著趋势。

当以上两个条件同时满足时,我们便把上升趋势出现的第一天定义为该城市迈向群体感染第一天。2022年11月以来,出现了群体感染的城市依次如下表所示:

可以看到,本轮疫情开始的时间比我们想象得更早。在“二十条 ”发布的第一天,也就是11月11日,河北省石家庄市和邢台市就开始迈入群体感染之路,至今已经持续近一个月,暂时也没能看到减缓的趋势。

第二批进入群体感染的是甘肃兰州 、河南洛阳与河北保定,时间在11月17日到11月18日。

接下来的两个星期,邯郸、廊坊、唐山、沧州、衡水、张家口……除了承德市暂时保持稳定以外,河北省全境都已经开始群体感染。

河南的群体感染也在快速进行。洛阳之后,紧接着是新乡、商丘、南阳、郑州、周口、平顶山、开封。

甘肃在兰州之后,临夏、甘南两个自治州也在11月下旬开始群体感染。

北京是全国首个进入群体感染的大城市,时间点是11月27日。接下来,重庆、武汉、昆明、成都……

截止到12月9日,全国已经有2.4亿人已经迈向群体感染。

这只是一个开始,由于我们的方法实际上是在群体感染的确认出现七天之后向前回溯,因此若是一个城市的感染在12月2日之后开始,便不可能被该信号锁定。因此一些城市的感染虽然已经有明显的趋势,但也没有能被列入该表内,这些城市如下表所示。

上表这些城市会在未来一星期左右被正式确认进入群体感染,他们的总人口约为1.16亿人。

截止到现在, 全国至少已经有3.6亿人口,开始走上群体感染的道路 。

从其他国家的经历看,预计全国范围内所有城市都会在12月进入群体感染,且第一波感染速度会非常快,新增病例4到6个星期就会触顶,随后就开始下降,再花同样多的时间结束第一波感染。

因此,有些城市可以较早结束第一波群体感染,比如 邢台、石家庄 等地,基本已经到了感染顶峰,接下来每天的实际新增病例会开始下降,一月初时便可进入疫情后的常态化生活。

北京等地十一月底开始感染的地区,现在还未到疫情峰值,他们会在十二月底到一月初触顶,一月之后就是疫情新增病例逐渐下降的时期。

如果某个城市在十二月底还没有开始群体感染,那么它大概率会在明年春节时碰上感染顶峰。

但同时也要注意,新增感染顶峰和新增死亡顶峰并不是同步的,从几个东亚地区看,后者会延迟10天到两个星期,而中国的首轮感染的超额死亡必定不会很低。

以东亚的新加坡、日本、韩国、台湾地区、香港特别行政区等地为例,即便目前的疫苗接种水平都好于中国内地,且有几轮病毒感染带来的免疫水平上升, 截止至11月 ,他们的超额死亡率依旧稳定在在 15%-20% 左右。

台湾地区2022年11月当月死亡17719人,2019到2021年11月平均死亡14480人, 提高22.4% ;

韩国2022年9月当月死亡29199人,2019到2021年9月平均死亡24528人, 提高19% ;

新加坡2022年9月当月死亡2125人,2019到2021年9月平均死亡1806人, 提高17.6% ;

日本2022年9月当月死亡127040人,2019到2021年9月平均死亡110289人, 提高15.2% ;

香港特别行政区2022年9月当月死亡4260人,2019到2021年9月平均死亡3973人, 提高7.2% ——香港相对其他东亚地区的在9月的超额死亡率较低,很重要的原因是3-5月的超额死亡率极高,导致很多人在首轮感染中就去世了,而这些人如果生活在其他地区,可能会在后续感染中才去世。

因此,上述地区的超额死亡情况,基本可以当做中国面临第一波超额死亡时的 下限 。如果按照这些地区的 超额死亡下限 计算,即首轮疫情1个月超额死亡按照台湾地区的数字仅有40%,后续超额死亡按照目前的日本数字仅有15%,那么根据中国每年死亡1000万人口的基数,未来一年的超额死亡,也会接近甚至达到 170万 人。

而这只是 最好 情况下的 最低 估计。

奥密克戎毒株确实变弱了,但从那些共存条件比中国更好的地区的实际死亡数据看,依旧会带来大量超额死亡。对此,我们必须有着清醒的认识,以及充分的心理准备。

我又对台湾地区、香港特别行政区和日本的感染情况与“发烧”搜索指数进行了分析,发现一个可能可以帮助预测感染高峰期的方法:

我们发现在这三个地区,当 疫情达到顶峰时,这个“超额发烧搜索指数累计面积”的数值全部刚好达到80 。这两个地区第一波疫情结束时,香港特别行政区的面积达到了160,台湾地区的面积达到了200,日本的最终面积是250。

3)如果用百度搜索指数做类似的研究会有什么效果呢?我使用了本轮疫情进入群体感染最快、最早的石家庄、邢台和保定做了计算:

可以算出,从疫情开始后计算,石家庄的“超额发烧搜索指数累计面积”已经达到了76,邢台已经达到了67,保定也达到了71。由此来看,百度搜索指数和Google指数分别算出的“超额发烧搜索指数累计面积”,至少是在一个差不多的数量级上。

4)考虑到保定、石家庄、邢台等地的发烧指数仍然在上升,以及百度搜索指数和Google指数的差异,我们比较 保守地将100作为疫情达峰时的“超额发烧搜索指数累计面积” ,将250作为第一轮疫情结束时的“超额发烧搜索指数累计面积”。那么我们通过每个城市的搜索指数累计增长,累计速度,就可以算出现在每一个有疫情的城市疫情达峰的时间,以及疫情结束的时间。

这是计算的结果,列出了所有能在明年春节前达峰的城市以及这些城市在达峰前已经感染的人口比例(截止至12月12日)。

数据不足,方法简陋,仅供参考。

推荐内容