截止到2020年4月4日,全世界累计确诊人数已经超过了100万人,汇集的各种数据我也终于可以做个较详细的分析。整体的分析形成三大块,疫情趋势、资源与管控措施,传染机制的图数据分析和模拟以及基础疾病与新冠肺炎,整体包括了经济学、数据分析以及微观健康以及临床医学数据,转载数据请标明出处。
疫情发展趋势有非常多的方法,其动力学方程是以SEIR为代表,但当考虑到管控手段其SEIR模型预测的结果有较大偏差,在这里我们考虑一个新的途径,这个途径的目的是重建资源匹配在救治中的地位、利用已有经验信息、最大程度考虑管控手段的效果同时能够对一些焦点问题进行评估。就像给EMBA上课时专门讲资源匹配重要性一样,我在这里考虑了这个因素的影响实际上是最主要的不同,其他的两个也是它的反应,并影响到模型的架构。
一、引入新的概念微观疾病状态转移矩阵作为人群分类的补充
疾病状态转移矩阵的获取和趋势变化,微观个体在感染新冠肺炎后随着时间推移会处于不同的状态,这样的状态转移矩阵是医学救治的范畴,并不等同于SEIR模型的人群划分,但是它自身又特别重要,因为它决定了对于新冠肺炎这一传染病,整个医疗系统应对的效果,并决定了医疗资源的配置。最初我们按照国家卫生健康委员会救治指南中划分了轻症、普通型、重症和危重症。在这当中有部分数据是无法获得的,我们通过定义最终的治愈率偏差并优化该结果获得不同时期的转移结果,同时对已经获得结果的其他国家进行了对比。
说明:
1. 该数据主要是基于优化结果计算的,转为excel格式,该数据没有考虑反复过程,也没有考虑无症状感染者,但这部分结果已经测算出来另行给出。数据仅供参考,如果引用请标注出处。
2. 该数据通过小样本实际病例数据进行了纠正,实际上是进行了一个半监督学习;
3. 从以上数据可以看到其最终90%危重症救治率和国家卫健委公布的88%的救治率比较接近,在当前救治力量集中于危重症救治的阶段,一方面医疗资源可以大量应用,最大限度做到应用尽用,但是另外一方面等待救治的危重症的情况越来越复杂,并发症和合并症仍存在较大挑战,是一个和死神抢夺生命的关键时期,希望救治率继续提升。
4. 普通型确诊患者切不可掉以轻心,从数据可以看到,如果不经过医疗干涉,其转化为非轻症(即重症和危重症)比率很高,最开始医疗力量跟不上就是这种情况,接近一半多的概率,并不是说自己在家硬抗就可以扛过去,这一点才是所谓的“群体免疫”不能实施的基础,做一个简单的数据实验:如果有10万确诊患者,如果不加干涉,就会产生50000重症患者,这样突如其来的医疗资源挤占,是许多国家都无法承受的,而如果进行干涉,类似于后期的结果,只有10000多人,而且还是逐步转化的,这本身是一个资源的问题。
5. 医疗资源在这个过程中很重要,正是全国医疗资源驰援武汉,10%的重症救护力量集中在武汉,才最终获得了这样斐然的成绩。
二、关于资源的投入
我们在优化中,通过蒙特卡洛模拟来生成状态转移矩阵随时间变化过程中的资源占有情况(显然,在医疗资源投入下,不同时期的转移概率不同,举例来说,重症被救治的概率越来越高了),在这里资源投入是条件概率拟合的一个因素。这方面没有及其精确的数据,但是可以根据小样本数据的治疗项目(这需要对医院管理熟悉的朋友才理解),简单说就是一个人治病的过程中所“占有的”资源情况。通过多次模拟可以给出不同阶段的资源投入情况,其大约比例如图,需要提醒的是这样的数值仅仅是做个对比,更详细的结果更适合做成动态图。
三、救治的时间变化。
概率矩阵在不同阶段转换时间实际上就是救治的时间,这里我们考虑了反向拟合的概率结果有连续变化的特征,综合实际中资源匹配的三个阶段,即(资源紧张-挤兑阶段,资源缓和阶段,资源过度阶段),由此定义的转换概率矩阵中的危重和重症转化变化31.6%作为划分。
随着资源的投入越来越多,整体救治时效都有了提升,但是资源投入并不意味着救治过程有极大的提升,这本质上因为还没有有效的药品,整个治疗还不能在时间方面有更好提升。
特别值得注意的是,在没有疫苗或者有效药品的时候(目前看2020年疫苗能够应用的可能性很小),较为稳定的救治时间意味着较为稳定的资源投入,这进一步说明新冠肺炎救治的艰巨,冰冷的数字就是这么残酷,在此时,资源投入决定了最终的效果。
四、将资源投入考虑为趋势预测的一个重要因素。
该因素与政府管控措施,个体的执行措施结合,然后由过去的历史数据构建模型,为了方便我们这里使用了循环深度网络作为方案,并将上述三个因素作为传染病模型的控制参数来作为损失函数的一部分,训练方案采用随机梯度下降。在结果中,主要回答这样几个问题:
1. 疫情发展趋势。所有的传染病都是要经历过一个上升平台下降的过程,但用这个来说明疫情发展趋势过于粗糙,实际上因为以上三个因素的不同,其发展趋势各异,在我们测算的数据中,很少发现完全一样的形式,例如这里给出了模拟出来的过程,为了方便我添加箭头表示对应国家所处的阶段。这里特别需要说明的是德国的情况有些特殊,一个特殊是因为资源的充分性(ICU病床数量等,新冠肺炎所涉及到的资源从药品到ECMO大类平均17个,小类上百项目,我们这里是粗略估计了核心资源,比如没有ICU病床数其他的所有资源意义都不大),另外一个原因是其平衡之后的重症和普通症的治愈同步性,其形成了一个明显的速降状态。
2. 按照当前的条件,世界各个国家的峰值不是同时到来,从3月27日开始到4月21日分批到来,由此形成的不同国家的输入输出冲击也非常巨大,具有代表性的就是类似与新加坡这样严重依赖外贸和金融的国家可能面临更大的困难。
3. 同样由于这样的事实,限制跨国人员流动至少要等到5月中下旬才有可能缓解,实际上,我们还没有完成对部分宏观因素的导入,所以这仍然是一个乐观估计。
4.全世界由此确诊的人数将达到192万到307万之间,至于为什么这么大的Gap,实际上我觉得都已经不重要了。
5.我们无法对一些医疗资源不足的国家进行建模,因为建模结果(当资源供给比低于4这个阈值的时候,结果是一个不收敛的结果),现实中我们不希望看到这样的结果,所以我们限定了最低资源比大于5.73。
五、政策管控的跳跃式和渐进式
跳跃式是指迅速采取措施,它表现在对应的参数是离散的,阶跃函数,其导致的缓冲间隔极小,类似于我国采取的措施,其形成的误差特征是可以形式给出;而渐进式的措施是根据疫情趋势而逐渐加码,看起来是一个连续函数形式,这里我们用样条函数(贝塞尔曲线的控制点来实现).
可以看到,将资源考虑进去之后,管控措施的效果其实和传染率R以及资源效率都有关系是一个曲面,毕竟不是学术的东西,我就选取了一个角度的投影,可以看到不同政策的结果,需要注意的是,这里的效果是通过(感染人数,死亡人数,治愈率的倒数)向量状态表现的,从图中看是越低越好。
简单说:当考虑资源的时候,渐进式在较小的传染率情况下有相对比较好的效果,这是因为资源的调配来得及应对“并不那么疯狂”的冲击,但是如果R很大,情况就不一样了,两者的交叉点在2.5左右,实际上考虑到模拟结果的原理,数值还会更小点。
不想牵涉到任何谁好谁坏的争论中,但是治理和管理也是一门科学,应该考虑到情况的不同的,根据研究,covid-19在多数论文中都超过了3,在最早期的一些论文中有低于2的估计,而目前的一些预印本研究表明,R是有差异的,我个人认为,这种国家的差异是因为资源因素在模型中被忽略的结果。
以上就是我第一部分的分析,顺便补充几个其他人公开发表的(而不是预印本)的研究:
1. O型血相对风险较小;
2. 病死率随着年龄增加而增加(符合多数疾病特征),老年人病死率较高;
3. 密闭空间口罩很有必要(带不戴口罩怎么会成为争论焦点,我好晕)
以下是我个人医学推断和提醒,仅供参考:
1. 个人猜想代谢在对抗新冠病毒入侵中作用很大。细胞新陈代谢增加,可以降低病毒感染的“失活细胞”影响,给予身体免疫能力的反应时间。同时已经有很多研究表明,免疫力一定程度上与代谢有紧密关系,尽管关系复杂,但通常代谢提升会提升免疫力。我讲的最受欢迎的健康管理科学课程的核心就是重建代谢机制,实践中包括某些严格的实验确实在体能、慢性病等方面给听课人带来了难以想象的改善效果,但因为并没有传染病和冠状病毒的数据,所以只是猜想。
2. 在当前的情况下,有效的疫苗难度很大,这是当前mRNA这种疫苗构建方式的可测试数量和反馈时间决定的。
3. 尽管基础性疾病和老人病死率较高,但是就感染率来说年轻人和老年人差别不大,这是因为这种病毒是一种新型病毒,免疫系统的四道防线对其都不具有识别和发现的能力,所不同的是感染之后的状态。
4. 普通意义上的身体强壮和身体免疫力强是两个概念,如果你听了我的课就知道我定义的身体素质强和大家说的身体素质强不是一回事,即莫用自己的身体强壮来觉得感染新冠病毒没事。
5. 要区分免疫力强和免疫力优的概念,过度的免疫反应实际上是很多致死的原因,即免疫力风暴或者因子风暴。公开渠道或者课程里,我一直说是打造优化的免疫系统。