近日,中国科学院主办的《国家科学评论》在线刊登了一篇有关新冠病毒起源和持续演化的分析文章,作者是北京大学的陆剑研究员与中科院巴斯德研究所的崔杰研究员。研究利用103株已有病毒信息,分析发现新冠病毒已经存在两个亚型,并且传播力上具有差异。这两个亚型在1月7日前的病毒信息中就都已经存在,但在之后,人为的防控措施干预了两种亚型的演化。
在自然界中,冠状病毒会在天然宿主蝙蝠里演化,而大多数能在人群中传播的冠状病毒也都源自蝙蝠。而根据已有的研究,新冠病毒和一种蝙蝠SARS相关冠状病毒RaTG13全基因序列相似性高达96.2%,而与SARS-CoV相似性也有79%。另外,新冠病毒入侵人体所介导的受体与SARS-CoV一样,都是ACE2。
而目前从蝙蝠到人中的传播路径还并不清楚,根据刺突蛋白基因信息,新冠病毒的部分刺突蛋白基因可能来自穿山甲的冠状病毒Pangolin-CoV,因为刺突蛋白的关键位点和穿山甲来源的一种病毒几乎一样,但这些也仅仅只是推测。
新研究为此分析了人群中的冠状病毒传播和演化模式,研究一共从公共数据库获取了103株新冠病毒信息,在基因组分析中,尽管全基因核酸序列上新冠病毒与蝙蝠病毒RaTG13的差异只有4%,但是其实中性位点的核酸差异已经达到了17%。研究认为将同义位点和非同义位点分开分析,能更好地展示病毒之间的差异性。而同义位点变异显示出的差异性,也远超之前拿全基因组核酸比较获得的差异结果。
而且刺突蛋白的中性位点变异发生要比其他的基因区域更高,研究推测这是刺突蛋白高突变率造成的。
尽管新冠病毒和SARS-CoV之间全基因组差异性不大,但刺突蛋白的关键结合区域——RBD区域中的6个氨基酸残基中,有5个都不相同。之前研究认为,这种不同是因为新冠病毒刺突蛋白的RBD区域与穿山甲病毒Pangolin-CoV的基因重组结果。
但在新研究针对功能性氨基酸残基的分析中,数据显示新冠病毒基本上不可能通过最近和Pangolin-CoV重组事件获得了功能性位点,而更有可能是刺突基因出现了高突变,经过自然选择后才获得了如今的特征性刺突蛋白。
那么在新冠病毒在人群中又存在哪些突变位点的病毒株呢?新研究也给出了答案。103株病毒基因组信息,最早的来自2019年12月24日,最近的是2020年2月5日。
在这些病毒株中,研究一共发现了149个突变位点,其中43个为同义位点突变,83个为非同义突变。而在非同义位点中,有一个关键位点ORF8(L84S, 28144位点)其在新冠病毒中发生的频率已经≥70%。并且该突变位点造成的碱基改变已经对新冠病毒6种蛋白产生了影响。
因此,研究按照28144位点对应的碱基将新冠病毒分成了两种亚型,其中L型是T碱基(对应亮氨酸,Leu),S型是C碱基(对应丝氨酸,Ser)。而在进化树中,S型新冠病毒与蝙蝠冠状病毒要更接近,因此S型相对更古老。而在103株病毒中,L亚型占比更多达到70%,S亚型占30%。这说明,L型是最近演化出来的类型,其传播得更快,或者在人群中的复制速度要更快。因此研究认为,L型要比S型的入侵性要更强。
但这是基于生信学分析得出的结果,具体的还需要实际分析实验才能确定。
而两种病毒在地区分布上,27株来自武汉地区的病毒中,26株(96.3%)都是L型,1株为(3.7%)为S型。而在中国以及国外其他地区的73株病毒中,45株(61.6%)是L型,28(38.4%)是S型。这就产生了一个问题,既然L型传播力更强,为什么在武汉以外却传播占比要低呢?
研究分析发现,武汉的这23株病毒信息基本在1月7号前,而后面其他地区的73株病毒都是1月7号后的。这说明,1月中下旬开始的严格预防和疾病控制措施在两种病毒传播和演化中就起到了很大作用。严格的防控措施对L型有很大的负选择压力,尽管L型传播力强,但是更容易被人为措施影响。而S型传播力弱,但是人为干预对其的自然选择压力也要更小。值得一提的是,根据论文信息,无论是S型还是L型,在1月7日之前就都已经存在。
因此就论文内容,不存在新冠病毒在最近一个月发生了突变的说法,论文讨论的只是人为防控措施对两种病毒演化和后续分布上的影响。而新冠病毒作为一种RNA病毒,即使发生突变也是自然现象,关键在于突变会怎样影响病毒。
尽管大多数病毒株样本不是S型就是L型,但也有特例,比如来自美国一位病人的病毒株(1月21日),他的28144位点既有T碱基也有C碱基。研究认为不排除是一些新突变过程发生,但更可能的是该名病人同时被S型和L型的病毒感染了。而这两种病毒究竟还在进化怎样的演化,研究认为还需要更多的样本分析才能确认,这也需要各方更及时和公开的公布病毒株信息,这对新冠病毒的流行病学分析将有重要意义。