新冠肺炎疫情正在全球蔓延。医护人员在临床一线努力“战疫”,科研人员也在实验室不舍昼夜,对新冠病毒、药物和疫苗等密集展开研究。发表论文是各国科学家共享关于病毒最新研究进展最科学、最严谨的方式,能让大家及时掌握最新发现,以便集全球之力共克时艰。那么,有关新冠病毒的全球科研进展究竟如何了?
为解答这个疑问,我们联合清华大学的一个团队,收集了2019年12月份以来的1000多篇新冠病毒和疫情相关论文,并进行数据分析和可视化展示。这些论文主要来源于bioRxiv、medRxiv等论文预印本平台,以及《科学》《自然》《柳叶刀》等学术期刊。我们抓取了这些论文的标题和摘要,利用自然语言处理技术和人工智能机器学习算法深入挖掘其中的研究主题和热点。
为保证结果全部为学术论文,利用算法剔除了其中的新闻、社论和评论文章。审稿流程加快,论文发表呈“井喷”。分析bioRxiv、medRxiv、ChemRxiv和ChinaXiv四个预印本网站以及《科学》《自然》和《柳叶刀》3家学术顶刊所发表的相关论文可以发现,此次疫情中,各大学术期刊普遍加速审稿流程,3个多月内就有651篇论文发表。特别是进入1月之后,论文发表数量和频率都急剧上升。
此次疫情中,论文预印本网站发挥了重要作用,所发布的论文占全部论文发表数量的80%以上。预印本是指未经同行评议就上传至公共平台供人查阅的论文草稿,可省去传统期刊长达数月的审稿流程。美国冷泉港实验室出版社运行着两大生物医学预印本网站bioRxiv和medRxiv。社长约翰·英格利斯接受《科学》杂志采访时说,目前两个网站每天收到约10篇与新冠病毒有关的论文。
科研界共享数据和开放合作的新文化也促进了预印本论文发表。2016年寨卡病毒暴发期间,在预印本网站上提前发布研究结果可能影响在同行评议期刊上发文。而这一次,所有同行评议期刊不约而同支持将科研结果先发布在预印本网站上,显示出“空前的团结”。不过,虽然没有同行评议会加快论文发表,但预印本网站也会让可能危害公众的草率科研成果得以发表。
此前,印度学者关于新冠病毒与艾滋病病毒关系的文章在bioRxiv发布后引发大众恐慌,遭到同行批评后被撤稿就是例证。中国科研人员贡献最多。根据论文作者所在的机构信息,对研究论文做国别区分统计并排名可以看出,中国科研人员贡献的论文数量最多,共有412篇;紧随其后的是美国(223篇)和英国(67篇)。
通过提供病毒基因序列、共享诊疗方案等方式,中国科研人员积极参与国际科研协作,推动了新冠病毒相关科研成果的快速迭代。参与新冠病毒疫苗研发的英国帝国理工学院医学院教授罗宾·沙托克说:“中国科学家公开新冠病毒的基因组序列信息让我们受益匪浅,有助我们和其他团队尽快开发出疫苗。我们与中国科研人员和医护人员保持联系,希望能够建立更深入的合作关系。
”清华大学药学院院长丁胜教授说,和面对2003年严重急性呼吸综合征(SARS)疫情时相比,中国科技的水平、掌握的工具、研发速度已有质的飞跃。“中国科研人员很快分离病毒毒株并进行基因测序,是由整体技术水平的提升作为支撑。现在我们的最高水平也已达到世界最前沿,大家可以在同一个高度开展对话。”对病毒的认识日益加深。
通过分析研究主题可以发现,科研人员的研究重点主要集中在疫苗、抗体、病毒作用机制等基础生命科学研究,同时包括临床诊断与治疗以及流行病学研究等。其中,对于病毒本身的研究占了最大比例。随着时间推进,科研人员对于病毒“越来越了解”。1月7日,中国科研人员从样本中分离出新冠病毒并检测出病毒全基因组序列,并及时向全世界公开全部信息。
自1月下旬开始,血管紧张素转化酶2(angiotensin converting enzyme 2,即ACE2)、刺突蛋白(the spike protein)成为研究焦点。研究人员发现,新冠病毒主要通过病毒表面的刺突蛋白spike与人体ACE2受体结合感染人体。刺突蛋白像一把“钥匙”,细胞上的ACE2受体则像一把“锁”。只有钥匙打开锁,病毒才能进入细胞。这一发现为新冠疫苗和药物的研发提供帮助。
在流行病学领域,关于“人传人”(human-to-human transition)的论文最早出现于1月20日左右。紧接着,关于抗体、疫苗等治疗药物类研究开始增多。科研人员较多关注的有单克隆抗体(monoclonal antibodies)、多肽类疫苗(peptide vaccine)、抗病毒药物利托那韦(Ritonavir)等。此外,自2月中旬开始,检测方法(rt-PCR)获得了更多关注。
检测病例的增多,暴露了检测方法的“测不准”问题,出现很多“假阳性”和“假阴性”现象。新冠病毒核酸检测试剂盒主要应用荧光PCR技术,检测来自鼻咽拭子、血液、肺泡灌洗液等样本中的病毒遗传物质含量,如果核酸含量超过某个临界值即为阳性结果,认为已被感染;低于某个临界值即阴性结果,认为未被感染。研究人员认为,样本病毒含量、试剂盒本身技术问题都可能导致“测不准”。
同时,新冠病毒为下呼吸道病毒,鼻咽拭子采样的方法也存在采样不太准确等问题,容易出现“假阴性”现象。新冠肺炎疫情新近发生,论文数据量相对有限,研究成果也在不断推陈出新。通过对1000多篇论文的数据分析,较难做出一些趋势性判断,也无法描绘出全球科研全貌。不过,通过分析,还是可以十分直观地看到全球科学家的团结协作与不懈努力。希望我们早日战胜病毒这个人类共同的敌人!