2月5日,瑞德西韦临床试验启动会,图为该临床试验主要参与者、中国工程院院士王辰,图片来自新华社/程敏摄。
瑞德西韦在中国没有被证明在治疗重症新冠肺炎患者上有显著疗效,而美国两项试验结果显示有效。近日,美英科学家纷纷质疑美国试验为何中途更改了治疗标准,这显示瑞德西韦要么完全无效,要么是很有限的疗效,扑朔迷离,混淆不清。
为此,我们连线了北京大学临床统计方面的专家姚晨教授,他也是此次中国瑞德西韦临床试验的国际数据安全监查委员会(DSMB)5名成员之一,其中3名专家来自国外,2名来自中国,该委员会致力于监察研究的科学性以及保护受试者的权益。
瑞德西韦(Remdesivir)被人们誉为“人民的希望”。4月的最后一天,中美三个不同的临床试验几乎同时发布,中国的临床试验显示其与安慰剂相比无显著差异,两项来自美国的临床结果表示其有一定疗效,引发人们对瑞德西韦治疗新冠肺炎效果的激烈讨论。
从美国那边的反应来看,各方显得积极且迅速。先是研发该药的吉列德表示将砸10亿美元用于新冠肺炎药物的研发和生产,并向社会捐赠150万瓶药物。接着5月1日,美国FDA批准了瑞德西韦作为紧急使用授权(EUA)下治疗新冠肺炎患者,仅限于美国住院的重症新冠肺炎患者。
然而,对于公众普通公众来说,瑞德西韦治疗新冠肺炎,到底是有效果还是没有效果,如果有效的话,作用会有多大,仍是一头雾水。
我们先来回顾一下三项临床试验主要结论:(注:三项试验结果按公布时间排序)
吉列德公布的开放标签SIMPLE三期临床试验结果显示,接受瑞德西韦5天疗程的患者与接受10天瑞德西韦疗程的患者的临床改善相似,这说明瑞德西韦用药量减半,并不影响其对患者的疗效。
《柳叶刀》杂志发表王辰、曹彬等人的临床结果与此同时,《柳叶刀》杂志发表了中国医学科学院王辰和中日友好医院的曹彬团队关于瑞德西韦的全球首项随机双盲安慰剂对照临床试验结果。试验结果表明,与安慰剂对照组相比,未观察到瑞德西韦可以加快住院新冠肺炎患者的病情恢复或降低病死率。作者表示,需要从正在进行的临床试验中获得更多的证据,以更好地了解瑞德西韦是否可以提供有意义的临床获益。
美国国立过敏与传染病研究所(NIAID)进行的ACTT试验,主要涉及1063名患者的随机对照试验,显示接受瑞德西韦治疗的进展期患者康复速度快于安慰剂组的患者。从病死率来看,也可能有一定的生存益处。
在业内同行看来,有关瑞德西韦的临床试验,中国的临床试验设计最为严谨科学、执行的标准也最为严格。正是因为中国的临床试验标准比较高,如受试者发病时间必须小于12天,不能同时参与其他临床试验等,导致患者招募困难大,与预期招募的453名重症患者有较大差距(试验最终入组人数为237人,为计划的52.3%),最后因疫情得到控制,未能入组更多病例提前结束试验。
至于瑞德西韦对治疗新冠肺炎有没有效果,这次中国科研人员的临床试验意义何在?为此我们联系了北京大学第一医院医学统计室主任,兼北京大学临床研究所副所长姚晨,他也是国内瑞德西韦临床试验的国际数据和安全监查委员会(Data and Safety Monitoring Board,DSMB)成员之一。
为了保护受试者的权益,该临床试验启动后,研究者立即建立了一个独立的DSMB,该委员会由5名专家组成员组成,其中3名来自国外,2名来自中国。
在姚晨看来,中国的瑞德西韦试验之所以没有获得预期的样本量,主要是在研究者在执行临床试验方案时比较严格,按照入选/排除标准筛选受试者,入组进度较慢,直到3月12日才入组237例,后因中国疫情得到有效控制、较难再有合格病例入组。3月29日,依照预设终止试验条件和DSMB的建议,研究者终止了临床试验。但由于试验样本数不足,导致该试验统计检验效能有所下降。
除此之外,“中国的临床试验从伦理的角度,对所有入组的患者使用了标准治疗方案,即参考了国家卫生健康委员会修订的各版《新型冠状病毒肺炎诊疗方案》,在药物治疗方面,除基础治疗(主要为支持性治疗)外,有部分患者使用了洛匹那韦–利托那韦、干扰素等抗病毒药物或糖皮质激素,一定程度上掩盖了瑞德西韦的疗效。”姚晨表示,“美国牵头的瑞德西韦临床试验也需要依从当地诊疗方案给予标准治疗。
这也在一定程度上说明,在目前标准治疗的前提下,瑞德西韦带来的临床获益需要更多研究。”
瑞德西韦不同的临床结果,该如何解读?
姚晨:我没有感到意外。因为一个新药的上市需要经过不同阶段不同研究目的的临床试验,通常是I、II、III期临床试验。瑞德西韦已经完成I期临床试验,具有Ebola的II/III期临床试验数据,安全性良好。
但针对新冠肺炎来说,这是一个新的适应证,所以在中国开展的临床试验应该是全球首个II/III期临床试验,对筛选治疗新冠肺炎药物是有重大意义的。吉利德公司根据中国临床试验经验陆续开展了其他多项临床试验,如开放标签的SIMPLE试验,还有美国NIH组织的的ACTT试验,世卫组织还在全球开展了一项大团结(SOLIDARITY)的临床试验。当然,不同的研究目的所获得的临床试验结果也会不同。
我需要澄清一下,所谓“没有结论”或“阴性结果”,只是一个统计上的阴性结果,并不是没有结论,这项试验已基于严格的设计和执行,有明确结论。新药临床试验目的是评价一种新药在批准上市后是否真正有效,通常药品监管部门在审评一个新药上市时会参考新药临床试验是否能得到有统计学意义的有效性结论,即统计学阳性结果。
但早期的探索性临床试验通常有太多的未知因素,如给药剂量、疗程等,通常的II期临床试验不一定都有统计学意义,但研究结果可以为后期的III期临床试验提供重要的参考。监管部门为严格控制上市新药的“假阳性”疗效,通常要求在III期设计采用随机双盲、安慰剂对照的临床试验来验证新药的确切疗效。
研究者在临床试验过程中严格遵循临床试验质量管理规范(GCP),不仅要遵守伦理原则来保护受试者的权益,还要坚持科学原则来保证临床研究数据的完整性和准确性。即需要做到伦理和科学的平衡。
这项试验结果对临床有重要的提示意义。但第一次看到他们的方案也很吃惊,疫情很严峻,而且当时大家都很纠结的时候,他们的方案是一个随机、双盲、安慰剂对照试验,因为一般紧急情况下这种随机安慰剂对照试验很难开展。
王辰院士和曹彬教授的团队在临床试验设计之初,就选择了最为严格的、循证医学证据等级最高的随机双盲、安慰剂对照的临床试验设计方案,在突发新发传染病的疫情中,他们进行科学、规范的临床研究创造了先例以及证明了可行性,改变了在疫情中难以进行规范临床研究的观念,所以临床数据最终发表在权威医学期刊《柳叶刀》上。
DSMB的设立主要是为了监察研究的科学和保护受试者的权益,DSMB章程中明确了采用动态监测方法定期对积累的安全性和有效性数据进行研判,确保试验受试者的安全性及试验数据的完整性,一旦发现瑞德西韦较安慰剂组存在较高的不良反应时随时叫停该研究,当然通过中期分析看到了瑞德西韦有明显的疗效,即达到预先规定的有效界值时也可中止临床试验。
当他们决定终止试验的时候,其实也很痛苦和纠结,当时他们甚至想要到国外去做试验,最后DSMB建议如果真的找不到患者了,那就提前终止,也可以得到一个结论。虽然得到统计学的阴性结果,但是并不代表没有价值,至少说明瑞德西韦没有显著的临床效果。在临床上,我们同样看到了一些差别,只是这个差别没有统计学意义而已。
虽然是个阴性结果,但它毕竟是第一个随机双盲、安慰剂对照的临床试验,对科学评价瑞德西韦治疗重症新冠肺炎有一定的借鉴和指导意义。
在DSMB成立的第一次启动会上,我们与研究者商讨临床试验方案中的评价指标要不要调整,评分是否需要调整等,研究者认为方案一旦定下来,就不想改变,按照这个方案坚持下来。他们毕竟是呼吸科的专家,有很多的经验,而且也有国际专家与他们讨论过,所以当时的临床指标是合理的。
事实上,每次DSMB会后都有一封给申办方和研究者的建议书,通常建议书中不会告诉具体的分析结果,只是三种选项,即1)继续按原方案开展研究;2)继续研究,但对试验方案做如下修改;3) 因某些原因停止试验。3月8日,DSMB给出建议书,考虑到入组进度和和终点事件发生例数,让他们对试验方案做一些修改。但DSMB的建议研究者未必一定要接受。
另外,我个人觉得,他们在做这个试验,没有去改变方案的主要原因,还是希望能严格地进行临床试验,争取在中国完成一个好的、高质量的试验,所以当时标准的卡得比较严。
最终,这项临床试验均在湖北省武汉市进行,共有10家医院参加,截至3月12日再未筛选到合适的受试者。由于我国疫情得到有效控制、较难有病例入组,3月29日在DSMB建议下,研究者根据方案中的试验停止标准终止了临床试验。试验共入组237例患者。3月31日开始进行揭盲和最终的统计分析,完成了一个与预期样本量尚有较大差距的临床试验。
就中国与美国两个随机双盲、安慰剂对照临床试验比较而言,中国完成的试验方案入组患者都是符合重症标准,并且要求是发病后12天之内,而美国NIH报告的试验方案入组条件就没有如此严格的规定。另外,试验设计也有不同,美国采用了适应性设计,增加了其它可能有效的新干预组,试验样本例数也不同,美国在试验期间调整了样本量,增加到了1090例,参与的临床试验中心达68家医院。
值得注意的是,两项试验设计最大不同点是评价瑞德西韦有效性的主要终点指标,一开始中美采用了相似的WHO推荐的评价病情严重程度的评分标准,中国试验方案是用随访28天病情评分至少降低2分的时间(Time to Clinical Improvement,TTCI),而美国方案是评价15天的TTCI,后来又重新定义了临床改善的评分标准,将随访时间改为了29天。
另外,中国方案也将核酸检测纳入最后的检测指标,美国方案里没有这一项。
因此,我个人认为这次中国的临床试验方案更为严格一些,美国的临床试验虽然也是科学的,但它更采取了一些灵活的措施,需要的代价是入组的样本量更大。另外,中国的基础治疗用了很多的各种各样的治疗药物,包括部分抗病毒治疗药物、激素、中药等。而在美国,临床试验一般会采用有循证医学证据的治疗药物进行治疗,通常只是在支持疗法基础上开展临床试验。
当然了,这里有一个问题需要澄清下,在患者救治过程中,给氧、呼吸机也是改变病程很重要的手段,治疗手段也肯定是有效的,美国那边应该也会用这些东西。所以这时候对于患者的临床结果的评价不是一个简单的问题。
我个人认为王辰、曹彬的试验设计是最严谨的,但严谨带来一个问题:病人入组难。实际上,当时他们很容易放松一些要求,但他们当时没有放松要求。严格执行会产生更为可靠的结果,所以他们在做这样一个临床试验,坚持入组标准属实不易。
美国这次方案有调整,修改了研究终点并扩大了样本量,并调低了临床试验的标准,这是一个灵活的试验设计,依靠后期复杂的统计分析方法调整对最后临床结果有影响的因素。
需要值得注意的是,另一项是重症的SIMPLE试验结果,是疗程间的比较,试验结果显示5日疗程和10日疗程没有差别,虽然数值上5疗程日显得好一点,由此可见治疗结果与疗程没有明显关系,这种研究结果提示,不能确认瑞德西韦对重症的干预有效。
我认为,瑞德西韦不会是一个特效药,因为如果特效药的话,它带来的临床改变是非常显著的,不可能需要这么大的样本来做临床试验,所以它可能只是一个有效的治疗药物的选择。如果获批上市,其带来的代价也会很大。
至于疫苗能带来多大的价值?这个病年轻人死亡率较低,老年人比例大,这与很多老年人因为免疫力低下、同时伴有其他疾病有关,抗击新冠病毒需要靠自身的免疫力,通过灭活的病毒或其他手段制备疫苗,可让人体被动产生免疫力。
美国试验的样本量很大,但我们还没看到最后公布的详细分析结果,试验结果也没有经过同行评议。从统计学控制临床研究偏倚的角度上讲,他们不应该在临床试验中间就直接宣布了,可能是迫于外界的压力。如果从数据和安全监查委员会的角度来说,我们在试验期间也知道了治疗14天时有较好的疗效,但我们没向外界公开过。因为不到临床试验结束,DSMB的会议详细信息是不能随意透露的。
为何这三个临床试验一起公布?我猜测,可能是因为如果单独宣布王辰、曹彬团队的研究结果,会影响吉列德的股价,同时把瑞德西韦临床试验的阳性结果和阴性结果同时公布出来,会淡化对阴性临床试验结果的解读。
一个新药的审批不是靠一两个试验就能完成验证的,它需要多个临床试验相互验证,而且有些试验是要依赖前面的试验才能够进步的。
按照美国FDA的要求,通常一个新药的上市需要两个独立的多中心临床试验来验证,但在紧急情况下,可能就不需要了,可以紧急授权,正如FDA公开信息中提到“有理由相信瑞德西韦的已知和潜在益处超过了治疗重症冠状病毒患者的已知和潜在风险。”瑞德西韦在有条件批准上市后,可利用临床应用的真实世界数据去补充验证,同时这也让患者和医生都有一定的心理安慰作用,这样也有一定角度的社会意义。