中国人泛基因组图谱上引争议,基因数据究竟该不该共享?

作者: 苏惟楚

来源: 知识分子

发布日期: 2023-07-10

中国人群泛基因组联盟发布的研究成果引发了关于基因数据共享的广泛讨论,支持者认为数据共享有助于科学研究和公众福祉,而反对者则担心隐私和数据安全。研究显示,中国人群的基因组数据在国际上仍存在较大缺口,强调了建立中国人群专属基因图谱的重要性。与此同时,基因数据的跨境共享也面临伦理和法律挑战,呼吁在保护遗传资源的同时促进国际合作。

日前,复旦大学、西安交大、中国医学科学院等26家单位联合发布了中国人群泛基因组联盟一期研究进展,该成果发表在Nature主刊,这项研究初步构建了首个中国人群专属的泛基因组参考图谱,且该成果全部由中国科学家独立完成。

复旦大学引述研究人员的介绍,此次新发现的遗传变异可能与亚洲人群特有的疾病易感性及表型多样性有关。其后,舆论场上对于中国人群基因组数据是否该向全球公布的大讨论就此展开,在一张被引用甚广的截图中,一位“新加坡董玉振博士”将这项研究斥为“自己出钱把肾脏割下来送人沾沾自喜”。

尽管研究团队声明,该研究涉及的样本信息和数据的公开发表均已获得国家人类遗传资源管理部门批准。诸多自媒体跟进时,关于“这东西不适合向外发”、“把中国人的秘密暴露在别国面前”等论调,仍不绝于耳。基因数据究竟是否能够与他国共享?

赞成者说:数据共享是开放科学的应有之意,“共有、共享、共为”的原则,才使得各国科学家可以充分利用数据进行研究,为临床医学研究和新药研发提供更可靠的信息,这是为了公众的福祉。反对者大多出于隐私与数据安全的担忧。在发展中国家和贫困地区,这种担忧经常还夹杂着一种对基因矿藏被掠夺的复杂情绪。有分析认为,后一种担忧有其历史原因,那是源自发展中国家和欠发达地区在过去被外国剥削和侵略的痛苦记忆。

有些人担心过于开放,也有些人担心不够开放。多位研究者向《知识分子》提及他们对基因数据共享不够的担忧:如果对国际合作和数据共享制造壁垒,在未来也可能导致我们在获取国际数据时遭遇同样、甚至更高的壁垒;绕开中国人群,我们对相关疾病的患病机制也缺少了解,药企在研发时也会受到阻滞。从这层意义上,讨论基因数据究竟是否应该共享,也许不如讨论基因数据该如何共享。

制作中国人群专属基因图谱,是“很正常的操作”。

要解释复旦大学本次发布的这批共享基因数据是否值得担忧,我们需要看看他们发布的是什么数据。作为遗传物质的基本单位,基因是万物的基础,人类的基因组大概有30亿对碱基对,其中每隔1000个碱基对会有一个单核苷酸多态性(SNP),每个个体大概有400万-500万个SNP,而人与人的不同正是来源于此。因此人类参考基因组被视作一张导航图,是解析人类起源和演化、解析人类表型和疾病的遗传基础的根基。

在中国人群的研究中,一直不乏中国科学家的身影。2001年,包括中国在内的六国科学家共同参与的人类基因组计划,首次公布人类基因组草图,这被视作人类基因组计划成功的里程碑。当时,中国科学家承担总测序量1%的测序任务。最初公布的人类参考基因组信息由多位志愿者基因组拼接而成,由于捐献者信息保密,非正式的报道称,其中大部分DNA来自居住在纽约州布法罗的一名男性。

二十多年过去,人类参考基因组经历数十次更新迭代,但通用的人类参考基因组皆由欧洲白人为主体样本构建。因此,这种人类参考基因组无法代表人类群体中存在的大量遗传变异,给基因组分析带来了参考偏差的问题。一种说法是,预测疾病风险时,对于有色人种而言,仅对照当时的参考组,可能会产生较大的风险低估。

国际科学家联合成立了“人类泛基因组”联盟(HPRC),试图建立更精准完整的人类参考基因组,反映世界人口的多样性。

今年5月,HPRC制作的首个人类泛基因组参考草图在Nature发布,纳入了全球47个样本,其中包括3例中国南方汉族样本。除此外,中国科学家经批准也参与了多项国际合作,其中包括著名的国际千人基因组项目,2015年,该项目发布了第三期数据,包括2504个样本基因组,涉及来自非洲、美洲、亚洲、欧洲的26个族群,其中包括来自中国的汉族和傣族。

今年6月,复旦大学徐书华教授、西安交通大学叶凯教授联合国内26家单位发起中国人群泛基因组联盟(CPC),在Nature发布了第一期研究计划,对中国36个族群的58个样本采用第三代高保真基因组测序技术进行深度测序,发现了人类通用参考基因组缺失的1.9亿个碱基对的参考序列。

和HPRC发布的泛基因组图谱相比,CPC发布的中国人群专属的泛基因组参考图谱中,新发现了1079个基因拷贝数变异,包含药物代谢基因CYP2D6等在内的中国人群中富集而在世界其他人群中出现频率较低的若干基因拷贝数变异等。研究人员称,新发现的遗传变异可能与亚洲人群特有的疾病易感性及表型多样性有关。

西湖大学生命科学学院特聘研究员郑厚峰告诉《知识分子》:“这是第一次用第三代基因测序的技术对36个族群的样本进行测序,也发现了更多的遗传变异,这有助于我们对复杂疾病的研究。”在业内人士看来,此次CPC公开研究成果得到国家人类遗传资源管理部门批准,“是很正常的操作”。“这次的质疑同宣称‘新冠病毒’是针对亚洲人制造出来的基因武器,是一脉相承的说法。”

“新冠病毒很难做到只感染亚洲人,”郑厚峰解释,“新冠病毒感染人体细胞的关键在于,冠状病毒的S蛋白与人体细胞ACE2蛋白的结合。如果人体细胞是一间屋子,新冠病毒是强盗,ACE2是门把手,S蛋白拉住它,病毒从而闯进人体细胞。”亚洲人群和欧洲人群的区分,不是依靠某个或数个基因位点,而是基因组中,几十万或上百万的基因位点在不同人群中频率的差异,才能在群体水平上区分欧洲人群和亚洲人群。

当新冠病毒进入人体后,并不会检查整个基因组来分辨欧亚人群,感染与否在于个体的细胞是否表达ACE2蛋白。现有的研究已经显示,亚洲人和白人的肺部组织中ACE2基因表达没有显著差异。

另外,由于中华民族是一个文化概念而非生物学概念,其人群来源包括蒙古、欧洲、东亚本土等,因此,“针对中华民族的基因武器”这一说法,在当前来看也很难实现。

英、美、新加坡、印度等多国都在共享自己的基因数据。事实上,共享基因组序列数据的文化起源于1996年在百慕大举行的一次会议,来自五个主要测序中心的代表在会上一致通过,将超过一定规模的基因组测序数据在产生后的24小时内提交到公共数据库,并遵循“共有、共享、共为”的原则。自此,基因研究领域奠定了开放科学的基石,各国科学家可以充分利用数据进行研究,为临床医学研发提供更可靠的信息。

20多年来,各国相继建立生物样本库,且以不同限度面向全球科研人员。郑厚峰告诉《知识分子》,他使用最多的是来自英国生物银行(UK Biobank)的数据。该样本库建立于2006年,募集了50万名英国志愿者,采集并储存了他们的生物样本(血液、尿液、唾液),并进行了十余年的跟踪记录。研究者们在实际工作中,对不同地区生物样本库的使用都有所观察。

郑厚峰告诉《知识分子》,在他的使用体验中,数据最为开放的是UK Biobank,“只需要研究者写一个proposal,经过委员会同意就可以使用。在我的印象中,UK Biobank的数据申请之前比较慢,可能一两个个月审批才能下来,但现在非常快。”

“此外,我们也申请过美国、印度和新加坡的数据。到目前为止,我提交的申请基本都审核通过。”事实上,基于前文提到过的百慕大原则,以及“人类共同遗产”“全球公共产品”等概念,基因组数据的公开共享被视作应有之义。支持数据共享的观点认为,广泛共享和利用数据,能更有效地利用医疗资源,尤其对控制突发传染病特别重要。此外,数据共享还有利于研发更安全有效的诊断治疗手段。

当前各个国家和地区的生物样本库也以不同程度向外开放;越来越多的研究联盟相应成立,以利用研究人员和临床医生收集的基因组数据促进基因组合作研究。以UK Biobank为例,全球各地的学术或商业研究人员都可以提交申请访问50万参与者的大量数据,申请必须“符合公共利益健康相关的研究”。由于样本的有限性和可消耗性,获取生物样品的申请可能受到更严格审查。

而使用UK Biobank的研究结果也需重新纳入其资源中,以便其他人可以从研究结果中受益。UK Biobank也被认为是对人群癌症研究的重要资源。截止2022年9月,该库的癌症登记处收录了超过43000例癌症病例,包括常见的乳腺癌、前列腺癌、结直肠癌、肺癌,也包括一些相对罕见的癌症。

自2017年UK Biobank发布了全基因组关联分析数据之后,其在加速识别与癌症风险相关的遗传变异方面发挥了核心作用。使用英国生物银行数据的诸多国际研究确定了特定癌症的新易感位点,比如结肠癌、宫颈癌等;还发现了影响多种癌症风险的基因。

2021年,杭州医学院公共卫生学院蒋兆强在《国外生物样本库大数据伦理管理的现状与启示》中,引述了来自欧洲研究中心和前沿技术研究所的调查:欧洲的170个生物样本库或组织中,17%的数据在欧盟内分享,33%在全球范围分享,20%为数据研究者共享,10%为本单位共享。同时,该文对各国部分生物样本库的开放、共享进行了汇总:基因数据共享,哪些是真正需要担心的?

当然,对于基因数据的跨境共享,并不乏顾虑的声音,且这种声音并不独存于中国。在西方,人们的担忧更多出于隐私和数据安全方面的考量。一般来说,最好的保密措施是将样本匿名化处理,但一些研究结果可能对提供者有临床意义,匿名化将降低个体受益,且降低样本的研究价值。

美国贝勒医学院医学伦理与健康政策中心教授Mary A. Majumder等人在2016年对1319名美国成年人进行调查,受访者中,53%的人对于自己的健康信息被美国学术人员获取感到不舒服,73%的人对健康信息被美国以外的学术人员获取看到不舒服;此外,25%的受访者不相信美国境内的学术研究人员会保证健康信息的安全,51%的受访者不相信美国境外的学术研究人员会保证其健康信息的安全。

此外,研究者们也认为,除了隐私和数据安全方面,对经济竞争的担忧也是一部分原因,尤其生物医学研究常被视作国民经济增长的引擎。研究人员提到,在亚非拉地区,一些担忧是出于过去长久以来被殖民剥削的痛苦记忆。

有一种概念叫“直升机研究”(Helicopter research),通常描述发达国家的研究人员直接前往发展中国家进行违法伦理的研究,当地居民可能并未享有足够知情权,当地科学家也被排除在研究之外,且贡献了基因数据的当地人也缺失成果的惠益分享。

“这可以理解为某种‘伦理倾销’,即发达国家的科研伦理法规、伦理审查制度相对完善且严格,但一些发展中国家和欠发达地区缺乏相关法律规范,或者伦理标准、审查能力相对较低,发达国家的研究者以极低的成本就可能获取大量生物样本和信息,从而进行科学研究和药物研发。但样本和信息的提供者及其所在国并未从研究中获得平等的受益。”

北京协和医学院人文学院副教授张迪介绍,1996年哈佛大学的研究者在中国安徽等地采集了大量生物样本,这些行动被指控未能尊重受试者,受试者知情权未得到保障,且他们也没有获得承诺的免费医疗服务。类似的事件在巴西、印度西亚等地也曾发生。

“自此之后,我们意识到人类遗传资源的珍贵性,像矿产一样,不能随便卖出去,需要有闸门限制流通。如果发布,也需要明确其限制类别和审批手段。

并且将保护人类遗传资源上升到国家安全层面。”于是,1998年,国家层面第一次专门为管理人类遗传资源制定文件,即《人类遗传资源管理暂行办法》。其中严格控制重要人类遗传资源的出口、出境和对外提供,需要申报及获得中国人类遗传资源管理办公室的批准。

2019年,国务院发布了《中华人民共和国人类遗传资源管理条例》,其中明确规定,外国组织、个人及其设立或者实际控制的机构不得在我国境内采集、保藏我国人类遗传资源,不得向境外提供我国人类遗传资源。如果外方需要利用我国人类遗传资源开展科学研究活动的,应“采取与我国科研机构、高等学校、医疗机构、企业(以下称中方单位)合作的方式”进行,并保证中方单位及其研究人员全过程、实质性地参与研究,依法分享相关权益。

国际科学研究的合作过程中,利用我国人类遗传资源产生的所有记录以及数据信息等应当完全向中方单位开放,并向中方单位提供备份。

“暂行办法和管理条例的出台,对于外国组织和研究者来说,意味着如果你想做中国方面的研究,需要以合法和公平合作的方式开展。”张迪总结。

近年来,科技部做出了多项行政处罚决定,最集中的一批处罚于2018年发出。其中包括华大基因和上海华山医院未经批准将遗传信息公开披露,该研究发表于2015年,基于10000多名中国女性的匿名序列数据,华大基因承认没有获得论文补充材料发表的许可。其发言人在后续表示,根据科技部要求销毁了这些数据。

被争议遮蔽的公众福祉讨论此次讨论中,我们可以意识到,经过1996年的事件,我们吸取了对人类遗传资源重视与保护不足的教训。近十余年,我国生物样本库进入大规模建设阶段,但一些问题依然没有得到足够讨论。比如当下,样本使用的知情同意、隐私保护、再次同意等问题也成为国内生物样本库主要面临的伦理挑战。张迪说,“此前,生物医学研究中普遍存在的有效知情同意的问题。

一些患者样本的获取不甚清晰,比如本来采5毫升血液就足够完成研究,但一些研究者可能采10毫升,但患者并不充分知情,多出来的5毫升是做什么研究。”

“还有一些样本,研究者或申办方可能长期持有,但他们并没有向受试者说明研究结束后,样本将如何处理?保存多久?是否会用于其他研究?是否会转移给第三方?是否销毁以及何时销毁等等。”

“现在好了很多,药物临床试验,基本都会按照新版的药物临床试验质量管理规范,以及新出台的伦理审查办法,明确样本使用。但在早些年,没有法律法规明确要求的时候,一些研究者或申办方并不会主动说这些事。”

尽管我国各地多个机构都建立了不同规模的生物样本库。然而,由于建设和整合共享缺少顶层设计和监管,生物样本种类不全,样本质量参差不齐。多数生物样本仅限机构内使用,即使在国内,跨机构共享的动力仍然不足。

2023年7月,科技部制定的《人类遗传资源管理条例实施细则》正式实施,优化了行政许可和备案范围。同时,为进一步提高我国人类遗传资源管理效能,中止了“人类遗传资源管理办公室”运行,并委托中国生物技术发展中心开展人类遗传资源管理相关技术工作。

不止一位研究者提出,此前繁琐且并不顺畅的申报沟通机制,可能阻碍了中国相关研究的进展。

2015年,郑厚峰作为英国十万人基因组计划(UK 10K)中骨质疾病项目的主要执行人,首次发现了EN1基因罕见变异对欧洲普通人群骨密度和骨折的影响,这一发现为包括骨质疏松症的诊断和防治研究提供理论和实践基础。在他回到国内后,也曾希望建立一个类似的公开的生物样本库,“我们按照科技部的要求,申请采集、保藏资质,但申请过程中发现,我们对于很多细节和条件并不清楚。

我们提交材料,他们驳回,但给的意见也很粗糙,我们并不清楚如何改进。”

他和团队在当时始终无法拨通中国人类遗传资源管理办公室的公开电话。“确实存在这种情况,”张迪说,“进行伦理审查时,伦理审查委员会的委员时常会提醒研究者注意申报人遗。研究者自己可能会觉得很麻烦,毕竟申报过程占用不少时间和精力,如果在人遗上拖太多时间,研究进度可能会受到严重影响。”

此外,不太顺畅的申报机制也可能造成药企做探索研发工作时绕开中国人群。“你可以说是保护我们的遗传资源,但从另一方面讲,如果不在本国开展这方面研究,是否会不利于我国患者获得某些药物或检测?”

“科研伦理的发展史中,一些学者指出,在美国本土开展的临床试验多为白人男性受试者,黑人、白人女性相对少,这意味着药物上市前缺乏这些人群的安全性信息,增加了上市后该人群整体的用药风险,不符合公正原则。同样的道理,我们在遗传资源管理、药物临床试验和基础研究中也应该关注这一问题,避免同样的问题和风险在中国出现。”

“去年,我们和科学界就《人类遗传资源管理条例实施细则》的修订进行过讨论,有科学家指出,在上世纪90年代,我们在基因组学和生物医学的研究确实相对落后,但现在这种情况已经有一定程度上发生改变。”张迪说,“时至今日,我们应该对自身在生物医学领域的国际地位有更清晰的认知,并基于此完善生物样本和人类遗传资源管理。

在符合伦理的前提下,我们要审视这些监管壁垒是否合理,是否可能导致国际合作时对方也筑起高墙,阻碍合理的双边或多边国际合作研究。

UUID: bfa20baa-0959-43c9-a6ea-e7dce378c2a2

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/知识分子公众号-pdf2txt/2023年/知识分子_2023-07-10_中国人泛基因组图谱上Nature引争议,基因数据究竟该不该共享?.txt

是否为广告: 否

处理费用: 0.0309 元