据《自然》报道,世界上最⼤、最完整的⼈类基因组数据库11⽉30⽇上线。英国⽣物银⾏当天发布了50万名英国志愿者的全基因组序列。世界各地的研究⼈员都可以申请访问这些数据,并利⽤它们探索与健康和疾病相关的遗传基础。2021年,英国⽣物银⾏曾公开20万名英国志愿者的全基因组数据,供全世界科学家研究使⽤。
这项耗资2亿英镑的研究由⽣物医学研究基⾦惠康基⾦会、英国政府以及⼏家制药公司资助,作为回报,这些公司在数据对外发布前9个⽉就能获得数据。此前,英国⽣物银⾏公布的遗传信息包括整个外显⼦组。每个外显⼦组占基因组的2%,负责编码蛋⽩质以及分布在基因组中的85万个常⻅的单碱基DNA变异。后者的信息为将健康和基因联系起来的全基因组关联研究(GWAS)提供了⽀持。
但是,当研究⼈员寻找遗传与疾病或其他性状之间的关联时,⼤多数“位点”出现在基因组的⾮编码区域,这些区域在外显⼦组序列中缺失,并且在现有的全基因组数据中仅以低分辨率覆盖。英国埃克塞特⼤学的⼈类遗传学家Michael Weedon说,全基因组还能帮助研究⼈员发现⾮常罕⻅的突变,这些突变往往⽐全基因组数据中包含的常⻅变异对某个性状的影响⼤。事实已经证明了这⼀点。
在11⽉20⽇公布的⼀篇预印本⽂章中,Weedon团队挖掘了英国⽣物银⾏公开的⾸批20万个完整基因组数据,发现了29种罕⻅的DNA变异,这些变异与⾼达7厘⽶的身⾼差异有关,⽽且在以前的基因研究中从未被发现。⼀项由美国政府资助的名为“我们所有⼈”的研究,计划最终公布100万⼈或更多美国⼈的全基因组和健康数据。
此前,这项⼯作已经公布了25万个基因组,但直到今年8⽉才开始接受⾮美国研究⼈员的数据研究申请。根据英国⽣物银⾏之前公开的20万个基因组数据的情况,芬兰赫尔⾟基⼤学的统计遗传学家Andrea Ganna指出,完整的基因组序列可能会帮助研究⼈员更准确地绘制出疾病与结构变异之间的联系。