当父母发现孩子没有像预料中那样发育后,持久的拜访医生、住院和检查只会增加他们的痛苦。美国南卡罗来纳州格林伍德基因中心诊断实验室主任Michael Friez提到,不确定性、费用和痛苦对家庭是毁灭性的。该机构是一个专门为临床医生分析患者基因的非营利组织。该中心临床遗传学家Roger Stevenson表示,几乎每个临床遗传学家都曾经历过无法鉴定出一个儿童神经发育疾病原因的情况。
在21世纪初,他开始接触一个家庭,他们还在学步时期的孩子存在严重发育问题,包括比平均值更小的头部和智力障碍。10多年过去了,诊断结果显示,这个男孩的DYRK1A基因发生了突变,该基因在大脑发育方面发挥了重要作用。该发现之后帮助诊断了其他16个有类似症状的美国和欧洲儿童。尽管这种情况无法扭转,但Stevenson认为,该诊断结果能安慰孩子的父母,让他们知道也有其他孩子有类似病情。
值得注意的是,这里涉及一种新生突变。新生突变能够发生在胚胎发育早期。荷兰奈梅亨大学医学中心遗传学家Joris Veltman表示,约80%的新生突变发生在父亲的精子中,20%发生于母亲的卵子中。引发失调的新生突变难以被察觉——它们隐藏于大量无害的基因变化中。于是,出现了许多基于软件的方法,寻找此类突变。随着测序设备和基因信息数据库变得越来越可用,工具建造者希望自己的软件能成为常规医疗护理的一部分。
但基因测序和分析跟血液胆固醇测试不同——必须进行样品制备。结果并不是非常好。一位患者的基因序列可能出现错误,例如机器误读DNA,必须被计算机过滤掉。甚至还存在无数的可能性残留。DNA碱基也可能与参考信息不同:基因序列能被插入或删除,而且一个基因的拷贝份数也能变化。但数千个此类变化中,可能只有一个在一种疾病中发挥作用。
研究人员将这个孩子的DNA与其父母的进行了对比。并非他们基因间所有的不同都与该儿童的疾病有联系。研究人员使用包含统计分析的软件确定哪种变化最可能起作用。而且,这些工具还增加了有关基因和疾病的出版数据等信息。这些结论能帮助制作基因变化或变体清单,并按照与疾病相关性的可能性进行排名。但变体分析仍是一门新兴科学,并且软件工具仍有待成熟。尽管如此,在某些情况下,这些方法能发现导致疾病的特殊基因变化。
但发现可能的基因“罪犯”并不意味着会有有效疗法。美国华盛顿大学遗传学家Donald Conrad指出,这些结论能帮助父母处理相关情况。诊断结果还能告知父母,家庭成员再次出现这种情况的风险,并帮助他们制定未来生育计划。而且,一些准父母可能选择遗传分析作为试管受精的一部分。Conrad表示,大部分新生儿会携带60~100个新生突变,但鲜少能引起可识别的疾病。软件可以帮助分类这些突变。
Conrad开发出了DeNovoGear,它能进行统计分析,从实验错误导致的背景噪音中区分潜在重要信号。该软件还能分析测序错误的性质和频率。然后,通过对比父母、孩子和其他家庭成员的基因,以便从其他类型的基因变异中判断新生突变。
相关软件还必须与测序设备产生的错误作斗争,例如把C错报成T。Conrad提到,这些错误很稀少但难以预测,并可能解释寻找新生突变时的一些假阳性结果。
高通量测序设备在一些DNA区域更可能出现错误,Conrad提到,比例约占到该基因的15%,因此目前的技术只能在另外85%的范围内可靠地探测新生突变。研究人员必须进行后续试验,梳理真阳性结果,例如使用烦琐但精确的桑格测序法分析存在疑问的基因区域。“每个测序平台都各有特点。”Conrad说,而且探测新生突变的最优方法需要将该设备的特点与统计模型相结合。
Conrad还在开发能够估计基因不同区域各种测序错误频率的统计方法。
Veltman及其同事测序和分析了50位严重智力障碍患者的基因。通过与美国完整基因公司和中国华大基因(BGI)的合作,研究人员利用诸多资源鉴别出新生突变。他们使用BGI的技术和软件进行基因分析和对比,并削减致病“候选者”的数量。但研究人员并未使用DeNovoGear等其他工具分析数据,因此Veltman无法对比不同的方法。
但他表示,BGI分析的优势在于,软件能与测序技术的规格相匹配。结果显示,相关软件显示出探测新生突变的高敏感性,并能精确诊断几乎一半的患者。另外,在Veltman看来,与癌症和糖尿病等疾病相比,解释智力障碍的突变更有可能,因为许多严重智障似乎都是由单一突变造成的。他还表示,该研究的测序治疗很好,但即便最好的测序技术也会漏过或误判新生基因。
Veltman提到,为了误差最小化,研究人员需要寻求最高质量的基因测序。除此之外,解释诸多遗传变异是该领域的一大瓶颈。研究人员还需要找到更好的方式,分析基因非编码区域的新生变异。
FastQForward是一种用于分析蛋白质编码和非编码基因区域的工具,它将软件程序VAAST、pVAAST和Phevor结合在一起。美国犹他大学计算机遗传学家Mark Yandell联合开发出这些工具。
Yandell和同事分析了700多万人的家族历史和其中约400万人的医疗记录。他们使用pVAAST分析了参与者的家族世系。他表示,该研究处理了具有亲缘关系的人们的基因带来的统计学挑战。而且,该项目探测到新生突变。Yandell希望基因分析能很快成为常规临床诊断的一部分。
他和VAAST的联合开发者、Omicia公司科学主任Martin Reese开发出Opal平台,帮助临床医生解释和使用软件基因分析得出的结论。
最终,该领域的临床标准将会出现,但对于目前的服务供应者而言,他们认为使用这些技术是复杂分析的最好方式。Reese相信许多疾病都与新生突变有关。他表示,这些关系难以确定,但全基因分析提高了发现它们的可能性,正如Veltman研究展示的那样。
Conrad提到,只有当疾病基因复杂度能被更好地理解、工具开发者找到应对办法以及高通量测序的技术问题得到解决时,新生突变检测才能成为标准医学测试。软件和全基因组测序发现的20%~90%的新生突变都是假阳性结果。“研究人员能通过后续确认研究进行调节,但这对常规诊断测验而言并不实用。”Conrad说。而且,基因中难以测序的区域还需要更好的方法,并且软件必须覆盖各种突变。
Conrad表示,研究人员需要更好地理解高复制量的突变、重复序列区域和其他类型的DNA重新排列。
使用遗传分析诊断患者的格林伍德基因中心也提供商业服务。致力于遗传分析的科学家和公司很快将能使用一些共享资源。Friez表示,他希望知道这将如何帮助神经发育障碍患者。
到目前为止,这些患者的家庭和临床医生都面临同样的问题:研究人员辨别与疾病有关的突变的能力通常与这些突变的医学理解不相匹配,并且治疗方法研发还有很长的路要走。无论如何,Veltman表示,基因会告诉这些患者和家庭一些答案。“我听到临床的同事说,这些家庭非常高兴终于得到一个答案。对于疗法而言,虽然限制很多,但一直在发展。”他说。