科研人员建立灵长类特异新基因数据库并系统预测新基因功能

作者: 张勇

来源: 中国科学院动物研究所

发布日期: 2019-03-25

中国科学院动物研究所张勇课题组开发了人类新基因数据库GenTree,鉴定了846个灵长类特异新基因,并推测了这些基因的功能。该研究对理解新基因在人类演化中的作用提供了重要参考。

灵长类特异乃至人特异新基因起源是推动人类表型演化的重要推动力,但只有少量新基因功能已知。近年来基因编辑技术和类器官技术的发展使得系统揭示新基因在人之所以为人这一演化过程中的贡献成为可能。然而,由于基因年龄推断方法的差别以及较低的新基因注释质量(很难区分新蛋白编码基因和假基因),文献中已经发表的灵长类特异新基因(PSG)数据集相互之间差别极大。一个相对可靠的PSG数据集的缺乏阻碍了深入的功能研究。

中国科学院动物研究所张勇课题组通过整合进化基因组和功能基因组数据开发了人类新基因数据库(GenTree, http://gentree.ioz.ac.cn)。GenTree可辅助用户分析基因何时起源、如何起源以及可能的功能。

基于GenTree数据的整合分析发现:1)以基因组共线性为基础的基因年龄推断方法与其它方法相比对近期起源的基因有较高的准确率;2)蛋白水平的选择压力推断和蛋白基因组方法(proteogenomics)只能注释部分灵长类特异基因的蛋白编码能力。该研究考虑了这些方法各自的特点之后鉴定了846个PSG。其中,254个基因有不同程度的蛋白支持证,该集合也包含了41个错误注释的假基因(如MYH16)。

基于GenTree中所整合的转录组数据,该研究通过共表达分析推测了846个PSG的功能。与此前的认识相符,PSG经常呈现睾丸特异或睾丸偏好的表达;但PSG也呈现骨髓或胎盘偏好的表达谱。有意思的是,虽然PSG在成年脑中的表达量较低,但在孕中期胎脑表达上调。富集于各共转录网络并占据网络较核心位置的PSG可能推动了精子发生、免疫反应、母胎互作以及胎脑发育等快速演化的生命过程。

总体来看,该工作提供了一个专门的人类新基因数据库,产生了相对高质量的PSG列表并推测了这些基因的功能。结果中所展示的年龄推断方法、基因注释方法的特点以及新基因器官特异的功能偏好性对研究其它物种种系特异基因的工作具普遍参考意义。该研究于3月12日在线发表于Genome Research(doi:10.1101/gr.238733.118)。博士研究生邵毅、陈春燕为共同第一作者,张勇为通讯作者。

龙漫远、何斌、沈浩、朱政霖、余大奇、降帅、赵石磊、高志强、付岩、陈希、高歌、陈华等合作者在文章写作、网页开发、数据分析方面提供了大力支持。该研究得到中科院先导专项、国家自然科学基金委员会和科技部的资助;计算需求得到中科院北京基因组研究所基因组测序与数据分析中心和动物所高性能平台的支持。

UUID: d502870e-1060-48f7-9242-311c22fac297

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院之声公众号-pdf2txt/2019/中科院之声_2019-03-25_科研人员建立灵长类特异新基因数据库并系统预测新基因功能.txt

是否为广告: 否

处理费用: 0.0034 元