近日,北京基因组所生命与健康大数据中心(BIG Data Center,BIGD)有七篇数据库文章陆续被国际学术期刊核酸研究(Nucleic Acids Research,NAR)杂志接收,这七篇研究成果将在该刊2019年1月的数据库专刊中集中刊发。
去年NAR连登四篇大数据中心研究成果已属突破性研究进展,今年BIGD再创辉煌,有六篇针对不同研究领域的特色专业数据库文章和一篇介绍大数据中心整体资源建设进展的文章集中发表。
自2016年以来,这已经是第三年NAR以国际数据中心的模式来介绍BIGD资源和成果。
在2018年1月份发布的数据库专刊简介“The 2018 Nucleic Acids Research database issue and the online molecular biology database collection”的开篇部分,NAR就已经将BIGD与美国NCBI、欧洲EBI一起作为国际数据中心进行了介绍,表明BIGD已跻身全球知名生物大数据中心行列。
今年BIGD再次发布整体建设成果与进展(Database Resources of the BIG Data Center in 2019)。全文介绍了BIGD的核心数据资源,包括数据(Data)、信息(Information)、知识库(Knowledge)三大部分;2018年开发的新数据库资源和以往数据资源的整合及完善。
文章最后还介绍了BIGD的数据提交系统BIG Submission,用户访问控制系统BIG SSO,对于不同资源提供的大量索引数据执行查询和搜索服务的BIG Search,目前BIG Search已整合了PlantTFDB、LncRNADisease、DEG、lncRNASNP等20个来自不同合作单位的数据库资源。
为了促进生物大数据有效利用与转化,我们针对一些重要的研究领域,如长非编码RNA(lncRNA)、表观遗传甲基化、RNA编辑、核小体定位等进行了专门的数据分析与知识审编。
表观组关联分析知识库EWAS Atlas是一个完全基于人工审编和文献挖掘的知识库。当前版本的EWAS Atlas主要关注DNA甲基化这一重要的表观修饰。EWAS Atlas一共整合了401篇文献中649个研究报道的329,172个高质量甲基化与表型关联。
犬类数据库iDog是家犬(Canis lupus familiaris)和野生犬的综合资源库,数据来源于Dog 10K Genomes Project,旨在为犬类生物学研究提供各种数据服务。
RNA编辑与疾病相关知识库EDK是基于文献挖掘的RNA编辑与疾病关联关系的知识库,整合了与人类疾病相关的异常RNA编辑和RNA编辑酶活性异常事件。
植物RNA编辑数据库PED是一个植物RNA editosome数据库,旨在对植物RNA编辑信息进行全面的审编、整合及标准化。
人类长非编码RNA数据库LncBook提供了目前为止数据量最大的人类lncRNA数据集。
多物种全基因组核小体定位图谱数据库NucMap是基于大规模数据整合分析的多物种全基因组核小体定位图谱数据库。