大豆是重要的粮食经济作物,为人类提供了主要的油料和蛋白资源。大豆起源于中国,古称“菽”,约在5000年前由其野生种驯化而来,随后广泛传播于世界各地。大豆在引种和改良过程中产生了遗传瓶颈效应,使来自不同主产区的大豆品种间具有显著的遗传变异。目前,我们广泛采用的大豆参考基因组来源于美国品种“Williams 82”(Glycine_max_v2.0)。
该单一品种的基因组并不能完全代表所有大豆的遗传变异,特别是和美国地理距离遥远具有明显遗传变异的亚洲品种。此外,功能研究发现该基因组存在多处组装错误,影响了功能基因的定位挖掘。
中国科学院遗传与发育生物学研究所联合中国科学技术大学、江苏省农业科学院种质资源与生物技术研究所、北京贝瑞和康生物技术有限公司等综合运用单分子实时测序(SMRT)、单分子光学图谱(optical mapping)和高通量染色体构象捕获技术(Hi-C),对中国国审大豆品种“中黄13”的基因组 (Gmax_ZH13) 进行从头组装,最终得到1.025 Gb的基因组序列,包含20条染色体和1条叶绿体。
该基因组Contig N50为3.46 Mb,Scaffold N50为51.87 Mb,是目前连续性最好的植物基因组之一。
进一步分析表明,Gmax_ZH13和Williams 82基因组之间存在着大量的遗传变异,包括1404个易位事件、161个倒位事件、1233个倒位易位事件,以及在Gmax_ZH13中出现的505506个小插入/缺失(1-99 bp)和17409个大插入/缺失(≥100 bp)。
该研究整合大量转录组数据为Gmax_ZH13基因注释基因构建了一个完整的基因共表达网络。通过已报道控制大豆开花时间的基因与新定位的QTL或GWAS区间内候选基因的共表达关系,对新定位区间内控制该性状的基因进行更精确地筛选,得到26个可能控制大豆开花时间的基因,并利用自然群体遗传变异和表型差异的关联对其中部分基因进行验证,为重要农艺性状基因的挖掘提供了新思路。
Gmax_ZH13基因组的发表为大豆基础研究提供了重要资源,为国产优异大豆品种的培育奠定了基础。相关研究于7月27日以封面文章形式在线发表于Science China Life Science,题目为De novo assembly of a Chinese soybean genome。
遗传发育所研究员田志喜课题组博士申妍婷为论文第一作者,田志喜为通讯作者,中国科大教授马世嵩、江苏农科院种质资源与生物技术研究所研究员杜建厂为共同通讯作者。该研究得到国家自然科学基金、中国科学院战略性先导科技专项(A类)、植物细胞与染色体工程国家重点实验室项目的资助。