Nature正刊!十二倍体甘蔗基因组发布!
北京时间 2024 年 3 月 28 日,国际顶级期刊Nature在线发布了题为“The complex polyploid genome architecture of sugarcane”的研究论文。该团队运用一系列先进的测序技术与生物信息学手段,成功破解了甘蔗基因组的复杂密码,构建出了高质量的栽培甘蔗基因组(R570)。这一里程碑式的参考基因组不仅完善了先前甘蔗物理遗传图谱的不足之处,更揭示了与单拷贝Bru1褐锈病抗性位点相关的可能因果基因。
研究背景
全球糖料作物之首——甘蔗(Saccharum officinarum),以其庞大的吨位产量在世界经济、贸易及地缘政治层面扮演着举足轻重的角色,其糖分产出量占据了全球总量的八成。尽管传统的育种实践已成功孕育出适应各类环境与病原体的品种,但近年来糖分增产潜力似乎遭遇瓶颈。这一现象可能归因于育种群体内部遗传资源的局限性、冗长的育种周期,以及甘蔗所特有的复杂基因组结构。
主要研究结果
1、R570基因组组装及注释
该研究选择现代广泛的杂交甘蔗品种R570进行测序,与其他现代栽培品种相似,R570的基因组大小大约为10Gb(2C),倍性约为12x,染色体数目2n≈114,其中一些染色体是通过双亲染色体重组而来。
研究团队利用PacBio HiFi、Illumina、Bionano等技术,结合遗传图谱、Hi-C数据以及共线性等方法,完成了甘蔗R570的primary(5.04G)和alternate(3.7G)基因组组装,其中primary的大小与采用流式细胞术方法预估的基因组大小(5G)基本一致。此外,由于R570有着来自grandparent POJ2878的血统,它的预期近交系数约为12.5%,因此,研究预期alternate基因组中大约有1.25Gb基因组序列的缺失,这些缺失的序列塌缩成primary基因组中的单一代表。最终,作者结合primary和alternate基因组信息,构建得到的8.72Gb基因组非常符合预期。接着,作者基于primary基因组,使用同源注释、转录组注释等方法进行基因组注释工作,预测得到194,593个编码序列(BUSCO=99.8%)。与之前的嵌合单倍体基因组相比,新构建的R570基因组存在六个同源基因拷贝,反映了预期的12x倍性的一半,并且与primary基因组期望的拷贝数目匹配。因此,本研究组装了迄今为止最完整的栽培甘蔗基因组(图1,表1)。
图1 现代栽培甘蔗R570的杂交历史和核型特征
表1 现代栽培甘蔗 R570 基因组组装与注释评估
2、R570基因组结构解析
接着,研究者进一步对甘蔗品种R570的基因组结构进行深入分析。R570基因组是由栽培种和野生种杂交而成的多倍体结构;研究发现,R570基因组中约73%的序列来源于栽培种Saccharum officinarum,而27%来源于野生种Saccharum spontaneum。尽管两个祖先物种有着不同的染色体倍性和染色体基数,但在R570中,这些染色体大多数是共线的且具有序列同源性,这有助于种间重组的发生。而且,研究团队在R570的primary基因组中发现了10条基础染色体中的7条发生了13次种间重组。此外,研究还利用高精度的PacBio HiFi读取来鉴定基因组中的复制序列和单倍型结构,发现大约一半的基因组序列在多个拷贝间是完全相同的,而另一半则包含足够的序列变异,能够通过PacBio reads进行独特单倍型的精确比对。这些发现为理解甘蔗的遗传多样性和育种提供了珍贵的信息(图2)。
图2 现代栽培甘蔗 R570基因组特征
3、R570基因组作参考的甘蔗育种研究
研究人员探讨了R570基因组对甘蔗育种的贡献,特别关注了R570基因组中与重要农艺性状相关的序列变异和拷贝数变异。通过比较栽培种和野生种的贡献,能够将基因模型分配给特定的祖先,并识别出与病害抗性和糖分含量相关的候选基因。此外,研究还发现了多个结构变异,这些变异可能会阻止重组并影响有益等位基因的产生。通过对R570基因组的详细注释,该研究为甘蔗育种提供了重要的分子目标,这将有助于加速甘蔗品种改良,提高其产量和适应性等(图3)。
图3 抗褐锈病基因 Bru1 候选基因座
研究小结
种间杂交甘蔗基因组非常复杂,该研究完成了对R570基因组的解析,也为理解复杂多倍体基因组的精细结构提供了可能。值得注意的是,该研究所提到的,使用多种测序技术的策略未来可能广泛应用于其他复杂植物基因组的组装工作。此外,该团队通过分析等位基因变异,拷贝数目变异和存在/缺失变异(PAV),也会增进我们对农艺性状遗传基础更深入的理解。最后,抗褐锈病基因Bru1的研究,以及对应串联kinase-pseudokinase的强相关候选基因的挖掘将有助于未来靶向验证实验的开展。
AG代理基因使用Nanopore平台完成全球第一个大型复杂植物基因组(菊花基因组)的组装和后续分析工作。提出并推动千种本草基因组计划,构建药用植物基因组数据库,推动药材研究的发展。此外,AG代理基因已率先完成T2T基因组、单倍型基因组以及泛基因组的分析研发工作,结合PacBio及Nanopore三代测序平台,已为全球学者提供数千个物种的基因组测序及分析服务。