文献解读 | 榼藤染色体水平基因组组装为三萜皂苷的生物合成提供新视角!
作为一种药用植物,榼藤的次生代谢物尤其是三萜皂苷含量较高,是重要的科研和医药资源,然而,参考基因组的缺乏限制了对其进化和药用潜力利用的研究。
本文利用Illumina、Nanopore和Hi-C技术对榼藤进行了染色体水平的基因组组装,作为该属第一个高质量组装的参考基因组,该研究不仅将为该属的进化研究和榼藤的保护生物学提供新的信息,还将为药用植物次生代谢物的形成和利用奠定基础。
文章题目:Chromosome-level genome of Entada phaseoloides provides insights into genome evolution and biosynthesis of triterpenoid saponins
发表期刊:Molecular Ecology Resources(IF=8.678)
发表时间:2022.06
研究结果
1、 榼藤基因组组装
三种测序策略Illumina、Nanopore和Hi-C用于对榼藤基因组的组装,研究得榼藤基因组大小为456.18Mb,contig N50比之前报道的豆科植物如紫花苜蓿等基因组长度更长,然而,456.18Mb的组装大小略小于K-mer和FCM分析给出的预期大小,作者认为这可能涉及到一些高重复序列的缺失;Hi-C数据将获得的contigs成功锚定在14条染色体上,Scaffold N50达30.90Mb,组装已达到染色体水平;此外,完整BUSCO占比达98.8%,也说明了与其他豆科植物相比,该基因组的组装质量更高(图1)。
图 1 榼藤的基因组特征
2、 榼藤的重复注释和基因注释
在组装好的榼藤基因组中,52.7%序列被鉴定为重复序列,其中串联重复和TES分别占基因组的2.92%和51.38%,另外,反转录元件的LTRs是最丰富的散在重复序列;作者还发现榼藤和Vigna unguiculata在基因组大小及TEs总长度方面均很接近,认为TEs总长度与基因组大小密切相关。在榼藤基因组中共注释到24894个基因,编码NcRNAs的基因包括102个miRNAs、729个tRNAs、627个rRNAs和281个SnRNAs;还检测到1597个转录因子基因,涉及到68个转录因子家族。
3、 榼藤基因组的进化
基因家族聚类分析研究显示,榼藤基因组中多拷贝基因家族比例比单拷贝基因家族的比例低得多,遗传冗余度很低(图2b)。系统发育分析表明,榼藤呈单支状态、处于其他豆科植物的外群、且在101.1Ma与Cu. Sativus分化开来,在72.0Ma与其他豆科植物发生分化。与进化树上所有植物共同的祖先(MRCA)相比,榼藤基因组中,共有1028个基因家族被扩张,2769个基因家族被收缩,分别有13个和81个基因家族显著扩张和收缩,说明在适应性进化过程中,更多的榼藤基因家族经历了收缩而不是扩张,结构域分析和KEGG分析表明,显著扩张的基因家族和疾病与应激反应相关,例如可能与植物-病原菌的相互作用有关(图2 a)。
图 2 榼藤的系统发育分析和基因家族聚类
4、 榼藤的WGD和染色体进化分析
检测到的和榼藤有关的WGD事件包括:发生在~182Ma的古代γ-WGD事件、分别发生在~130Ma和72.8Ma的2次古代WGD事件;共线性分析表明,榼藤与G. max之间的共线基因数远多于其与Vitis vinifera之间的共线基因数,WGD和共线性分析结果共同表明在WGD事件之后榼藤还发生了染色体的融合、分裂和重排事件。该研究还探讨了榼藤的核型起源和进化,结果表明来自21个双子叶植物祖先的榼藤发生了至少118次染色体断裂和125次染色体融合,且证明了榼藤最早是从豆科谱系分化出来的(图3)。
图3 榼藤、蒺藜苜蓿、鹰嘴豆、四季豆和绿豆祖先染色体的构建
5、 萜类和TS生物合成调控基因的进化
该研究在组装中发现了与TS两个合成途径(MVA和MEP)有关的基因家族,同时,还鉴定到了48个EpTPs基因,它们被证明和TS的合成有关,物种的TPs系统发育分析表明(图4),豆科植物TPS-b亚基因家族基因的广泛扩增可能是串联复制或最近的WGD事件导致的,也可能是导致豆科植物中丰富的特征萜类积累的原因。此外,该研究还在榼藤中鉴定到374个TS修饰基因,分别是256个CYP和118个UGT,并被归入36和29个基因家族。
图4 榼藤等6种植物TPS基因家族的系统发育树
6、齐墩果烷型TS基因的表达模式
齐墩果烷型TS是榼藤中主要的活性产物,对榼藤中TS生物合成基因的表达分析表明,CYP和UGT家族基因在不同组织中的表达有所不同,表明了表达谱因组织而异,其中CYP72在所有的组织中低水平表达或完全不表达,作者认为基因CYP72可能不是榼藤合成TS的主要途径;此外,作者还发现这些基因家族在果仁中的表达水平明显高于在其他组织中的表达水平,这也解释了为什么果仁的代谢谱与其他组织的不同。
7、榼藤中TS的生物合成分析
本研究中,作者采用WGCNA来寻找参与TS生物合成和调控的潜在候选基因,对果期不同组织中DEGS的表达进行了WGCNA分析,确定了11个不同的基因模块,分析结果表示:榼藤可能和许多豆科植物一样,存在植物激素和胁迫诱导的TS合成;此外,文章推测,除已知的关键基因外,许多其他调控因子也参与了TS合成的调控网络(图5)。
图5榼藤茎发育过程中参与三萜皂苷调控的基因网络和关键候选基因
研究结论
该研究获得了456Mb的榼藤染色体水平的基因组,其中重复序列占比52.7%,确定了24894个蛋白质编码基因;估计了榼藤与其他豆科植物的分化时间在72.0Ma,且经历了与大豆相同的WGD事件。此外,发现了榼藤中的几个基因家族与萜类的生物合成密切相关,尤其是OSC和TPS两个基因家族,可能已经进化成独特的齐墩果烷型三萜类骨架;最后,该研究还利用比较转录组学分析揭示了榼藤TS生物合成途径基因在不同组织中的表达模式。总之,这些数据不仅将为研究榼藤属的进化和榼藤的保护生物学提供新的视角,还将为次生代谢物的形成和药用植物的开发利用奠定基础。
参考文献:
Lin M, et, al. Chromosome-level genome of Entada phaseoloides provides insights into genome evolution and biosynthesis of triterpenoid saponins. Mol Ecol Resour. 2022.
AG代理基因使用Nanopore平台完成了全球首个大型复杂植物基因组菊花基因组的组装和后续分析工作。现已完成500余例真核生物的Nanopore及PacBio基因组测序及组装,服务项目包括:哺乳动物、鱼类、农作物、药用植物、昆虫、原虫、真菌等多类型复杂样本。由AG代理基因主导提出并推动千种本草基因组计划,并构建药用植物基因组数据库,已发表多篇药用植物基因组高水平文章,引领药用植物基因组研究前沿。