项目文章| IND CROP PROD期刊发表基于基因组组装揭示高质量中华水芹基因组研究成果
研究简介
中华水芹(Oenanthe sinensis)是一种营养丰富的水生蔬菜,为伞形科多年生草本植物。除了作为蔬菜被关注,还因其对水质的净化功能而被重点研究,在水芹中,深入了解纤维素和木质素生物合成的遗传结构对提高水芹品质和水环境适应性至关重要。但在此之前,有关水芹的报道主要集中在生理、胁迫反应和基因表达方面,该研究则组装出了中华水芹染色体水平的高质量参考基因组,为水芹的育种工作提供了珍贵的分子资源。AG代理基因为该研究提供了基因组测序服务。
文章题目:High-quality genome sequence reveals a young polyploidization and provides insights into cellulose and lignin biosynthesis in water dropwort (Oenanthe sinensis)
发表期刊:Industrial Crops & Products(IF=6.449)
发表时间:2022.12.28
主要研究结果
1、 水芹基因组的组装和注释
该研究利用illumina短读序列和PacBio长读序列,组装获得了大小为990.83Mb、contig N50长达47M左右的染色体水平基因组(表1),且与流式细胞术及K-mer分析评估的大小接近,并结合HI-C测序数据,将98.86%的区域定位到了21条染色体上。以上测序工作该团队选择在AG代理基因开展。二代数据比对率和覆盖度分别为99.68%和97.21%,完整的BUSCO占97.8%,综上所述,组装的中华水芹基因组在质量上高度准确且完整。在基因组注释方面,作者同时使用了从头预测、同源预测和转录本预测三种方式。水芹基因组中,62.02%是重复序列,其中TE占比最高,而LTR又是含量最高的TE类型。共注释到54711个蛋白质编码基因,97.78%在不同的数据库中预测到了功能。
表1 水芹基因组组装质量统计
2、 比较基因组分析
本研究中,14个具有代表性的植物基因组序列被提取、并与水芹进行了比较基因组分析,结果在水芹中共鉴定出接近4000个特有基因家族,KEGG富集分析表明这些基因家族可能参与了蛋白质加工过程。此外,系统发育分析(图1)表明,水芹和伞形科物种芹菜、香菜亲缘关系最为密切;分化时间评估发现,水芹和芹菜、香菜大约在17.9百万年前分化,而和胡萝卜的分化更早一些,大约在22.2百万年前。有一点特别值得注意,相比较芹菜、胡萝卜和香菜,水芹基因组具有更多发生扩张的基因家族,这暗示着水芹可能经历了更多的复制事件;于是,作者接着对发生扩张的基因家族成员进行了功能富集分析(GO&KEGG),发现这些基因很可能影响水芹的抗水分胁迫、光合作用及药用价值等等。
图1分化时间估计和基因家族扩张/收缩分析
3、 全基因组复制分析
WGD被认为是影响植物基因组进化和物种形成的主要因素。在本研究中,水芹KS图上出现了3个峰,其中距离现在最近的峰比较特殊、是水芹特有的,而在芹菜、香菜和胡萝卜中没有出现。作者推测水芹可能单独发生了一次比较新的多倍化事件,对于这个猜测,作者也在此次研究中采用了共线性等一系列分析得到了证实(图2)。因此,该研究揭示了发生在物种形成之后的水芹额外的一次WGD事件,它独立于之前报道的伞形科常见的两次WGD事件。
图2 进化时间推测和基因组全局比对
4、 水芹的核型进化
众所周知,真核生物的染色体基数是7;而伞形科下的芹亚科原始染色体数目是11。曾有科学家提出,7个祖先染色体经过真核生物γ事件和伞形科常见的2次多倍化后,转变成了伞形科的11个原始染色体模型。本研究中,研究者重点对水芹进行分析,发现水芹染色体在进化上相对保守,保留了大量的祖先染色体片段;并推测水芹是经历了一系列祖先染色体的分裂或交叉,最终导致了现在的21条染色体核型(图3)。
图3 现存伞形科核型演化
5、不同水分条件对水芹光合特性、纤维素和木质素积累及解剖结构的影响
作者观察到水芹在涝渍条件下生长更健康、气孔孔径更大,纤维素含量也更高。此外,解剖结构和自体荧光分析发现,水芹根部具有明显的木质部结构以及明显的通气组织,且这种组织在涝渍条件下会发育得更好(图4)。
图4 不同水分条件下水芹光合特性、纤维素和木质素含量
6、转录组分析
本研究还对三种不同水条件下生长的水芹进行了转录组分析。对鉴定到的差异表达基因进行聚类发现,水分充足条件下,大部分DEG在水芹中高表达;而干旱条件下只有少数DEG在水芹中高表达。此外,GO和KEGG分析发现这些基因在生物合成、碳水化合物代谢和环境适应方面显著富集,尤其是发现了与细胞壁组织或者生物发生及分解代谢过程相关的DEG。作者从这些DEG主要编码的酶(如CesA、PAE、XET、LAC等)的角度,最终得出了结论:不同水分条件可能调控了木质素/纤维素生物合成及细胞壁代谢。之后,本研究作者还基于转录组数据,采用WGCNA方法研究了差异表达基因的共表达网络(图5),这些基因一共被划分成了8个共表达模块,在这些模块基因中,作者发现Os0507490.1是共表达网络中的枢纽基因,其编码的产物已经被报道参与萜类吲哚生物碱的生物合成;此外,还鉴定到一个与纤维素和木质素含量密切相关的AP2转录因子基因Os0268330.1,揭示其可能调控木质素和纤维素的代谢。
图5 调控木质素和纤维素生物合成的潜在基因WGCNA分析
小结
在该研究中,通过综合使用HIFI长读、illumina短读测序及HI-C技术,作者首次报道了中华水芹染色体水平的参考基因组,描述了水芹基因组的进化特征,同时鉴定了一些重要的基因家族以及调节纤维素和木质素代谢的枢纽基因。这为推进水芹的育种工作提供了新的宝贵资源,也为未来伞形科植物的比较基因组学奠定了基础。