项目文章详解 | ONT组装秋葵线粒体基因组,研究基因转移与线粒体DNA分子重排
秋葵Okra(Abelmoschus esculentus L. Moench)是重要的经济作物,以其黏汁液而闻名,该研究基于ONT和Illumina测序数据,对秋葵线粒体基因组进行组装和研究。组装结果表明,秋葵的线粒体基因组主要以2个独立分子的形式存在。此外,该研究发现秋葵的叶绿体和线粒体之间存在广泛的序列转移,并对秋葵线粒体基因组中的蛋白质编码基因的RNA编辑事件进行了表征。本研究为秋葵提供了高质量的细胞器基因组,并促进了对细胞器基因组间基因交流的理解,为秋葵品种的选育提供了新视角。
AG代理基因MitoRun 细胞器分析小组参与了秋葵细胞器基因组组装及部分分析工作。AG代理基因目前已承接并完成近千例物种的细胞器基因组测序及组装。由于植物线粒体构象多样、结构复杂,AG代理基因结合二代与ONT三代数据进行线粒体基因组de novo组装,对复杂植物线粒体组装和分析有较为成熟的项目经验,期待能为广大科研学者提供测序及植物线粒体组装服务。
文章题目:The complete mitochondrial genome of okra (Abelmoschus esculentus): using nanopore long reads to investigate gene transfer from chloroplast genomes and rearrangements of mitochondrial DNA molecules
发表期刊:BMC Genomics (IF=4.54)
发表时间:2022.06
主要研究结果
1、秋葵线粒体基因组特征
该研究基于二、三代数据组装得到了一个包含12对短重复(SRs)和3对长重复(LRs)的复杂的组装结果,并在基于illumina的组装结果中显示了多条路径。作者通过手工模拟四种可能的路径,并基于long reads的mapping结果做出判断,来解决这些重复问题,通过合并冗余节点共得到12个contigs(表1)。
表1 每个组装序列的长度、深度和所包含的基因
根据contig长度进行编号,得到了两个独立的秋葵mtDNA分子,其中一个是具有复杂多分支构象的闭环结构(图1,上图)。另一个是典型的环状分子,包含一对长正向重复序列(LR11)(图1,下图)。
图1 秋葵线粒体基因组的组装图
mtDNA包含24个特有的核心基因和10个特有的可变基因(表2)。鉴定到的三个rRNA基因均为双拷贝基因,基于tRNAscan-SE,鉴定出18个独特的tRNA基因。
表2 秋葵线粒体基因组中的基因构成
此外,该研究在mtDNA中注释到许多质体基因,但大多数只是基因片段,如ndhB、psbC、psbE、psbF、psbL、ycf2、psaB、psbM、rps12和rpl14。然而,作者在其中观察到三个完整的质体基因,psbJ,psaA和rps7。该结果表明,秋葵cpDNA和mtDNA之间存在大量的序列迁移,并伴有基因转移。图2为mtDNA基因组图谱。
图2 秋葵线粒体基因组示意图
2、由重复序列介导的同源重组
该研究排除了基于ONT reads的假阳性重复序列,并鉴定了14对参与介导的基因组重组的重复序列,其中包括三对长重复序列(LR9、LR11和LR12),其余重复均为短重复,最长为322bp,位置如图3所示。
图3 秋葵线粒体DNA中重复序列的位置
在秋葵案例中,三对长重复序列介导的高频率重组。图1显示了三个长重复序列介导的可能构象。值得注意的是,四对短重复序列(SR2、SR4、SR7和SR8)的两个重复单元被发现位于两个线粒体分子上。它们能够以较低的频率参与两个分子的重组,使二者有机会合并成一个完整的线粒体分子。
3、秋葵细胞器基因组的细胞内基因转移(IGT)
秋葵叶绿体基因组(cpDNA)的组装和注释表明,这里获得的cpDNA与之前报道的几乎相同。因此,秋葵的cpDNA极为保守。该研究发现在线粒体基因组中存在来自质体的基因残基,这意味着在这两个细胞器之间有很多的序列迁移。
该研究使用BLASTn在两个细胞器基因组中寻找同源序列,以识别潜在的基因转移事件。共鉴定出28条同源序列(图4a),其中6条长度超过1000bp,最长为5142bp。随后,该研究提取并注释了这些同源序列,这些片段大多从cpDNA迁移到mtDNA,除了少数tRNA基因的序列高度相似,且无法确定迁移的方向,作者称之为线粒体质体序列(MTPTs)。
图4 在两个细胞器基因组中鉴定出的同源序列示意图
该研究注意到有7个MTPTs在组装过程中无法与叶绿体的同源序列进行区分,这些片段大多与cpDNA序列高度相似,通过ONT long reads的协助,证实了它们是从叶绿体迁移并整合到mtDNA中。
cpDNA中的mtpt14与其mtDNA序列分离,基于mtpt14同源序列的系统发育分析结果显示,线粒体序列被聚类为一个组(图4b)。此外,研究发现一些SNPs和Indels只在mtDNA中共享,表明该同源序列与两个细胞器基因组一起经历了不同的进化过程。
4、细胞器基因组PCGs中的RNA编辑位点
RNA 编辑在高等植物线粒体中广泛存在,可以产生在基因组序列中所不存在的起始密码子和终止密码子。在本研究中,作者重点研究了秋葵细胞器基因组PCGs中的RNA编辑事件。共有29个质体PCGs(图5A)和26个线粒体PCGs(图5B)被鉴定为经历了RNA编辑事件。
图5 秋葵细胞器基因组PCGs中RNA编辑位点的特征
该研究发现,在质体PCGs中发现的RNA编辑事件总数仅为85个,而在线粒体PCGs中发现的RNA编辑事件总数为281个。此外,该研究共鉴定了12种不同类型的RNA编辑,所有这些类型都在线粒体PCGs中检测到。然而,在质体PCGs中没有发现A到C和C到G的编辑类型(图5C)。其中,C到U的编辑在质体和线粒体中最为常见(分别为52和185)。在编辑效率方面,质体和线粒体的大多数PCGs的编辑效率在80%以上(图5D),低频编辑事件数相对较少。
总结:
本研究完成了秋葵细胞器基因组的测序和组装,获得了高质量的细胞器基因组,并对秋葵的细胞器基因组进行全面的比较,为研究线粒体和质体之间的基因转移提供了更广阔的视角。
利用ONT 测序和短读测序reads,可以准确地组装植物线粒体基因组。同时,ONT长reads也促进了这些复杂细胞器基因组的结构分析,能够更直观的描述植物线粒体基因组,特别是植物线粒体基因组的动态转化。秋葵的细胞器基因组的组装,为进一步研究秋葵细胞器基因组的结构和复制机制提供宝贵的信息。
参考文献:
Li J, et al. The complete mitochondrial genome of okra (Abelmoschus esculentus): using nanopore long reads to investigate gene transfer from chloroplast genomes and rearrangements of mitochondrial DNA molecules. BMC Genomics. 2022.
AG代理基因MitoRun 细胞器分析小组已承接并完成近千例物种的细胞器基因组测序及组装,由于植物线粒体构象多样、结构复杂,AG代理基因结合二代与ONT三代数据,对复杂植物线粒体de novo组装和分析有较为成熟的项目经验,期待能为广大科研学者提供测序及植物线粒体组装服务。