文献解读 | New Phytologist期刊发表基于基因组组装揭示草莓风味关键基因及其调控元件
文章简介
风味是影响消费者偏好的关键因素和植物育种界日益关注的焦点。在水果作物中,鉴定挥发性有机化合物的关键基因对风味改善研究有促进意义,但很多水果作物是多倍体且杂合度较高,因此减缓了风味改良的进程。近日,美国佛罗里达大学的研究人员对八倍体栽培草莓进行了基因组、转录组和代谢组研究,并通过多组学手段揭示了控制草莓风味的关键基因和其调控元件。在本研究中,作者综合分析了多组学数据,包括含有196个不同育种系的表达数量性状基因座图(eQTL)、一个高风味育种选择系的单倍型基因组、基于五种单倍型的全基因组结构变异图,以及 300余个草莓个体的风味全基因组关联分析(GWAS)数据。此外,作者还鉴定到了很多与风味化合物相关基因的重叠调节元件、结构变异以及和GWAS关联的等位基因特异性表达变异,这些对于果实风味的形成十分重要。本文的研究结果提供了一个鉴定水果作物风味基因的分子框架,并为具有复杂和理想风味作物品种的分子育种展示了途径。
题目:A multi-omics framework reveals strawberry flavor genes and their regulatory elements
发表期刊:New Phytologist(IF=10.323)
发表时间:2022.08
主要研究结果
1、高分辨率eQTL作图
为了全面了解栽培草莓果实表达基因的等位基因多样性和遗传调控网络,作者分析了196个主要来自北美的个体转录组,包括133个新测序的基因型。修剪后(100kb窗口中r2<0.4),仍有168 476个标记位点用于群体遗传分析。基于最大似然系统发育树、主成分分析(PCA)和种群结构建模(k=3),UC和UF种群形成了预期的不同聚类,UC群体具有高度均匀性,外部来源的贡献较小,而UF种群中混合了0%至30%的UC贡献(图1)。与之前Hardigan等人的估计相比,Fst(0.057)较小,这种较小的Fst可以部分解释为最近努力引入外来资源来扩大风味特征。除了高密度标记外,标记间的低LD对于高分辨率eQTL定位至关重要,作者观察到短程LD(r2≈ 0.2)在UF和UC群体中均以小于250bp的距离衰减。此外,本研究使用491896个标记的eQTL定位揭示了33397个水果表达基因的68535个eQTL,约53.7%的eGenes(n=62181)至少有一个eQTL(图2)。与Liu等人和Albert等人eQTL的研究类似,作者发现反式eQTL并非均匀分布,而是聚集在分散的热点,最终该研究共确定了2141个热点。
图1 草莓(Fragaria×ananassa)表达数量性状位点(eQTL)群体的遗传分析
图2草莓(Fragaria×ananassa)表达数量性状基因座(eQTL)的全基因组特征
2、草莓的结构变异
由于在水果表达基因中发现了大量的调控元件,因此结构变异(SV)图谱将非常有助于识别潜在的致病SV。为了构建SV图谱,该研究首先组装了UF登录的阶段性基因组。FL 15.89-25的基因组被组装成1480和672个contig,N50分别为12.8和12.4Mb,与其他最近的优质八倍体草莓基因组具有相似的连续性。Kmer显示,基于亲本Illumina的单倍体组装的完整性分别为97.1%和99.2%,BUSCO-eudicots odb10基因的完整性分别为98.1%与98%。与“Camarosa”参考基因组进行比对,96.0%和92.8% 的contig分别被挂载到28条染色体上,分别用于F12和Bea单倍体组装,在最终的Scaffold中仅有88个79个gap(图3)。利用FL 15.89-25组合和另外三个单倍体组合来探索花园草莓中的SV多样性,这些地理上和遗传上不同的材料让我们能够在几乎所有染色体上发现SV(图4)。插入和缺失是最常见的SV类型,共有88.3–94.1%,通过合并SV的非冗余集合,共鉴定出56342个缺失、60983个插入、12016个易位、166个散在重复、236个串联重复和137个反转;平均62.6%的草莓SV由至少两种单倍型共享。此外,作者发现结构变异广泛存在于外显子(8675个缺失和3782个插入;图3f)、内含子(6715个缺失和9922个插入)和启动子区域(15495个缺失和18566个插入),转座因子是SVs的丰富资源。为了研究SVs是否与水果中的等位基因特异性表达(ASE)相关,作者对FL 15.89-25成熟水果的四个生物重复进行了总RNA测序,在重复中观察到等位基因表达比率的一致密度分布。总共12503个基因显示出显著的ASE。该研究还利用KEGG富集分析鉴定了几种富含ASE基因的二级代谢途径如萜类骨架生物合成、苯丙酸生物合成等。
图3 FL15.89-25基因组(Fragaria×ananassa)的组装质量评估
图4 花园草莓(Fragaria×ananassa)的结构变异景观
3、果实挥发物全基因组关联分析
为了研究果实挥发物的遗传控制,作者对来自UF草莓育种计划的305份材料进行了挥发物表型和SNP阵列基因分型,共有49330个标记。基于挥发物之间的关系,该研究确定了至少5个属于相同化学类别或生物合成途径的簇。对于35种挥发物,全基因组关联研究确定了62个信号,该研究的GWAS结果证实了这些挥发性QTL先前的同源群分配,并阐明了它们的亚基因组和物理位置。如SNP AX-166515537是三种酯的主要SNP,Chr 6A上的14Mb区域共享六种中链酯的信号等(图5)。
图5 草莓(Fragaria × ananassa)果实挥发物全基因组关联分析
结论
本研究利用杂合八倍体的eQTL、GWAS和单倍型基因组组装结果来识别风味基因及其调控元件的等位基因变异,这些有利的挥发物等位基因可以通过标记辅助选择以改善整体水果风味。此外,该文对于草莓基因调控景观、SV多样性、顺式和反式调控元件之间的复杂相互作用以及亚基因组优势给出了更多的解释,包括证实了Fragaria×ananassa的繁殖种群中存在着巨大的遗传多样性,且表明即使高度驯化的种群也含有大量的表达调控元件和结构变异。