T2T基因组项目文章 | 园艺顶刊HR发表草莓属首个T2T基因组揭示草莓基因组进化和栽培八倍体草莓起源
2023年2月20日,园艺学顶刊《Horticulture Research》在线发表首个野草莓T2T基因组。南京农业大学程宗明教授、海南大学陈飞教授为共同通讯作者,AG代理基因研发人员舒自强、蒋冕为共同作者,并参与T2T基因组部分分析工作。
AG代理基因为本研究提供全套测序服务(ONT ultra-long、PacBio HiFi、Hi-C等)及部分分析工作。
该研究组装得到迄今为止完整度最高的Fragaria vesca T2T基因组,结合作者对栽培草莓起源的系统发育推断,为Fragaria的基因组进化提供洞察力,并促进草莓遗传学和分子育种。
文章题目:The Telomere to Telomere genome of Fragaria vesca reveals the genomic evolution of Fragaria and the origin of cultivated octoploid strawberry
发表期刊:Horticulture Research(IF=7.291)
发表时间:2023.02
主要研究结果:
1、 Fragaria vesca的T2T gap-free基因组
该研究生成了大约32.67 Gb的ONT ultra-long reads(reads N50>100 kb)、27.31 Gb PacBio HiFi reads和32.10 Gb的Illumina双端数据用于基因组组装。使用44.56 Gb的Hi-C数据用于挂载和组装验证。测序数据统计详见表1。
表1 基因组组装和注释所用文库
该研究对ONT Ultra-long reads和PacBio HiFi reads分别组装,去除非核序列后,分别得到8个和52个高度连续的contigs,将HiFi组装的contigs进行挂载(图1B),然后使用gap-free的ONT基因组填补HiFi组装中的gaps,得到无gap的F. vesca参考基因组(v6.0)。组装得到的基因组大小为220.8 Mb,数据一致性比对率为95.4%-99.6%,BUSCO为98.8%。
图1 F. vesca完整基因组组装
对F. vesca (v6.0)基因组进行注释,重复序列比例为35.63%,共注释得到36,173个基因。该研究对F. vesca(v6.0)基因组与旧版本v4.0进行比较,发现v4.0组装中的所有130个gaps都在v6.0中得到填补。共线性分析显示v6.0和v4.0基因组之间有213 Mb的共线区域(图1C)。
表2 当前的基因组组装和以前的组装的特征
2、 F. vesca基因组中新注释的基因
将v6.0与v4.0注释到的基因进行比较,得到多个新注释的基因,并对新基因进行功能富集等研究。
图2 与v4.0a2版本相比,v6.0版本的新注释基因
3、 端粒和着丝粒的特征
该研究鉴定了F. vesca的端粒和着丝粒区域,7条染色体共鉴定到14个端粒及7个着丝粒(表3)。
表3 野草莓的端粒和着丝粒
4、 草莓属染色体进化
作者对栽培草莓及3个二倍体野生近缘草莓的染色体演化进行了研究。研究发现F. vesca基因组是这些草莓属物种中最保守和稳定的,在γ - WGT后基因组重排事件最少。而栽培草莓F. × ananassa的分裂和融合事件较多,表明在倍性融合后可能发生了额外的基因组重组(图3A)。亚基因组分析进一步分析发现,F. × ananassa的AAAAAABB基因组结构,其中3个AA亚基因组来自于F. vesca群,BB亚基因组来自于F. viridis群。
图3 Fragaria vesca对栽培八倍体草莓的贡献
总结:
该研究F. vesca T2T基因组组装、注释获得1153个新基因,且所有染色体均鉴定出端粒、着丝粒结构。所有的染色体均鉴定出2个端粒和1个着丝粒。通过草莓属系统发育分析结果表明,F. vesca和F. viridis是栽培的八倍体草莓F. × ananassa的祖先。
这一高质量T2T gap-free的F. vesca基因组,结合对栽培草莓起源的系统发育分析,将有助于深入了解草莓属基因组进化,促进草莓遗传和分子育种。
参考文献:Yuhan Zhou, et al. The Telomere to Telomere genome of Fragaria vesca reveals the genomic evolution of Fragaria and the origin of cultivated octoploid strawberry, Horticulture Research, 2023.