T2T基因组系列(一):后基因组时代的到来
随着物种基因组研究的不断发展,测序技术的不断提升,物种基因组的连续性和完整性也都得到大幅提升。物种基因组从普通二代测序组装的draft genome(基因组1.0),到使用PacBio或ONT(R9.4)测序技术结合Hi-C组装的high-quality genome(基因组2.0),再到由ONT(N50>50Kb或R10)测序技术组装的near complete genome(基因组3.0),以及结合ONT ultra-long 和PacBio HiFi技术组装的T2T genome(基因组4.0)。
(T2T基因组,指通过ONT ultra-long N50>100Kb结合HiFi和二代数据进行混合组装,得到的有一条或者多条染色体达到端粒到端粒(Telomere-to-Telomere)的水平基因组,T2T基因组完成图是基因组组装的终极目标)
物种基因组的不断提升,到T2T基因组的出现,都标志着基因组研究已经进入4.0时代——即ONT N50>100Kb超长序列实现的T2T基因组组装的时代。
AG代理基因长期致力于基因组测序和组装技术的研发,实现了N50>100Kb超长序列的建库测序稳定产出并开发了相应组装流程,针对基因组4.0和基因组3.0研究推出了以下研究策略:
1 超长序列(N50>100Kb)=T2T基因组
AG代理基因针对基因组4.0和基因组3.0研究推出了以下研究策略:
2 端粒序列和着丝粒序列验证实验:FISH和ChIP-seq
T2T基因组的标志是染色体着丝粒和端粒的完整组装,通过FISH鉴定着丝粒区域,通过ChIP-seq对着丝粒进行精细定位,并对端粒重复序列进行检测,完成T2T验证。
AG代理基因对多个物种的基因组进行组装,得到T2T基因组,如下:
T2T基因组——深入探究
1.新功能基因鉴定及物种遗传变异分析
获得物种T2T基因组,能够填补此前未被组装到的基因组片段,能够修正历史版本的组装错误,同时能够解锁基因组复杂区域。即物种完整的T2T基因组,意味着能够检测到很多新的基因和遗传变异信息。
2.着丝粒多样性研究
动植物着丝粒区域存在大量的串联重复序列,该区域也一直被称为 “基因组黑洞”。组装获得物种T2T基因组,利用ONT Ultra-long测序优势,点亮“基因组黑洞”,通过ChIP-seq和FISH实验佐证,对于了解物种着丝粒的多样性及结构功能进化起到重大推进作用。
3.近着丝粒基因研究
着丝粒是真核生物染色体的重要结构。借助ChIP-seq技术,对着丝粒DNA开展深入研究,功能着丝粒区存在具有转录活性的基因,且部分基因具有重要生物学功能,是新基因研究的热点区。基于完整组装的物种T2T基因组,结合ChIP-seq技术,准确定位着丝粒区域,深入探究近着丝粒区域功能基因。
4.片段重复及变异研究
大片段复制(Segmental duplications, SDs)在人类疾病和物种进化中具有重要意义,由于SDs结构复杂,这些高度相同的SDs是人类基因组中最后完成的区域之一。基于物种T2T基因组后,与历史版本参考基因组进行比较,鉴定出此前未被成功组装的SDs,并对SDs区域的单核苷酸变异(SNV)和甲基化等特征进行研究,是目前物种基因组研究的亮点。
5.表观遗传图谱研究
DNA 甲基化是表观遗传学的重要组成部分。现有的表观遗传研究忽略了未组装和无法定位的基因组区域(如着丝粒、端粒臂、亚端粒等)。T2T基因组,结合ONT测序技术优势,直接获取碱基修饰信息,对完整组装的着丝粒等区域深入研究,揭示物种基因组表观遗传特征,为研究物种表观遗传调控提供新见解。
T2T基因组——高分文章精选
T2T基因组——应用方向案例精选