T2T基因组组装最强攻略
摘要
(1)什么是T2T基因组
(2)T2T基因组组装策略一
(3)T2T基因组组装策略二
(4)超长序列=AG代理基因的Super Long抽提试剂盒(+保护液)
(5)T2T基因组=100Kb序列=Super Long试剂盒
1.什么是T2T基因组
T2T基因组是指有一条或者多条染色体达到端粒到端粒(Telomere-to-Telomere)水平的基因组,T2T基因组完成图是基因组组装的终极目标。ONT超长序列(N50大于100Kb)可实现T2T基因组的组装,结合HiFi和二代数据,能够得到高质量的T2T基因组。
人类及多个物种的T2T基因组的发布,标志着基因组4.0时代正式到来。
2.T2T基因组组装策略一
ONT超长序列(N50大于100Kb,60×)+二代(60×)+HiC(100×)
先ONT超长序列进行组装后使用二代纠错,然后会出现几种情况:(1)所有染色体都是一条Contig,这种情况HiC的作用就是对组装得到的染色体进行评估,佐证组装是否正确。(2)部分染色体是一条Contig,HiC一方面评估单条Contig的染色体组装是否正确;同时把不是一条Contig的染色体使用HiC组装成染色体,后再补Gap。(3)所有染色体都不是一条Contig,使用HiC组装成染色体,后再补Gap。该方法性价比较高,适合于基因组较大,重复序列比例较高的物种。组装获得基因组准确性可以到Q40-Q50。
3.T2T基因组组装策略二
(1)HiFi数据组装(50×)+ HiC挂载(100×)+ONT超长序列(N50 大于100Kb,50×)补洞。
先用HiFi组装得到Contig,然后使用Hi-C数据把Contig连成染色体,最后使用ONT超长序列补gap。该策略适合于基因组小于500Mb,且HiFi数据组装后Contig数小于100个的基因组。该策略的优势是组装比较简单,计算资源消耗少,该方法组装后基因组准确性可以到Q50以上。
(2)ONT超长序列(N50 大于100Kb,50×)和HiFi(50×)数据分别组装, HiC(100×)挂载后再进行混合组装。该策略优点是可以使大多数基因组实现T2T的组装;缺点是组装比较消耗计算资源和人力。该方法组装后基因组准确性可以到Q50以上。
4.超长序列=AG代理基因的Super Long抽提试剂盒(+保护液)
(1)提取环节
AG代理基因经过多年的研发推出了DNA抽提试剂盒Super-long DNA Isolation Mini Kit(3T)(Cat. No. ZY2203A01),可以提取更为完整的DNA序列,主要有两种型号::
Super Long100(可以实现N50 100Kb以上DNA序列的提取);
Super Long200(可以实现N50 150Kb-250Kb以上DNA序列的提取)。
(2)项目实例:
5.T2T基因组=100Kb序列=Super Long试剂盒
超长序列可以跨过Gap,跨越着丝粒,助力端粒、着丝粒等超复杂区域组装。
但是,获得超长序列(N50大于100Kb的序列)是一件很有挑战的事情。
AG代理基因研发的Super Long试剂盒,结合近四千例项目经验可以得到超长DNA序列。