2022年7大“颠覆性”技术之一——完整版基因组(T2T genome)
近日,《自然》对“可能在未来一年对科学产生影响”的7项技术进行了综述。这7项技术分别是完整版基因组、蛋白质结构解析、量子模拟、精准基因组调控、靶向基因疗法、空间多组学、基于CRISPR的诊断。
完整版基因组,也就是T2T(Telomere-to-telomere)基因组,2021年的研究成果已经使科学界为之沸腾。2021年5月发表的一篇预印本论文中,第一个人类基因组的端粒到端粒序列,为人类参考基因组序列GRCh38增加了近2亿个碱基对,并完成了人类基因组计划的最后一章。
在人类T2T基因组推进的同时,大量科学家开始着手模式植物、作物等物种的T2T基因组测序和组装的工作。2021年,拟南芥、水稻、大麦等物种T2T文章大量报道。通过长读长测序技术进行T2T基因组的完善,在新基因的鉴定及物种遗传变异分析、近着丝粒基因挖掘、片段重复及变异研究、表观遗传图谱研究、着丝粒多样性等多研究中取得了亮眼的成绩。
ONT ultra-long 测序助力T2T基因组
随着三代测序技术的发展,特别是高连续性的ONT ultra-long 测序和高准确性的HiFi测序强强联合,克服了着丝粒或高重复区域的组装困难问题,染色体的连续性和完整性大大提高,为T2T基因组的组装奠定了基础,使基因组组装进入近0 gap时代。
AG代理基因是国内少数能稳定产出高质量ONT ultra-long 数据的服务商之一,长期致力于物种基因组组装技术的提升和研发,对生产、分析进行全流程优化,拥有百余例物种基因组组装经验,克服复杂物种基因组和T2T基因组的组装难题。
同时,AG代理基因生产研发部专注于提高三代ONT测序数据的产量和质量,关注ONT ultra-long对基因组组装质量的提升。
目前,已实现ONT ultra-long单张芯片产出超20G的测序reads N50>100Kb的数据,链接:();已经完成多个物种基因组的ONT ultra-long reads组装。
各类型基因组研究策略
AG代理基因针对T2T基因组近完成图和T2T完成图,推出多种组装策略:
AG代理基因——基因组组装实例
AG代理基因对多个物种进行基因组近完成图组装,多策略组装后,contig数逼近物种染色体数,基因组contig N50有显著提升,实例如下:
T2T基因组深入探究
组装出物种T2T基因组后,对已完成的物种基因组有以下几个研究方向:
T2T基因组研究——高分案例
参考案例1:The structure, function and evolution of acomplete human chromosome 8
期刊: Nature (IF = 49.962 )
组装策略: ONT ultra-long (20x)+HiFi (32.4x)
研究结果:
首次使用互补的长读测序技术完成了对于人类8号染色体的线性组装和解析,解析了5个以前长期存在的缺口序列。证实了二倍体人类基因组中着丝粒的整体结构和甲基化模式。填补了对于染色体中着丝粒重复区域的认识。
参考文献:
Logsdon GA, et al. The structure, function and evolution of a complete human chromosome 8. Nature. 2021.
参考案例2 :The genetic and epigenetic landscape of the Arabidopsis centromeres
期刊: Science (IF= 47.728)
组装策略: ONT ultra-long 73.6 Gb(~56×)+ HiFi 14.6 Gb(~111.3×)
研究结果:
该研究首次73.6 Gb(~56×)ONT超长数据和14.6 Gb(~111.3×) PacBio HiFi测序数据,使用测得数据改进Col-0基因组(命名为Col-CEN v1.2)。
使用 Col-CEN 序列,设计了FISH 探针来标记特定的着丝粒阵列,对染色体特异性卫星进行细胞遗传学验证。
利用组装完整的拟南芥Col-CEN基因组,发现同一染色体着丝粒上的CEN180序列存在均质化的趋势,而ATHILA逆转录转座子的插入促进CEN180序列的多样化,均质化和多样化共同推动了拟南芥着丝粒的进化。
为了解拟南芥自然自交系中着丝粒多态性、遗传和表观遗传的全球模式提供有价值的参考。
参考文献:
Naish M, et al. The genetic and epigenetic landscape of the Arabidopsis centromeres. Science. 2021.