Nat Biotechnol发文:多款测序平台性能评估成果发布,华大智造测序仪可提供高质量WGS
导读
目前,海量的DNA-seq数据可以作为一个强大的基准资源,促进临床应用的进一步标准化,以及评估新的方法、化学和方案。但评估大规模平行DNA-seq平台的重现性、准确性和实用性仍然是一个挑战。
近日,由生物分子资源设施协会(Association of Biomolecular Resource Facilities, ARBF)主导的ABRF NGS II期研究成果发表于Nature Biotechnology,文章题为“Performance assessment of DNA sequencing platforms in the ABRF Next-Generation Sequencing Study”。研究团队基于来自Illumina、Pacific Biosciences、Thermo Fisher Scientific、BGI、Oxford Nanopore Technologies和Genapsys的多款测序平台,在多个实验室对同一人类基因组家族、三个单独菌株和十种细菌的宏基因组混合物进行测序,并将各平台数据进行全方位、系统性比较,分析各个测序平台的性能差异和测序质量,以提供真实全面的参考证据。
数据显示,在短读长测序平台中,Illumina的HiSeq 4000和HiSeq X10平台提供了最一致、最高的基因组覆盖率,华大智造的BGISEQ-500、MGISEQ-2000平台提供了最低的测序错误率。在长读长测序平台中,PacBio CCS具有最高的基于参考的映射率和最低的非映射率。PacBio CCS和Oxford Nanopore的PromethION、MinION平台在重复序列丰富的区域和跨均聚物检测中均显示出最佳的序列定位性能。NovaSeq 6000使用2×250 bp读取化学是捕获已知INDEL事件的最强大的仪器。
文章发表在Nature Biotechnology
研究团队在约30个实验室通过不同技术平台进行同一人类基因组测序,包括Illumina的HiSeq、NovaSeq系列平台,Thermo Fisher的Ion S5、Proton平台,PacBio的CCS平台、Oxford Nanopore的PromethION、MinION、Flongle平台,华大智造的BGISEQ-500、MGISEQ-2000平台,Genapsys的GS111平台。除Ion Proton和S5平台进行全外显子组测序外,利用其它平台进行了全基因组测序。
对于细菌基因组,研究团队使用Illumina MiSeq,Thermo Fisher Ion PGM和S5,Oxford Nanopore MinIon、Flongle和Genapsys的GS111平台对宏基因组样本进行了测序。
后续数据分析包括各平台产生的reads比对到基因组的能力、测序覆盖度、复杂区域测序错误率、不同突变类型的检出率以及影响因素等。通过这些全面的系统比较分析,为各平台比较和选择提供真实有效的参考。
图1. 试验设计图。图片来源:Nature Biotechnology
01
基因组覆盖率:各测序平台均表现较好
DNA重复序列分为Alu、L1、L2、LTR、微卫星、简单重复和端粒区域。对于DNA重复序列的检测:BGISEQ-500、HiSeq4000、NovaSeq 2x150bp在捕获Alu区域时具有优势;HiSeq 2500、HiSeq X10和NovaSeq 2x150bp在捕获L1、L2和低复杂度区域表现最好;PacBio CCS和NovaSeq在微卫星区域和简单重复区域的测序中表现最好;PromethION平台擅长捕获端粒区域。
图2.不同平台的基因组覆盖率。图片来源:Nature Biotechnology
02
测序错误率:BGISEQ-500、MGISEQ-2000的错误率最低
图3. 各个平台测序的错误率比较。图片来源:Nature Biotechnology
03
SNV和INDEL突变检测:华大智造DNBSEQ平台表现亮眼
图4. 各平台SNPs和INDEL检出情况。图片来源:Nature Biotechnology
04
细菌基因组测序
该研究中,ThermoFisher的Ion PM和S5平台在错误率方面略胜一筹。对于复杂的宏基因组样本,Illumina MiSeq,Thermo Fisher Ion PGM、S5,Oxford Nanopore MinIon等所有平台都能够识别混合物中的所有菌株,但对基因突变的捕获水平差异较大。
图5.复杂宏基因组混合物中细菌基因组测序的重复性。图片来源:Nature Biotechnology
该研究共同第一作者、美国纽约威尔康奈尔医学院生理与生物物理系Jonathan Foox教授表示:“在研究人类基因组及其组成时,我们总是尽可能地接近真实的事实。虽然这不能直接解决问题,但将有助于创建一个强大而可靠的基线,并以此作为任何个体基因组的参考”。
ABRF NGS二期研究是一项全面的DNA测序性能评估依据,同时也提供了重要的参考资源。但并不是将一种系统与另一种系统进行比较,只是提供最为客观的证据。更为重要的是,大家可以根据这些数据集为自己的研究设定基线,并以此来选择适合自己研究的测序平台。同时,该研究再次支持了测序领域的一些传统观点,例如长读长和短读长测序方法最终将在临床应用中实现互补。
通过横向比较分析,该研究为大家展示了不同测序技术和平台的性能,除了传统短读长测序技术的长期优势再次得到佐证,更多新技术平台的优势也值得更多关注,例如华大智造DNBSEQ国产平台、Genapsys平台和Oxford Nanopore的Flongle等新技术的强劲展示。通过该研究,大家不仅看到了各个测序平台的“百花齐放”,同时也看到这些新兴测序平台依托精益求精的性能指标,正在不断成长。作为国产测序平台的领跑者,华大智造DNBSEQ平台基于其独特的测序文库方法,在该研究中表现亮眼,且独具优势。分析表明,华大智造测序平台(文库制备和测序)可提供高质量的WGS,包括变异检测的敏感性和特异性。这些优势对基因研究和诊断应用非常重要。
关于ABRF