国自然热点|泛基因组研究基础篇
2005年,“泛基因组”概念首次在微生物领域中被提出,发展至今,其定义和研究目标逐渐发生变化,指代一个物种的全部遗传信息,包括基因或非编码序列。截至2024年2月,以“Pan-genome”or"Pangenome"为关键字在pubmed网站进行搜索,检索文献超过3000篇。根据基因在所有个体基因组中的占比,泛基因组被分为核心基因(core genome)和非核心基因(variable genome),一般来说,核心基因组可能是执行关键功能的基因,非核心基因组则促进物种多样性(图1)。
图1 构建泛基因组示意图
01
结构变异(SV)研究是泛基因组的核心内容
构建物种泛基因组,不仅能够得到该物种较为完整的遗传信息,还可以通过测序个体间的基因组比对,获得每个个体或群体样本的基因组变异情况,包括SNP、InDel,以及大片段的SV、PAV等。此外,通过对核心/非核心基因的功能进行比较分析,还能对物种的表型产生机制进行深入探究。植物泛基因组通常集中于开展物种的功能基因定位、驯化、基因组演化、分子育种等研究。对于动物泛基因组,研究目标则通常是趋同进化研究以及探索驯化前后隐藏在不同品系/亚种/变种中的表型和基因型差异。
当前,动植物泛基因组的基础研究内容主要包括:核心和可变基因组的识别、结构变异研究、泛基因组构建、泛基因家族研究、基于SV的性状定位等。尤其是SVs的研究,对于了解物种中结构变异对性状的影响及其在材料育种中的应用至关重要。《Nature Genetics》近期发表的一项甘蓝泛基因组研究中,构建了高质量的甘蓝泛基因组,结合群体重测序(SV-GWAS)、转录组(eGWAS)及甲基化数据联合分析,揭示了SV是大量基因表达剂量改变的重要调节因子,同时获得了一批重要性状的关键基因,驱动着甘蓝形态类型多样化的快速驯化(图2,3;Li et al., 2024)。
图2 结构变异在基因组上的分布特征及其与相邻基因表达的关系
02
图泛基因组已成为基因组育种研究的新标准
目前,用于构建泛基因组的方法主要包括三种:迭代组装、从头组装和基于图的组装(图3)。前两种均为线性方式,而图形泛基因组则以节点和路径的形式存储和展示物种的变异信息,可以容纳更多的遗传多样性区域,方便研究人员进行更准确的变异信息挖掘。
图3 泛基因组构建策略
图形泛基因组的研究飞速发展,首个发表的植物图形泛基因组研究中,是使用大豆ZH13基因组作为线性基因组参考,通过比较四个野生大豆品种、10个当地大豆品种和15个栽培大豆品种的整个基因组,构建了一个基于图形的泛基因组(Liu et al.,2020)。近年来,棉花、番茄、狼尾草、黄瓜、黍稷、柑橘、绵羊、鸡等不同物种的图形泛基因组相继发表。同样地,上面提到的甘蓝泛基因组研究中,研究团队构建了包含所有变种类型的甘蓝图形泛基因组(图4)。未来,图泛基因组将可能成为基因组分析和作物基因组育种的标准。
图4 由27个甘蓝基因组构建的泛基因组
03
泛基因组研究拓展
早期的泛基因组通常会因为短读长等因素缺失单个基因组中的复杂结构变异。随着测序技术以及基因组组装方法的提升,泛基因组的研究尺度和研究方式也在不断拓展。
自2022年发表人类首个T2T基因组以来,人类泛基因组参考联盟(Human Pangenome Reference Consortium, HPRC)意在创建一个更为精准的完整人类参考基因组,该计划以图形泛基因组为基础,用端粒到端粒的基因组结果,建立高质量的人类参考泛基因组,首次为广大学者提出T2T泛基因组的新研究方向(图5;Wang et al., 2022)。
图5 HRPC研究计划
此外,人类泛基因组通过对所选样本基因组进行单倍型分型组装,构建了首个人类单倍型泛基因组,为人类基因组研究提供更为完整的参考,也更能代表人类遗传多样性(图6;Massarat A et al., 2023)。(详见:新里程碑——首个人类单倍型泛基因组发布,AG代理基因为全球学者提供最新基因组研究攻略,)
图6 人类泛基因组
(每个个体都产生了2套全基因组序列,47位人的单倍型基因组共94套基因组序列用于构建人类泛基因组)
综上,以超高质量的单倍型T2T基因组(单倍型端粒到端粒基因组)作为参考骨干,用于SVs的鉴定和泛基因组图谱的构建,这意味着后续的研究不需要频繁升级,确保了可供后续比较的统一坐标系统。
还有一点值得我们注意:首个人类泛基因组的发布,为泛基因组研究提供了更为广阔的思路,而泛基因组的概念也由最初组装某个物种不同品种的“种水平”泛基因组研究,逐渐拓展到“属水平”,即同属不同种的物种构建“super pan-genome 超级泛基因组”(图7;Khan AW, et al., 2019)。说明泛基因组研究正朝着”更多样、更包容“的方向发展,意在容纳某一类目标物种类群的所有遗传信息。
图7 超级泛基因组构建示意图
最后,为了帮助大家更直观地认识泛基因组的研究进展(统计至2023年),小编基于时间线整理了现有泛基因组研究成果的物种情况(图8)。
图8物种泛基因组构建进展
此外,我们也整理了一些已收录动植物泛基因组研究工作的期刊杂志(下表),供各位老师参考。
参考文献:
Li X, Wang Y, Cai C, Ji J, Han F, Zhang L, Chen S, Zhang L, Yang Y, Tang Q, Bucher J, Wang X, Yang L, Zhuang M, Zhang K, Lv H, Bonnema G, Zhang Y, Cheng F. Large-scale gene expression alterations introduced by structural variation drive morphotype diversification in Brassica oleracea. Nat Genet. 2024.
Liu Y, Du H, Li P, Shen Y, Peng H, Liu S, Zhou GA, Zhang H, Liu Z, Shi M, Huang X, Li Y, Zhang M, Wang Z, Zhu B, Han B, Liang C, Tian Z. Pan-Genome of Wild and Cultivated Soybeans. Cell. 2020.
Wang T, Antonacci-Fulton L, Howe K, Lawson HA, Lucas JK, Phillippy AM, Popejoy AB, Asri M, Carson C, Chaisson MJP, Chang X, Cook-Deegan R, Felsenfeld AL, Fulton RS, Garrison EP, Garrison NA, Graves-Lindsay TA, Ji H, Kenny EE, Koenig BA, Li D, Marschall T, McMichael JF, Novak AM, Purushotham D, Schneider VA, Schultz BI, Smith MW, Sofia HJ, Weissman T, Flicek P, Li H, Miga KH, Paten B, Jarvis ED, Hall IM, Eichler EE, Haussler D; Human Pangenome Reference Consortium. The Human Pangenome Project: a global resource to map genomic diversity. Nature. 2022.
Massarat A, Gymrek M, McStay B, Jónsson H. Human pangenome supports analysis of complex genomic regions. Nature. 2023.
Khan AW, Garg V, Roorkiwal M, Golicz AA, Edwards D, Varshney RK. Super-Pangenome by Integrating the Wild Side of a Species for Accelerated Crop Improvement. Trends Plant Sci. 2020.
AG代理基因紧跟基因组研究发展趋势,已率先完成T2T基因组、单倍型基因组以及泛基因组的分析研发工作,结合Nanopore及PacBio三代测序平台,已为全球学者提供数千个物种的基因组测序及分析服务。稳定等。
AG代理基因基因组研究咨询热线
1.咨询当地所在销售
2.拨打官方电话:027-62435310/15337161420
3.扫码添加下方二维码添加工作人员微信咨询