“格物致知”论坛第三期Q&A
关注AG代理基因微信公众号,在对话框回复关键词:格物致知,获取回放链接。
Q&A
王则夫老师
报告主题:“杂交物种形成”与“生殖隔离平行演化”的分子遗传机制
Q:固定的非同义突变是什么意思?
A:是在全基因组水平的判断,比如说A物种和B物种中,在其中一个物种中,突变都是A,在另一个物种中都是T,在种内一致,种间有差异,即是固定下来的非同义突变。在实际判断过程中,没有严格要求所有的位点都完全一致,而是基于FST进行判断,这也是一般固定位点的判断标准,当群体之间FST≥0.95,则认为是固定位点,当固定位点恰好也是非同义突变时,则称为固定的非同义突变,它可能会引起一些编码区氨基酸的改变。
Q:测序的时候,怎么判断是单拷贝直系同源基因?
A:在拿到不同物种的基因组后,用软件鉴定单拷贝直系同源基因,目前用于鉴定单拷贝直系同源基因的软件较多,例如OrthoMCL、Orthofinder等。
Q:测序的时候怎么判断是一个杂交位点,判断是一个杂交位点的标准是什么?
A:如果某个位点在亲本种中固定了,即亲本1中是A,亲本2中是T,而在杂交种中有些个体是A,而有些个体是T,则认为这是杂交的痕迹。
Q:老师讲的基于频谱分析,频谱分析是什么意思?
A:频谱分析是基于SNP的数据,基于不同的SNP的频率产生的中间文件,可以进行后续的一些模拟分析。
Q:基于叶绿体和和基因组SNP分析,SNP是怎么判断是一个SNP的,是以什么基因组为参考标准和判断标准的?
A:建议查看虎榛子文章中的方法及附件部分,文章中有非常详细的鉴定、过滤的步骤。虎榛子文章中,参考基因组是分布于北方地区的虎榛子,因为它的基因组contig N50最长。其实,对于此分析来说,用不同的参考基因组之间的影响不大,尽量选择质量较好的基因组,前提是不同的亲本种之间的分化相对不大。如果研究的谱系之间分化之间非常久远,如10+MYA,那么选择不同的参考基因组call SNP的过程会有一些偏差性的影响,要在具体的分析过程中测试才能知道。在本研究中实际上基于不同的参考基因组(虎榛子、滇虎榛子等)进行call SNP的过程,发现差别不大。
文章链接:
//pubmed.ncbi.nlm.nih.gov/33220509/
参考文献:
Wang Z, et al. Hybrid speciation via inheritance of alternate alleles of parental isolating genes. Mol Plant. 2021.
Q:什么是正选择基因?
A:正选择基因是通过一系列的鉴定方法,认为这些基因在群体进化的过程中受到强烈的选择作用,它的突变可能会更多,也可能是在保守区域有一些明显突变。
Q:什么是平行的遗传演化?
A:平行演化(Parallel Evolution)指不同生物在适应相似生境的过程中,多次独立产生相似性状的演化现象。比如在宏观水平上,有时说平行演化,有时说趋同演化,在有些研究中没有明确区分到底是平行还是趋同。比较著名的案例有:不同的鲸鱼、海豚、蝙蝠等进化过程中回声定位系统类似,但是它们的亲缘关系较远,这就是典型的平行/趋同演化的现象。包括类似乌龟、鸭子等不同类群的水生生物的脚趾之间的蹼,这种蹼帮助它们更好的划水,以上都是表型水平的平行/趋同演化现象,虎榛子文章还是更关注于分子水平的平行演化。
Q:王老师好,我想请问一下,虎榛子与滇虎榛子在分布上并没有重叠的区域,两个物种在花期上存在差异,那是怎样形成杂交种的呢?
A:我们所说的它们之间的分布模式是现代的分布模式,我们认为在几个百万年之前可能在青藏高原、云南、四川等地有一定程度的分布区域的重叠,并且检测到的具有明显杂交痕迹的居群也都分布在居中虎榛子分布区域的最南端,最靠近现代的虎榛子的分布区域。两个物种在花期上存在差异,但有花期重叠的过程,我们说生殖隔离强烈但是不完全的,这两个物种还是有一定程度的花期隔离,两个物种的分布点非常近,花期实际上与虎榛子、滇虎榛子之间的花期模式非常像,在分布点也发现非常少的极个别的自然状态下的杂交后代。所以说,在历史分化的过程中可能存在同位分布的现象,由于花期的重叠,导致杂交物种形成的事件。
Q:老师您好 基因组测序 质量评估主要是看哪些指标呢?谢谢您!
A:主要关注组装出的基因组大小/基因组预估大小(可通过软件或流式细胞仪测定)的比例、Contig N50、BUSCO、Hi-C挂载率等指标。具体可参考一些以数据报道为主的期刊或文章内的信息。
Q:还有一个问题,怎样确定基因在不同的物种中发生了功能分化呢?谢谢王老师。
A:本研究主要是基于两方面决定,一方面是在基因组水平上确认基因是否发生分化,重点关注非同义突变位点,这些位点的分化往往会导致基因功能分化,但这并不能百分之百的说明发生分化,所以另一方面,对不同基因进行了分子生化验证,包括在虎榛子研究中,还对这些基因进行转拟南芥的功能验证,通过实验验证手段,证明功能确实发生分化。
Q:请问是不是必须有两种类型正选择基因:一种外在的跟环境相关的,一种内在的与生殖器官性状相关的?
A:不是的。在我们提出的杂交物种形成的分子遗传模型中,杂交群体必须从每个亲本种继承至少一个与生殖隔离性状相关的基因(即至少需要交替继承共两个基因),才可以使来自不同亲本的不同生殖隔离性状在杂交群体中重新组合,促使其快速形成新的杂交物种。这两个分别来自不同亲本物种的与生殖隔离相关基因,可以与两种不同类型的生殖隔离性状相关(不一定必须与环境或生殖器官性状相关),也可以共同控制同一类型的生殖隔离性状。
我们可以做这样的假设:如果亲本物种P1具有早花的特征,亲本物种P2具有晚花的特征;基因G与基因K可以共同控制植物的花期,并且它们在P1与P2间的分化均可能影响两个亲本物种的花期;杂交物种H分别继承了来自P1的G基因的allele和来自P2的K基因的allele;那么,在杂交物种H中则有可能会产生一种“中间态”的性状,其花期可能晚于P1但早于P2,这样也可以使杂交物种H与两个亲本物种均产生生殖隔离。(以上仅为一种假设,不意味着物种间一定遵循这样的情况)。
更多讨论可参见发表在Molecular Plant的文章,及其附件部分关于达尔文雀杂交物种形成历史的探讨。
参考文献:
Wang et al. (2021). Hybrid speciation via inheritance of alternate alleles of parental isolating genes. Molecular Plant. 14: 208-222.
DOI: 10.1016/j.molp.2020.11.008.
Q:王老师,请问一下虎榛子三个基因组在做群体分析的时候,选择哪个做参考呢?
A:选择分布在北方地区的虎榛子,实际上选择滇虎榛子或者居中虎榛子都是可以的,因为考虑到‘杂交物种起源研究做的较少,为了方便审稿人及读者的理解,还是倾向于优先选择两个亲本种之间的某一个物种做参考。如果分化时间相对较远,建议用不同的基因组做参考,比较SNP差异是否较大,如果差异很大,选择其他方法,如:利用基因组数据进行比对,找保守区域生成SNP的方法。
Q:是否一个属内不同种都能参考您的研究思路来做?属内种很多?如何选择研究物种?
A:无论是杂交物种形成还是生殖隔离平行演化,首先都要基于物种本身的分类学、生态学、遗传学等特征,来确定研究材料与研究目的。尽量根据已有的数据(如形态学特征、系统发育关系、以往发表的相应研究等),来判断所关注的物种间是否可能存在杂交物种形成或生殖隔离的平行演化等现象。如须进行组学研究,所选物种的基因组不宜过于复杂(如基因组大小过大、倍性过高、杂合度过高等)。
Q:王老师,在你这里获得一些启发,请问近源属的物种是否都有可能有杂交的关系呢?
A:杂交物种广泛分布于不同的动植物类群中,如鸟类、蝴蝶、哺乳动物、木本及草本植物等。杂交物种形成事件发生在同一属内相对近缘的物种之间的可能性更大,也可能发生于不同的近缘属间。具体可参见我们近期的一项研究:
参考文献:
Wang et al. (2022). Genomic evidence for homoploid hybrid speciation between ancestors of two different genera. Nature Communications. 13: 1987. DOI: 10.1038/s41467-022-29643-4
Q:杂交提高适应性可以按这个模式来做吗?
A:本研究主要是杂交物种形成的案例,针对杂交提高适应性而言,类似的实验手段,如果老师感兴趣可以尝试,不一定会有很好的效果。
Q:HHS模型适不适用于合子后生殖隔离?
A:我们提出的HHS模型对生殖隔离的具体种类没有限制,适用对象包括合子后生殖隔离。
Q:老师,请问同一区域形成两个物种的最有可能的机制是什么呢?这种适合叫做趋异进化吗?
A:实际上物种形成的模式有很多,该问题提到的是同域物种形成,这背后的机制情况较多,要具体问题具体分析,很难提出最有可能的机制是什么。在广义上说,可能是趋异进化。
Q:土壤中是否其他元素影响了虎榛子的生殖隔离
A:生殖隔离的种类繁多,我们没有办法全面的检测每一种生殖隔离。不同虎榛子属物种间是有可能存在我们未知的、与土壤中的其他元素相关的生殖隔离性状的。
Q:是否可以确定滇虎榛子是杂交母本,虎榛子是杂交父本?
A:是的。基于叶绿体基因组SNP构建的系统发育树,居中虎榛子与绝大部分滇虎榛子聚为一簇,可以推断滇虎榛子在其杂交物种形成事件中扮演母本的角色,而虎榛子则为父本。
Q:您研究中的杂交物种基因组中继承于小居群亲本的基因区间具有更高的重组率,请问其可能是的产生机制是怎样的?
A:具体机制我们没有进行后续研究。
Q:您认为同倍体杂交物种形成的已报道的案例较少,但基于您HHS模型中的结论,您认为HHS在自然接种发生的规模如何?什么因素阻碍了我们对HHS真实规模的认识?
A:自然界中HHS现象是非常普遍的,只是做类似研究较少。主要是因为技术上的限制,杂交物种形成分为两种,一种是杂交多倍化,另一种是同倍体杂交物种形成。对于杂交多倍化而言,在组学手段上相对较好确定,但是在前些年做多倍体测序成本较高、较困难,所以很少有组学数据对杂交多倍化进行研究,近几年研究的会多一些。针对同倍体杂交物种形成,由于技术限制,大家对于它发现的较少,即使怀疑某物种可能是同倍体杂交物种形成的,由于技术限制,很难用组学手段去证实。在此文章发表后,也有很多学者与我们进行交流和合作,包括动物、植物中,都是有大量HHS现象存在的,近期也会有相关研究的文章发表。
Q:老师,外类群是怎么选取的,有什么标准吗
A:外类群尽量选择与研究物种亲缘关系较近,并且之间没有基因流的物种作为外类群。
岳晶晶老师
报告主题:番木瓜基因组揭示基因枪介导的转基因过程及番木瓜的驯化历史
Q:番木瓜外源基因插入影响的内源基因,是否影响内源基因的表达,是否产生表型变化。
A:我们发现外源基因插入主要还是导致一些叶绿体编码基因的表达发生变化。但是由于插入片段很多是重复的叶绿体序列,导致有很多叶绿体编码基因都是多拷贝的,所以最终并没有引起表型变化。SunUp 和Sunset 植株在生长发育过程中的表型没有明显差别,抗病表型差异显著。
Q:老师您好,我想请问一下,目前只有基因组和转录组数据,未进行重测序,对于性别决定基因的发现有什么意见吗?
A:只有基因组和转录组数据,在鉴定性别决定基因相对较难,基于转录组数据主要针对一些性别特异的,如雌性群株对不同发育阶段花的采集,进行差异分析,可能会分析到一些特异表达的候选基因,同时结合基因组中性别决定区域的定位,筛选出一些候选基因,通过已有的发表的文章,查看哪些基因可能与性别决定功能接近,最终会筛选到更小范围的候选基因,一般进行转基因、敲除、EMS诱变等进行验证,进一步缩小范围。只用基因组和转录组数据,在鉴定性别决定基因较为困难,还需要结合其他的一些证据。性别决定相对复杂,一般不是单一基因控制,需要更多的数据来支持分析。
Q:基因枪插入经常产生多拷贝插入的原因是什么。是否基因枪拷贝数多,农杆菌转化拷贝数少。
A:根据文献报道基因枪和农杆菌插入都有多拷贝插入现象,至于哪一种多拷贝的更多可能需要更多的文献支持得出结论。基因枪插入引起多拷贝插入的确切原因还不清楚,我的理解是基因枪轰击后DNA片段在外力作用下穿透细胞壁进入细胞核整合的这个过程更随机一些,所以多个片段同时整合的几率更高。
Q:请问是在确定1.6mb片段的突变时,除了检查border positions,如何排除叶绿体和线粒体的reads对染色体基因组的干扰?在突变位点上sequencing depth上是否有异常?
A:在本研究组装时对sequencing depth进行检测,发现测序深度较高,无法排除线粒体、叶绿体的干扰,通过PacBio、Nanopore测序,将整个片段完整组装,组装完成后与已有的线粒体、叶绿体进行比对,发现有一些特异的区域,在整合到基因组中后有随机分布的情况,通过ONT ultra-long reads及扩增等分析,最终证明组装的准确度。实际上,在组装时无法排除叶绿体、线粒体reads对染色体基因组的干扰。在本研究中,取样时做了特殊处理,将测序叶片在黑暗情况下进行处理,对白化叶片进行测序,尽量降低叶绿体对核基因组组装的干扰。
Q:请问如确定染色体的组装是无gap的呢?
A:本研究的染色体组装还未达到无gap的水平,如果组装完一条染色体由一条contig组装,则组装达到无gap,T2T水平。本研究的性染色体组装是将此前存在的两个大的gap进行填充,其中还有一些小的gap,后期做了进一步的工作,已经得到了T2T水平的染色体及完整的HSY区域。
Q:请问有没有检测过,这个转基因番木瓜品系种植这么多年后,转基因位点结构发生变化没有?
A:Sunset转基因后到现在已经接近30年了,确实无法追踪这30多年产生了哪些结构变异,但在对整个基因组进行结构变异和基因功能分析时发现,一些变异两侧存在重复序列富集,说明这些结构变异很可能是由转座子引起的。
Q:是不是590kb的缺失都转移到1.6Mb的插入里面了?
A:是的,该研究对590kb的缺失片段进行精细比对,发现这590kb缺失插入到1.6Mb的区域中,但是它不是完整的插入,而是这590kb的区域以散落片段的形式随机插入到1.6Mb的区域中,推测这可能是基因枪轰击造成的效应。
Q:基因枪轰击进入细胞核后首先作用的位置是sunset中590kb的缺失的地方吗?
A:我们推测是这样。但是因为所有结果都是基于Sunup/Sunset的基因组组装分析得到的,目前的结果是Sunset中的22Mb区域有这590kb富集叶绿体的区域。在20Mb区域未发现有富集,在37-39Mb有富集,通过共线性分析发现也有较好的共线性,推测基因枪轰击进入细胞核后,整合位置可能是先轰击插入片段,最终的整合位置以组装得到的结果为主。
Q:老师好,什么是共线性分析?怎么判断结构变异是由于转座子引起的?
A:1、共线性分析是为了判断组装的两个基因组是否有很好的一致性,使用MCScan基于CDS序列进行共线性分析。2、首先通过结构变异软件鉴定到SV,随后对全基因组进行转座子分析,查看全基因组转座子的分布,然后进行筛选,这些结构变异两侧或跨过结构变异是否有转座子的存在,如果有,则判断是由转座子引起的,同时也会判断结构变异两侧基因的表达水平,来判断是否是由结构变异引起的表达水平改变。
Q:请问,为什么基因枪轰击后,片段就落在了1.6MB的位置上?原因是什么?
A:在1998年时在研究燕麦基因枪介导的转基因事件时,结合southern杂交手段,发现转基因插入整合位点,1个转基因插入事件并不是1个整合位点,而是多个整合位点,多个整合位点成簇分布。而在本研究中发现,这三个转基因插入片段位于同一个大的插入片段中,可能是由于转基因插入过程中造成原有的基因组上叶绿体富集区域,以及叶绿体基因组上片段的多聚化和重排,最终构成了1.6Mb的大片段插入。我们认为这个机制可能是外源基因进入细胞后,细胞应对外界损伤的响应,同时也可能是外源基因进入细胞后能更好表达的机制。因为叶绿体富集的区域可以类似作为一个缓冲区域,既可以保证外源基因表达,同时又不至于影响现有基因组中基因表达。
Q:基因枪轰击之前核基因组中也就已经包含有叶绿体序列的?如何进入的?
A:叶绿体序列整合到核基因组中是在物种进化过程中发生的一种自然现象,当植物受到外界刺激(转基因过程)、损伤、环境变化等都会引起叶绿体基因组序列向核基因组整合,这是植物应对环境变化的一种自我调节的能力。如何进入的目前有研究报道说可能是一些信号介导叶绿体序列向核基因组转移,但是目前研究的还不是很清楚。
Q:番木瓜野地栽培,现在北引到哪了?
A:目前野生种主要还是分布在墨西哥南部和中美洲,美国夏威夷有个番木瓜种质资源中心有保存番木瓜各种野生种质资源。