格物致知|青年大家系列第二讲 Q&A
关注AG代理基因公众号,后台对话框回复关键词:微生物,获取回放链接。
Q&A
讲师:余珂老师
单位:北京大学深圳研究生院
报告题目:BASALT高精度分箱技术的构建及应用技巧
1. 请问余老师,binning后得到的高质量MAG直接就是菌的完成图了?还是说基于高质量的MAG单独再做组装,更容易得到菌的完成图?
答:不一定可以得到菌的完成图,难度很大,加大数据量会有帮助;基于高质量的MAG单独再做组装,对得到的基因组质量有帮助。
2. 老师三代组装hifiasm-meta和metaflye对比怎样呢?
答:目前很感兴趣,目前还没测试。
3. 请问余老师,为获取高覆盖度,不同处理的样本是单样本测序最后混合测序数据,还是把样本混合在一起进行测序呢?
答:建议不同处理的样本是单样本测序最后混合测序数据,可以拿到不同的覆盖深度信息。
4. 组装方式中,单基因组组装再合在一起binning (vamb)和混合数据直接组装进行binning 结果相差大吗?
答:vamb单基因组组装会比混合更好,Vamb没有考虑去冗余环节。
5. 多样品需要的内存大吗?
答:分箱需要的内存相对还好,主要是组装需要的内存大,尤其是二代数据。
6. 老师,得到的MAGs样品定量的话,目前有什么比较好的方法吗?
答:丰度的计算可以基于mapping计算标准化的丰度,但很多序列无法mapping到基因组上,且通常占比50-70%,大量数据无法被利用导致结果中丰度的真实性。可在导论丰度的同时说明整体数据的比对率;可尝试加入内标的研发;可参考张彤老师在water reaserch中发表的对宏基因组定量的文章。
7. 老师,使用BASALT这个软件,可以组装出高质量bin的低丰度物种,丰度最低的大概是多少呢。目前的实测样本除了盐湖,还有做其他环境样本的分析吗?
答:基于大数据量测序结果分析,丰度最低可是万分之六,真正决定因素是覆盖深度,低于7X的基因组很难被组装出来。