近日,计算机科学技术学院生物信息研究组研发了一种通过整合扩增率、多层分类注释、序列类型和长度来评估扩增子性能的综合方法Qscore。该成果于4月28日在线发表于生物信息学高水平期刊Microbiology Spectrum (SCI IF=9.043)。该研究论文由青岛大学和寿光市中医院共同完成,计算机科学技术学院为第一单位,硕士研究生张文科同学为第一作者,苏晓泉教授为通讯作者。该研究获得了国家重点研发计划、国家自然科学基金、泰山学者计划、中国科学院青岛生物能源与过程研究所和山东省教育厅的支持。
目前已经有大量基于16S扩增子基因测序的微生物群落相关研究发现16S核糖体RNA基因是鉴定复杂群落中微生物的一个快速有效的标记。然而16S rRNA基因的分辨率一直被认为只能分辨到属水平,这还没有在全面微生物的研究上得到证实。另一方面,由于微生物根据其栖息地分布不同,如何根据引物长度、扩增长度、引物覆盖度的考量选择不同的扩增区域成为当前微生物组扩增子研究的一个重要课题。
针对以上问题,首先,我们精心整理策划了一个具有最新序列和完全注释的分类法的扩增子参考数据库RefSeq,为海量样本的分析与挖掘提供了有利的前提条件。为了充分探索并发挥16S rRNA基因在微生物图谱分析中的能力和潜力,我们提出了Qscore。我们通过对多个参考数据库中微生物“全球视野”进行的计算机评估总结了16S短读的最佳测序策略(图1)。另一方面,我们还根据微生物组搜索引擎中的微生物组大数据样本通过计算Qscore为16种典型生态栖息地提供了的推荐扩增配置。详细的数据模拟进一步证明,使用Qscore建议的配置产生的16S扩增子在微生物组分析中表现出高精度,在CAMI度量下接近鸟枪法宏基因组数据。因此,通过重新考虑基于16S的微生物组分析的精度,我们的工作不仅实现了已经产生的大量序列的高质量可重用性,而且对进一步指导微生物组研究具有重要意义。目前,我们还在https://qscore.single-cell.cn开发了用户分析特定生境或预期微生物结构的推荐扩增策略的在线服务。
图1. 不同测序策略的扩增子的总体性能
(A)引物组的扩增效率;(B)映射到参考数据库匹配率;(C)不同扩增配置的灵敏度(D)多级别的平均分类学注释精度;(E)不同扩增配置的Qscore
论文信息:
1. Wenke Zhang , Xiaoquan Fan , Haobo Shi , Jian Li , Mingqian Zhang , Jin Zhao , Xiaoquan Su *, Comprehensive Assessment of 16S rRNA Gene Amplicon Sequencing for Microbiome Profiling across Multiple Habitats. Microbiology Spectrum, 2023, DOI: https://doi.org/10.1128/spectrum.00563-23