近日,计算机科学技术学院生物信息研究组研发了全新的扩增子物种注释软件PM-profiler。该成果于近日在线发表于生物信息学高水平期刊Microbiology Spectrum。该研究论文由青岛大学独立完成,计算机科学技术学院为第一单位,硕士研究生史浩博为第一作者,苏晓泉教授为通讯作者。该研究获得了国家重点研发计划、国家自然科学基金、泰山学者计划和山东省教育厅的支持。
扩增子测序作为微生物群落分析的重要方法,尽管广泛应用,但其分辨率和准确性一直备受关注。随着参考数据库和注释的改进,基于16S rRNA的分析迎来了新的发展机遇。然而,现有的方法在处理日渐增长的大规模微生物群落时仍存在许多不足,如速度慢、分辨率不高等问题。
图1 PM-profiler的总体架构
(a) 预先分配的k-mer哈希表构造;(b) 快速的短reads搜索;(c) 双模层次分类注释策略
为解决这些问题,生物信息研究组推出了一款新工具——PM-profiler,用于扩增子短读序列的分析。PM-profiler采用C++实现,通过预分配哈希构建参考库、混合和动态短读序列匹配、大数据驱动的双模式层次分类注释策略以及全流程并行计算,使得PM-profiler在处理大规模微生物群落时,能够提供物种级别的分辨率和超快的速度。此外,针对全球微生物组物种分布不均的现象,PM-profiler根据来自MSE(Microbiome Search Engine)的数十万个微生物群落,制定了不同取样环境的最佳注释策略。结合Parallel-Meta Suite(PMS; iMeta 2022)既有的工作流程和最新的参考数据库,PM-profiler为高精度的微生物群落调查提供了快速可靠的解决方案。这一工具的推出,有望显著提升微生物群落分析的效率和精度,推动相关研究的进一步发展。
论文信息:
1. Haobo Shi, Guosen Hou, Sikai Jiang, Xiaoquan Su *. PM-profiler: a high-resolution and fast tool for taxonomy annotation of amplicon-based microbiome. Microbiology Spectrum, 2024, DOI: https://doi.org/10.1128/spectrum.00695-24