摘要:来自不同环境的微生物组样本的数量正在迅速增长,随之而来的问题也不断涌现,例如如何快速的找到具有某种群落结构和功能的数据集,以及通过对比发现新的微生物组与现有样本之间的关联等。Microbiome Search Engine 2 (以下简称MSE 2) 是第二代的微生物组搜索引擎,为解决以上类型的问题提供良好的解决方案。MSE 2可以根据某个微生物组整体的物种结构或功能特征,在全球已有的微生物组数据集中搜索与其高度匹配的样本。MSE 2由以下三部分组成:(i) 不断更新的微生物组数据库。该数据库目前包含来自于819项研究的266,000多个宏基因组和16S rRNA扩增子样本,每一个样本的测序数据和元数据 (metadata) 都进行了统一化处理;(ii) 增强的搜索引擎。实时级快速搜索,能够在0.5秒内,从整个数据库中搜索到与给定的微生物组在整体物种或功能组成上最相似的样本;(iii) 基于Web的图形界面。用户可通过http://mse.ac.cn免费访问MSE 2。该网站提供了简单易用的图形界面,方便用户快速上手样本搜索、数据浏览等操作,同时也为自定义的搜索提供了教程。
关键词: 扩增子, 宏基因组, 微生物组, 在线服务, 搜索引擎
材料与试剂
本研究不涉及传统试剂耗材。
仪器设备
连接互联网的个人电脑。
软件
MSE 2 (Jing et al., 2021) 为web端软件,采用浏览器访问使用。建议使用Firefox、Chrome或Microsoft Edge浏览器。微生物组测序序列数据的预处理,根据测序序列类型和搜索模式,处理软件详见表1。
实验步骤
搜索输入格式:
推荐的序列处理软件:
Parallel-Meta 3 (Jing et al., 2017)详见实验步骤1.1
Parallel-Meta 3 (Jing et al., 2017)详见实验步骤1.2
MetaPhlAn 2 (Tin et al., 2015)详见实验步骤1.3
HUMAnN 2 (Franzosa et al., 2018)详见实验步骤1.4
结果与分析
以OTU搜索为例,将预处理中得到的classificatioin.txt文件 (格式见表2) 作为输入。范例该文件可以从实验步骤2.5a中下载。得到输出结果如图2所示:图2. MSE 2的"Search by OTU"搜索结果 A. 搜索匹配结果列表;B. 搜索样本与匹配结果结构对比图;C. 搜索样本来源环境预测结果
失败经验
常见问题:No-Hit。 问题原因:输入数据格式错误,或者最低相似度阈值太高。 解决方法: a. 根据待搜索样本类型和搜索类型,按照表1检查预处理方法和输入格式。 b. 根据实验步骤中2.4b,降低"最低相似度"。
致谢
感谢中国科学院青岛生物能源与过程研究所乔英合工程师对服务器的管理和硬件维护。该工作得到了国家自然科学基金31771463、32070086的资助。
参考文献
If you have any questions/comments about this protocol, you are highly recommended to post here. We will invite the authors of this protocol as well as some of its users to address your questions/comments. To make it easier for them to help you, you are encouraged to post your data including images for the troubleshooting.