摘要:代谢组学是研究生物体受外部刺激后所产生的所有代谢物变化的科学,能够全面揭示生物体受到扰动后机体代谢网络的变化。现有的代谢组学方法在数据库数据方面,数据来源众多,数据质量参差不齐,鉴定结果准确度和数据处理速度上受各实验室仪器状态和数据采集方法影响很大,通量有进一步提升的空间。本实验采用高分辨质谱对600余种内源性代谢物标准品逐一进行色谱和质谱数据采集,手动确认和标注信息后,录入数据库并导入Compound discover等数据处理软件进行快速、高通量的代谢组学数据处理。化合物鉴定标准方面,在进行质量偏差和二级质谱 (MS2) 碎片信息匹配的基础上,加入色谱保留时间作为高维度确证指标,降低了化合物鉴定的假阳性率。该数据库的建立和应用提高了代谢组学方法化合物鉴定的准确度,缩短了数据分析流程,可用于药物靶点发现、药理病理研究、疾病诊断等。
关键词: 高分辨质谱, 数据库, 代谢组学, 高通量
材料与试剂
仪器设备
实验步骤
图6. Compound discover 3.2软件工作流程图7. "Search mzVault"模块参数设置
结果与分析
本实验共选择5种数据库进行代谢组学数据分析,考察数据库通量及搜索准确度,结果如表5所示。从鉴定数量结果来看,mzcloud数据库因质谱信息条目多,鉴定到的化合物数量最多,但经过手动指认和标注后,部分结果因采集仪器不同、没有保留时间比对等原因被认定为假阳性结果或重复结果。而采用自建数据库则很大程度上的降低了假阳性率,并且手动标注后的化合物鉴定结果数也与mzcloud等数据库保持相同水平。
表5. 五种内源性代谢物质谱数据库细胞内容物代谢组学鉴定结果对比
自建数据库的高通量优势如图8所示,比较采用compound discover加载不同数据库处理代谢组学数据的时长,自建数据库在化合物搜库鉴定总时长上具有更显著的优势,相比高通量的mzcloud的离线或在线工作流程,分析时间缩短了50%以上。结合QE Plus质谱实现正负离子信息同时采集和扫描,同一个样品仅需一次进样,LCMS分析总时间27 min,即可对代谢组学样品进行快速数据采集及数据处理,缩短的现有方法所需时间,进一步突显了高通量质谱数控采集及分析的特点。
致谢
感谢清华大学药学院尹航老师的讨论、建议和大力支持。感谢"清华大学实验室管理处双一流实验室建设专项"对本实验提供的支持。
参考文献
If you have any questions/comments about this protocol, you are highly recommended to post here. We will invite the authors of this protocol as well as some of its users to address your questions/comments. To make it easier for them to help you, you are encouraged to post your data including images for the troubleshooting.
如果说这个比率指的是ratio的话,一般不会采用空白样品作为比较中的分母,而是设置为blank,其他各组样品才会设置为分子分母进行比较。具体步骤可参见CD软件的教程。https://www.thermofisher.cn/cn/zh/home/products-and-services/promotions/industrial/compound-discoverer.html