[attach]18[/attach]软件下载链接:通过网盘分享的文件:MSConvertGUI 格式转换.msi 链接:https://pan.baidu.com/s/1NN1MZj3QQJQ3sNA2uuLPYw?pwd=msfj 提取码: msfj
MSConvertGUI 是 ProteoWizard 工具集中用于质谱原始数据格式转换的图形化工具,支持 Thermo .raw、AB Sciex .wiff、Agilent .d、Bruker .d 等多种仪器格式,可转换为 mzML、mzXML 等通用开放格式,是代谢组学、蛋白质组学研究的必备工具。
一、软件安装与环境准备
1. 下载与安装
- 访问 下载对应系统的安装包(Windows 64 位版本)。
- 安装时建议勾选 MSConvertGUI 及相关依赖组件,部分仪器格式(如 Thermo .raw)需额外安装对应仪器驱动才能正常读取。
- 安装完成后,启动 MSConvertGUI (64-bit),即可看到主界面。
2. 数据文件准备
- 确保质谱原始文件完整未损坏,路径中不要包含中文、空格或特殊字符,避免读取失败。
- 支持批量转换,可一次添加多个文件到转换列表。
二、核心界面功能介绍
主界面分为 5 个核心区域:
- 文件添加区:加载待转换的质谱原始文件。
- 输出目录区:设置转换后文件的保存路径。
- 参数选项区(Options):配置输出格式、编码精度、压缩方式等。
- 数据过滤区(Filters):对质谱数据进行子集筛选(可选)。
- 预设与启动区:保存参数预设、查看命令行、启动转换。
三、详细操作步骤
步骤 1:添加待转换文件
- 顶部选择 List of Files(默认选项,直接添加文件列表)。
- 若需从文本文件读取文件名列表,可切换为 File of file names,然后通过 Browse 加载 .txt 格式的文件列表。
- 点击 Browse 按钮,在文件浏览器中选择一个或多个质谱原始文件(如 .raw、.wiff)。
- 点击 Add 将选中文件加入中间的文件列表框。
- 若需移除文件,选中列表中的文件后点击 Remove。
- 也可直接拖拽文件到列表框中快速添加。
- (可选)点击 Browse network resource... 可从网络共享路径加载文件。
步骤 2:设置输出目录
- 在 Output Directory 区域点击 Browse。
- 选择转换后文件的保存文件夹,建议与原始文件路径分开,避免覆盖。
- 确认路径显示在输入框中(如 F:\博士课题研究\基于核心状态参数的玉米)。
步骤 3:配置输出参数(Options 区域)
这是转换的核心配置,直接影响输出文件的质量与兼容性。
3.1 选择输出格式
- 在 Output format 下拉菜单中选择目标格式:
- mzML:✅ 推荐,现代开放标准,支持丰富元数据与压缩,兼容性最好。
- mzXML:兼容旧版分析软件(如 TPP)。
- mzData:较少使用,逐步被 mzML 替代。
- Extension:一般留空,软件会自动根据格式添加后缀(如 .mzML)。
3.2 编码与压缩设置
- Binary encoding precision:
- 64-bit:精度更高,文件稍大,适合需要高精度定量的研究(推荐)。
- 32-bit:精度稍低,文件更小,适合快速定性分析。
- Write index:✅ 勾选,生成文件索引,后续软件读取文件时速度更快。
- Use zlib compression:✅ 勾选,启用 zlib 压缩,可显著减小文件体积(约 50%~70%),不影响数据完整性。
- TPP compatibility:✅ 勾选,确保输出文件兼容 Trans-Proteomic Pipeline(TPP)等经典组学软件。
- Package in gzip:可选,勾选后将输出文件打包为 .gz 格式,进一步压缩,但部分软件需解压后才能读取。
- 其他压缩选项(Use numpress...):针对特定场景的高级压缩,一般无需勾选,避免兼容性问题。
[td]过滤维度 | 默认值 | 含义 | 何时需要修改 | | MS levels | 空(全部级别) | 保留所有 MS1、MS2、MSn 谱图 | 只需要 MS2 做鉴定,或只需要 MS1 做定量时 | | Scan number | 空(全部扫描) | 保留文件中所有扫描号 | 调试时只看某一段扫描,或剔除首尾无效数据 | | Scan time (seconds) | 空(全部保留时间) | 保留整个色谱时间范围 | 只分析某一时间段的峰(如目标物出峰在 10–20 min),或剔除死时间 / 尾端噪声 | | Scan polarity | Any | 同时保留正、负离子模式 | 单极性实验(只做正离子或只做负离子),可减少文件体积 | | Charge states | 空(全部电荷态) | 保留所有电荷态的母离子 | 只分析 +2、+3 电荷态的肽段,或过滤低电荷干扰 | | Collision energy | 空(全部能量) | 保留所有碰撞能量的碎裂谱 | 只分析特定能量下的碎裂结果(如 HCD 30 eV) | | Activation type | Any | 保留所有活化方式 | 只分析 CID 或 HCD 等特定活化方式的谱图 |
3.3 特殊数据处理(可选)
- Combine ion mobility scans:仅适用于离子迁移质谱(IM-MS)数据,合并迁移谱扫描。
- SIM as spectra / SRM as spectra:将 SIM/SRM 模式数据当作普通谱图处理,适合靶向代谢组学。
步骤 4:数据过滤(Filters 区域,可选)
若无需转换全部数据,可通过 Filters 筛选子集,减少文件大小:
- 顶部 Subset 下拉框选择过滤类型(如 MSn、Precursor 等)。
- 按需求填写过滤参数:
- MS levels:指定质谱级别(如 1-2 表示只保留 MS1 和 MS2)。
- Scan number:指定扫描号范围(如 100-500)。
- Scan time (seconds):指定保留时间范围(如 60-300,对应 1~5 分钟)。
- Scan polarity:选择正离子(Positive)、负离子(Negative)或任意(Any)。
- Charge states:指定电荷态范围(如 2-3)。
- Collision energy:指定碰撞能量范围。
- Activation type:选择活化方式(CID、HCD、ETD 等)。
- Analyzer type:选择质量分析器类型(Orbitrap、TOF 等)。
- 点击 Add 将过滤规则加入下方列表,可叠加多个规则。
- 若需删除规则,选中后点击 Remove。
⚠️ 注意:过滤会永久删除不符合条件的数据,操作前请确认需求。
步骤 5:保存预设与查看命令行(进阶)
- Presets:
- 选择 Generic Defaults 为通用默认配置。
- 调整好参数后,点击 Save Preset 可保存为自定义预设(如 Metabolomics_mzML),下次直接加载。
- Show Command Line:
- 点击后弹出当前配置对应的命令行代码,可复制用于批量脚本转换(适合大量文件自动化处理)。
步骤 6:启动转换
- 在 Files to convert in parallel 中设置并行转换数(根据 CPU 核心数调整,默认 1,建议不超过 CPU 核心数的 80%)。
- 确认所有参数无误后,点击右下角 Start 按钮开始转换。
- 等待进度完成,输出目录中将生成对应格式的文件(如 xxx.mzML 或 xxx.mzML.gz)。
四、常见问题与解决方案
| 问题现象 | 可能原因 | 解决方法 | 无法加载原始文件 | 未安装对应仪器驱动 / 文件路径含中文 | 安装 Thermo/AB Sciex 等仪器驱动;修改文件路径为纯英文 | 转换速度极慢 | 并行数过高 / 压缩选项过多 | 降低并行数;取消不必要的压缩选项(如 numpress) | 输出文件无法被下游软件读取 | 格式兼容性问题 / 压缩选项冲突 | 选择 mzML 格式;勾选 TPP compatibility;取消 gzip 打包 | 转换后数据丢失 | 过滤规则设置错误 | 检查 Filters 列表,移除不必要的过滤规则 |
五、推荐配置模板
通用代谢组学 / 蛋白质组学配置
- Output format:mzML
- Binary encoding precision:64-bit
- Write index:✅
- Use zlib compression:✅
- TPP compatibility:✅
- 其他压缩选项:❌
- Filters:无(默认转换全部数据)
预设复用:
- 保存常用配置为预设,下次启动直接加载,避免重复设置。
快速上手 Checklist
- ✅ 准备无中文路径的质谱文件
- ✅ 添加文件到转换列表
- ✅ 设置输出目录
- ✅ 选择 mzML 格式 + 64-bit 编码
- ✅ 勾选 Write index、zlib compression、TPP compatibility
- ✅ (可选)设置数据过滤规则
- ✅ 点击 Start 启动转换
|