发明名称 一种高分辨质谱数据的处理方法
摘要 本发明公开了一种高分辨质谱数据处理的新方法,属于分析化学领域。该方法快速读取原始质谱数据的XML文件,从数据色谱方向分段自动扣除背景,以用户自定义的二个参数初步获得原始数据的质谱特征,即质谱响应阈值和总特征峰数目。在此基础上,从质谱和色谱二个方向以固定的窗口大小划分数据,计算该窗口内被匹配样本与参考样本中所有质谱特征俩倆间的距离,采用线性规划优化的方法获得该距离矩阵的最短路径,构建特征峰匹配最优关系表,校正样本间的漂移。基于高分辨质谱数据峰融合的方法,得到同一代谢小分子中多个特征间的关联关系与多样本的匹配峰表,用于代谢组学标志物鉴定和发现。该方法适合低信噪比和复杂背景的高分辨质谱数据分析。
申请公布号 CN105334279A 申请公布日期 2016.02.17
申请号 CN201410398615.4 申请日期 2014.08.14
申请人 大连达硕信息技术有限公司 发明人 曾仲大;陈爱明
分类号 G01N30/86(2006.01)I 主分类号 G01N30/86(2006.01)I
代理机构 代理人
主权项 一种高分辨质谱数据处理的新方法,其特征在于包括以下步骤:a. 用户预先定义用于质谱数据处理的参考数据样本;b. 快速读取质谱数据的XML文件,单个文件读取完成后,构造二维矩阵并从数据色谱方向扣除背景基线;c. 背景基线扣除以非固定尺寸移动窗口的方式进行,即沿着色谱的流出方向根据色谱峰的划分对数据进行自动背景扣除;d. 用户自定义质谱响应的阈值或总特征峰数目,将已扣除背景的数据响应值,按照从大到小的顺序排列,筛选符合响应阈值或峰数目条件的质谱特征作为与参考样本比较分析的依据;e. 以用户自定义的窗口尺寸大小,依次从数据的质谱和色谱二个方向,以固定的窗口大小划分数据,获得被分析样本与参考样本在该窗口内的质谱特征,计算二个不同类型样本中质谱特征俩倆间的距离;f. 基于线性规划经典逆向思维的策略,计算该距离矩阵内从起始点到结束点的最短路径,并记录该最短路径所经过的轨迹,获得被校正样本数据与参考样本数据中各个特征峰的最优匹配关系,同时校正样本间的保留时间与m/z漂移;g. 将校正完成后获得的峰表进行高分辨质谱特征融合,即得到同一代谢小分子中多个特征间的关联关系与多样本的匹配峰表;h. 将上述获得的峰表与原始数据进行比较,验证结果的准确性和可靠性,并将结果应用于代谢组学标志物的发现和鉴定中。
地址 116023 辽宁省大连市高新区礼贤街32号B座505(1-2)室