发明名称 一种代谢组学数据随机误差的筛选和校正方法
摘要 本发明公开了一种代谢组学数据随机误差的筛选和校正方法,首先采用色谱-质谱联用仪对样品进行分析得到代谢组轮廓,通过计算相邻两个质量控制样品(QC)中代谢物响应强度的比值,将比值从小到大排序后,筛选总比值个数的5%作为离散点,将这5%的离散点平均分配到排序后比值的两端,从而建立模型去筛选代谢组数据中的随机误差。然后利用比值的线性拟合模型对随机误差进行校正。本发明的核心在于通过代谢物在两个相邻QC样品中响应强度的比值构建模型去筛选和校正随机误差。本发明可以高效、准确地筛选和校正代谢组数据中的随机误差,改善代谢组数据的质量。
申请公布号 CN105424827A 申请公布日期 2016.03.23
申请号 CN201510755515.7 申请日期 2015.11.07
申请人 大连理工大学 发明人 林晓惠;郝志强;赵燕妮;许国旺;路鑫
分类号 G01N30/02(2006.01)I 主分类号 G01N30/02(2006.01)I
代理机构 大连理工大学专利中心 21200 代理人 梅洪玉
主权项 一种用于筛选和校正代谢组学数据随机误差的方法,首先从所有待测样品中取出相同质量样品,混合后建立质控(QC)样品,计算相邻两个QC样本中代谢物响应强度的比值,建立模型筛选随机误差,然后利用线性拟合模型对随机误差进行校正;其特征在于以下步骤:(1)制作QC样本:分别从所有将进行代谢组学分析的样本中准确称量或移取等量样本并均匀混合成一个大的样本,即QC样本;(2)获取代谢组学数据:每5‑20个待测样本插入一个QC样本,QC样本和待测样本按照完全相同条件进行样本预处理和基于色谱‑质谱方法的代谢组学分析;(3)获取相邻两个QC样品中代谢组数据比值:计算同一个代谢物在相邻两个QC样品中的响应强度的比值;(4)构建模型筛选随机误差:将相邻两个QC样品中代谢物的比值从小到大排序后,筛选总比值个数的5%作为离散点,将这5%的离散点平均分配到排序后比值的两端,从而筛选出随机误差;(5)构建模型校正随机误差:利用两个相邻QC样品中的正常比值进行线性拟合模型,校正随机误差,具体步骤为:①两个相邻QC样品中正常比值的获取:筛选到随机误差后,去除含有随机误差的代谢特征,计算不含有随机误差的正常代谢特征在相邻两个QC样品中的比值;②线性拟合模型的构建:将正常代谢特征在两个相邻QC样本中的比值,进行从小到大排序,并进行线性拟合,获得线性拟合模型的公式,将含有随机误差的代谢特征j带入线性拟合模型的公式中,获得校正因子<img file="FDA0000841443880000011.GIF" wi="430" he="302" />其中AQC<sub>nj</sub>和AQC'<sub>(n‑1)j</sub>分别代表特征j在QC<sub>n</sub>中未校正的响应值和在QC<sub>(n‑1)</sub>中校正后的响应值;③随机误差的校正:某一含有随机误差的代谢物j在QC<sub>n</sub>中响应值为AQ<sub>nj</sub>,其校正后的响应值AQC'<sub>nj</sub>通过如下公式获得;<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>A</mi><mrow><msubsup><mi>QC</mi><mrow><mi>n</mi><mi>j</mi></mrow><mo>&prime;</mo></msubsup></mrow></msub><mo>=</mo><msub><mi>A</mi><mrow><msubsup><mi>QC</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><mn>1</mn><mo>)</mo><mi>j</mi></mrow><mo>&prime;</mo></msubsup></mrow></msub><mo>&times;</mo><msub><mrow><mo>(</mo><mfrac><msub><mi>A</mi><mrow><msub><mi>QC</mi><mrow><mi>n</mi><mi>j</mi></mrow></msub></mrow></msub><msub><mi>A</mi><mrow><msubsup><mi>QC</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><mn>1</mn><mo>)</mo><mi>j</mi></mrow><mo>&prime;</mo></msubsup></mrow></msub></mfrac><mo>)</mo></mrow><mrow><mi>c</mi><mi>o</mi><mi>r</mi><mi>r</mi></mrow></msub><mo>.</mo></mrow>]]></math><img file="FDA0000841443880000012.GIF" wi="1038" he="327" /></maths>
地址 116024 辽宁省大连市甘井子区凌工路2号