主权项 |
一种用于筛选和校正代谢组学数据随机误差的方法,首先从所有待测样品中取出相同质量样品,混合后建立质控(QC)样品,计算相邻两个QC样本中代谢物响应强度的比值,建立模型筛选随机误差,然后利用线性拟合模型对随机误差进行校正;其特征在于以下步骤:(1)制作QC样本:分别从所有将进行代谢组学分析的样本中准确称量或移取等量样本并均匀混合成一个大的样本,即QC样本;(2)获取代谢组学数据:每5‑20个待测样本插入一个QC样本,QC样本和待测样本按照完全相同条件进行样本预处理和基于色谱‑质谱方法的代谢组学分析;(3)获取相邻两个QC样品中代谢组数据比值:计算同一个代谢物在相邻两个QC样品中的响应强度的比值;(4)构建模型筛选随机误差:将相邻两个QC样品中代谢物的比值从小到大排序后,筛选总比值个数的5%作为离散点,将这5%的离散点平均分配到排序后比值的两端,从而筛选出随机误差;(5)构建模型校正随机误差:利用两个相邻QC样品中的正常比值进行线性拟合模型,校正随机误差,具体步骤为:①两个相邻QC样品中正常比值的获取:筛选到随机误差后,去除含有随机误差的代谢特征,计算不含有随机误差的正常代谢特征在相邻两个QC样品中的比值;②线性拟合模型的构建:将正常代谢特征在两个相邻QC样本中的比值,进行从小到大排序,并进行线性拟合,获得线性拟合模型的公式,将含有随机误差的代谢特征j带入线性拟合模型的公式中,获得校正因子<img file="FDA0000841443880000011.GIF" wi="430" he="302" />其中AQC<sub>nj</sub>和AQC'<sub>(n‑1)j</sub>分别代表特征j在QC<sub>n</sub>中未校正的响应值和在QC<sub>(n‑1)</sub>中校正后的响应值;③随机误差的校正:某一含有随机误差的代谢物j在QC<sub>n</sub>中响应值为AQ<sub>nj</sub>,其校正后的响应值AQC'<sub>nj</sub>通过如下公式获得;<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>A</mi><mrow><msubsup><mi>QC</mi><mrow><mi>n</mi><mi>j</mi></mrow><mo>′</mo></msubsup></mrow></msub><mo>=</mo><msub><mi>A</mi><mrow><msubsup><mi>QC</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><mn>1</mn><mo>)</mo><mi>j</mi></mrow><mo>′</mo></msubsup></mrow></msub><mo>×</mo><msub><mrow><mo>(</mo><mfrac><msub><mi>A</mi><mrow><msub><mi>QC</mi><mrow><mi>n</mi><mi>j</mi></mrow></msub></mrow></msub><msub><mi>A</mi><mrow><msubsup><mi>QC</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><mn>1</mn><mo>)</mo><mi>j</mi></mrow><mo>′</mo></msubsup></mrow></msub></mfrac><mo>)</mo></mrow><mrow><mi>c</mi><mi>o</mi><mi>r</mi><mi>r</mi></mrow></msub><mo>.</mo></mrow>]]></math><img file="FDA0000841443880000012.GIF" wi="1038" he="327" /></maths> |