主权项 |
1.一种逐步回归基因调控网络的推断方法,其特征在于,该方法具体步骤如下:A.读取基因表达数据矩阵和基因扰动数据矩阵;B.确定基因表达数据矩阵和基因扰动数据矩阵是否均为标准化数据,若基因表达数据矩阵和基因扰动数据据矩阵均为标准化数据,则转步骤D,否则转步骤C;C.对基因表达数据矩阵和基因扰动数据据矩阵分别进行数据归一化,使基因表达数据矩阵和基因扰动数据据矩阵均构成标准化数据,其归一化公式为:<maths num="0001"><![CDATA[<math><mrow><msub><mi>x</mi><mi>ij</mi></msub><mo>=</mo><mfrac><mrow><msub><mi>x</mi><mi>ij</mi></msub><mo>-</mo><msub><mover><mi>x</mi><mo>‾</mo></mover><mi>j</mi></msub></mrow><msqrt><msubsup><mi>L</mi><mi>jj</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></msubsup></msqrt></mfrac><mo>,</mo><mi>i</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>N</mi><mo>;</mo><mi>j</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>M</mi></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><msub><mi>p</mi><mi>ij</mi></msub><mo>=</mo><mfrac><mrow><msub><mi>p</mi><mi>ij</mi></msub><mo>-</mo><msub><mover><mi>p</mi><mo>‾</mo></mover><mi>j</mi></msub></mrow><msqrt><msubsup><mi>L</mi><mi>jj</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow></msubsup></msqrt></mfrac><mo>,</mo><mi>i</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>N</mi><mo>;</mo><mi>j</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>M</mi></mrow></math>]]></maths>其中,x<sub>ij</sub>为基因表达数据矩阵中的元素;<img file="FSB00000480687200013.GIF" wi="41" he="55" />为基因表达数据矩阵中第j列元素的平均数;<img file="FSB00000480687200014.GIF" wi="106" he="83" />为x<sub>j</sub>的离差平方和;N为基因的数量,M为基因扰动的实验次数;p<sub>ij</sub>为基因扰动数据矩阵中的元素;<img file="FSB00000480687200015.GIF" wi="49" he="56" />为基因扰动数据矩阵中第j列元素的平均数;<img file="FSB00000480687200016.GIF" wi="113" he="84" />为p<sub>j</sub>的离差平方和;D.分析标准化数据,用多重线性回归计算所有基因间相关系数矩阵,其具体步骤如下:D1.N个基因中的基因i选择第一个调控子;D2.对基因i选择第二个调控子;D3.终止引入新的调控子,完成基因i的回归模型的建立,得到基因i与其调控子之间的调控系数;E.将基因间相关系数矩阵可视化成网络,得到基因调控网络图。 |