发明名称 一种去除测序数据噪声的方法
摘要 本发明公开了一种去除测序数据噪声的方法,包括以下步骤:S1:对原始RNA‑Seq数据进行过滤,应用最小过滤原则,去除原始数据矩阵中的数值为0或表达量极低的行;S2:对过滤后的数据进行标准化处理,去除系统偏差,将不同的结果根据全局数值进行调整,使个体之间的数据具有可比性;S3:计算标准化数据后感兴趣的变量和批次噪声之间的相关性,进行相关系数显著性检验,求出P值,若P&lt;0.05,则有显著相关性,否则没有显著相关性;S4:若两者相关,则对数据进行rlog变换;若两者不相关,则先对数据进行Z‑Score处理后,再log变换,Z‑Score的模型为:<img file="DDA0001211551810000011.GIF" wi="222" he="103" />其中:Y为处理前的数据,X为处理后的数据,μ为均值,ν为方差;S5:确定替代变量。
申请公布号 CN106611107A 申请公布日期 2017.05.03
申请号 CN201710031232.7 申请日期 2017.01.17
申请人 大连海事大学 发明人 王演;张宁
分类号 G06F19/18(2011.01)I 主分类号 G06F19/18(2011.01)I
代理机构 大连东方专利代理有限责任公司 21212 代理人 张大保;李馨
主权项 一种去除测序数据噪声的方法,其特征在于,包括以下步骤:S1:对原始数据集进行过滤,应用最小过滤原则,去除原始数据矩阵中数值为0或表达量极低的行;S2:对过滤后的数据进行标准化处理,去除系统偏差,将不同的结果根据全局数值进行调整,使个体之间的数据具有可比性;S3:计算标准化数据后组变量和批次噪声之间的相关性,进行相关系数显著性检验,求出P值,若P&lt;0.05,则有显著相关性,否则没有显著相关性;S4:若两者相关,则对数据进行rlog变换;若两:若两者不相关,则先对数据进行Z‑Score处理,然后对处理后的数据进行log变换,Z‑Score的模型为:<maths num="0001"><math><![CDATA[<mrow><mi>X</mi><mo>=</mo><mfrac><mrow><mi>Y</mi><mo>-</mo><mi>&mu;</mi></mrow><mi>&nu;</mi></mfrac></mrow>]]></math><img file="FDA0001211551780000011.GIF" wi="205" he="101" /></maths>其中:Y为处理前的数据,X为处理后的数据,μ为均值,ν为方差;S5:确定替代变量。
地址 116026 辽宁省大连市高新园区凌海路1号
您可能感兴趣的专利