发明名称 基于二维统计模型的体细胞拷贝数变异显著性检测方法
摘要 一种基于二维统计模型的体细胞拷贝数变异显著性检测方法,其包括,S1采集SCNA数据,并对SCNA数据进行预处理;S2计算SCNA邻近位点间的关系系数,将染色体分割成多个相对独立的SCNA结构单元;S3计算每个SCNA结构单元的统计量,并在全基因组上实施二维随机置换;S4针对SCNA结构单元的不同长度L,通过计算置换样本中任意长度为L的SCNA模式的统计量,在二维空间中构造基于L的零分布D<sub>L</sub>;将相应SCNA的统计量与D<sub>L</sub>进行对比,将所述SCNA的统计量与所述D<sub>L</sub>记为p值;若p值小于设定的阈值,则相应的SCNA显著,具有潜在的癌症功能。
申请公布号 CN103778350B 申请公布日期 2016.10.05
申请号 CN201410010002.9 申请日期 2014.01.09
申请人 西安电子科技大学 发明人 袁细国;张军英;杨利英;张胜利
分类号 G06F19/18(2011.01)I 主分类号 G06F19/18(2011.01)I
代理机构 北京科亿知识产权代理事务所(普通合伙) 11350 代理人 汤东凤
主权项 一种基于二维统计模型的体细胞拷贝数变异显著性检测方法,其特征在于:其包括,S1采集SCNA数据,并对SCNA数据进行预处理;S2计算SCNA邻近位点间的关系系数,将染色体分割成多个相对独立的SCNA结构单元;S3计算每个SCNA结构单元的统计量,并在全基因组上实施二维随机置换;利用已知的SCNA功能模式构造训练集,学习频率的权重w<sub>1</sub>和幅度的权重w<sub>2</sub>,计算统计量,S<sub>test</sub>=w<sub>1</sub>*f+w<sub>2</sub>*a其中,f,a,S<sub>test</sub>分别指训练集中SCNA功能模式的频率,幅度,及统计量的值;所述二维随机置换具体过程如下:a)针对SCNA出现的频率,随机置换其在全基因组中出现的位置;针对每个置换样本集,计算随机SCNA的发生频率,建立基于频率的零分布D<sub>f</sub>;b)针对SCNA的变异幅度,随机置换幅度在全基因组中出现的位置;针对每个置换样本集,计算随机SCNA的幅度,建立基于幅度的零分布D<sub>a</sub>;c)利用有监督学习的权重,w<sub>1</sub>和w<sub>2</sub>,构造零分布D,以检测统计量的显著性水平:其中D=w<sub>1</sub>*D<sub>f</sub>+w<sub>2</sub>*D<sub>a</sub>;S4针对SCNA结构单元的不同长度L,通过计算置换样本中任意长度为L的SCNA模式的统计量,在二维空间中构造基于L的零分布D<sub>L</sub>;将相应SCNA的统计量与D<sub>L</sub>进行对比,将所述SCNA的统计量与所述D<sub>L</sub>记为p值;若p值小于设定的阈值,则相应的SCNA显著,具有潜在的癌症功能。
地址 710071 陕西省西安市太白南路2号西安电子科技大学