发明名称 高维少样本的基因、信号通路和相关蛋白质的选取方法
摘要 本发明提供了一种高维少样本的基因、信号通路和相关蛋白质的选取方法,该方法包括:获取原始的GBM生存相关的基因表达数据,并对所述基因表达数据进行数据过滤,获得GBM预处理数据;基于所述GBM预处理数据建立比例风险模型,进行存活分析,并基于所述GBM预处理数据及存货分析结果,筛选选取关键基因;基于所述关键基因,进行路径分析,并获取GBM信号通路。该方法将Cos、S I S、Lasso方法结合在一起,有效处理高维低样本的GBM基因表达数据,筛选GBM关键基因的准确度大大提高。
申请公布号 CN106326688A 申请公布日期 2017.01.11
申请号 CN201610734417.X 申请日期 2016.08.26
申请人 章乐;何小玉 发明人 章乐;李婷婷;胡南;何小玉
分类号 G06F19/20(2011.01)I;G06F19/16(2011.01)I;G06F19/24(2011.01)I 主分类号 G06F19/20(2011.01)I
代理机构 北京市广友专利事务所有限责任公司 11237 代理人 张仲波
主权项 高维少样本的基因、信号通路和相关蛋白质的选取方法,所述方法包括:步骤1、获取原始的GBM生存相关的基因表达数据,并对所述基因表达数据进行数据过滤,获得GBM预处理数据;步骤2、基于所述GBM预处理数据建立比例风险模型,进行存活分析,并基于所述GBM预处理数据及存货分析结果,筛选选取关键基因;所述比例风险模型采用Cox回归模型为公式1,具体为:h(t,x)=h<sub>0</sub>(t)exp(β<sub>1</sub>x<sub>1</sub>+β<sub>1</sub>x<sub>1</sub>+···+β<sub>i</sub>x<sub>i</sub>)  (1),其中h(t,x)是病人在时间t的风险函数,h<sub>0</sub>(t)是一个共有的危险基准函数;x<sub>1</sub>,x<sub>2</sub>...x<sub>i</sub>是协变量;β<sub>1</sub>,β<sub>2</sub>...β<sub>i</sub>是回归系数,由样本估计而得;步骤3、基于所述关键基因,进行路径分析,并获取GBM信号通路。
地址 400038 重庆市沙坪坝区晒光坪69号附13号3-1