发明名称 污染物定量结构活性相关模型结构描述符筛选终止的方法
摘要 本发明公开了污染物定量结构活性相关模型结构描述符筛选终止的方法。本发明将交叉验证相关系数q2和模型修正相关系数R2adj进行整合;对某一变量子集建立统计模型,获得观测值与模型估计值之间的相关系数r2、修正相关系数R2adj;对上述过程中的变量子集进行交叉验证,获得模型的交叉验证相关系数q2,所用的交叉验证方法有两种:留一法交互验证和留多法交互验证;根据上述过程得到的统计参数构造新参数QRadj;对同一系统新参数QRadj的数值越大,说明模型的稳定性越高,预测能力越强。本发明中的新标准QRadj不仅能够保证所获模型具有较高的交叉验证相关系数q2,而且可以避免过拟合现象的出现,杜绝筛选出低r2值高q2值的QSAR模型变量组合,科学描述模型的稳定性和预测能力。
申请公布号 CN102156791B 申请公布日期 2012.10.17
申请号 CN201110110058.8 申请日期 2011.04.29
申请人 南京大学 发明人 张爱茜;易忠胜;穆云松;蔺远;高常安;李富华
分类号 G06F17/50(2006.01)I 主分类号 G06F17/50(2006.01)I
代理机构 南京知识律师事务所 32207 代理人 蒋海军
主权项 1.污染物定量结构活性相关模型结构描述符筛选终止的方法,包括以下步骤:(1)将交叉验证相关系数<i>q</i><sup>2</sup>和模型修正相关系数<i>R</i><sup>2</sup><sub>adj</sub>进行整合,提供污染物定量结构活性相关模型结构描述符筛选终止的方法;(2)对某一变量子集建立统计模型,获得观测值与模型估计值之间的相关系数<i>r</i><sup>2</sup>、修正相关系数<i>R</i><sup>2</sup><sub>adj</sub>,各参数的计算公式如下:<img file="126153DEST_PATH_IMAGE001.GIF" wi="137" he="89" /><img file="792757DEST_PATH_IMAGE002.GIF" wi="153" he="45" />其中,<i>y</i><sub><i>i</i></sub>为第<i>i</i>个观测值,<img file="871572DEST_PATH_IMAGE003.GIF" wi="18" he="25" />为第<i>i</i>个观测值的模型估计值,<img file="556500DEST_PATH_IMAGE004.GIF" wi="16" he="21" />为观测值的平均值,<i>n</i>为模型的样本数,<i>m</i>为模型的变量数;(3)对(2)中的变量子集进行交叉验证,获得模型的交叉验证相关系数<i>q</i><sup>2</sup>,所用的交叉验证方法有两种类型:留一法交互验证(Leave-One-Out Cross Validation, LOOCV)和留多法交互验证(Leave-Multiple-Out Cross Validation, LMOCV),各参数的计算公式如下:<img file="328147DEST_PATH_IMAGE005.GIF" wi="196" he="89" /><img file="216468DEST_PATH_IMAGE006.GIF" wi="245" he="89" />其中<img file="98974DEST_PATH_IMAGE007.GIF" wi="46" he="26" />为模型进行LOOCV的相关系数,<img file="641338DEST_PATH_IMAGE008.GIF" wi="48" he="26" />为模型进行LMOCV的相关系数,<i> N</i>为模型进行LMOCV的重复次数,<img file="583886DEST_PATH_IMAGE009.GIF" wi="49" he="28" />为模型进行LOOCV时的模型对第<i>i</i>样本的预测值,<img file="959504DEST_PATH_IMAGE010.GIF" wi="49" he="28" />为模型进行LMOCV时的模型对第<i>i</i>样本的预测值,LMOCV和LOOCV的统计参数都采用相同的符号;(4)根据(2)和(3)得到的统计参数构造新参数<i>QR</i><sub><i>adj</i></sub>,计算公式如下:<img file="380121DEST_PATH_IMAGE011.GIF" wi="109" he="28" />;(5)对同一系统新参数<i>QR</i><sub><i>adj</i></sub>的数值越大,说明模型的稳定性越高,预测能力越强。
地址 210093 江苏省南京市鼓楼区汉口路22号