发明名称 基于支持向量机的有机化合物燃爆特性预测方法
摘要 一种基于支持向量机的有机化合物燃爆特性预测方法,它根据各种燃爆特性由其分子结构决定的原理,利用反映分子结构特征的各种结构参数来描述有机物的燃爆特性。通过引入强大的机器学算法支持向量机方法,可对有机物各燃爆特性与分子结构间存在的非线性、不确定性和复杂性进行有效的训练和预报,从而建立稳定、高效的预测模型。将建立的预测模型应用于其他未知化合物燃爆特性的预测,具有预测精度高、快捷方便的优点。
申请公布号 CN101339180B 申请公布日期 2012.05.23
申请号 CN200810022518.X 申请日期 2008.08.14
申请人 南京工业大学 发明人 蒋军成;潘勇;王睿;曹洪印
分类号 G01N33/22(2006.01)I;G06N1/00(2006.01)I 主分类号 G01N33/22(2006.01)I
代理机构 南京天华专利代理有限责任公司 32218 代理人 瞿网兰;袁正英
主权项 1.一种基于支持向量机的有机化合物燃爆特性预测方法,其特征在于:以有机化合物的分子基团作为描述分子结构特征的结构描述符,实现分子结构信息的参数化;利用支持向量机分别针对各燃爆特性与其结构描述符之间的内在定量关系进行模拟,建立相应的基于分子基团的支持向量机预测模型;将需要预测的有机化合物的分子基团作为输入参数输入所得的预测模型中即可得到相关燃爆特性值;具体步骤如下:(1)实验数据的整理;根据统计标准和结构标准选择一系列有机化合物,构成QSPR研究的样本集;化合物选择的条件是统计上的随机性、结构上的代表性和全面性,以及数据的可获得性;针对样本集中的系列化合物,收集所关注的燃爆特性数据;数据收集的途径主要有3种:实验测定、各种权威性质数据库及手册;(2)样本集的划分;将样本集随机划分为训练集和预测集两个部分,其中训练集用于建立模型,预测集用于对所建模型进行评价和验证;(3)分子基团的划分;针对样本集中有机物的结构特征,根据标准和规则进行分子结构基团的划分,以所划分出的分子基团作为表征有机物结构特征的分子描述符,实现分子结构的参数化描述;(4)预测模型的建立以划分的分子基团作为输入变量,所研究燃爆特性作为输出变量,应用支持向量机方法对分子结构与相关燃爆特性之间的内在关系进行模拟,寻求两者之间存在的定量函数关系,建立相应的预测模型;决定支持向量机模拟性能的相关参数主要包括:核函数、核函数的参数、惩罚系数C以及ε-不敏感损失函数中ε的大小;核函数选用径向基核K(x,x<sub>i</sub>)=exp(-γ||x-x<sub>i</sub>||<sup>2</sup>),因为它具有较高的学习效率和学习速率;其它参数通过“格点搜索”方法确定;参数搜索范围如下:惩罚系数C——0-1024;核函数的宽度γ——0-1024;ε-不敏感损失函数中的ε——0-1024;搜索方向为“留1/10法”交互检验的最小均方根误差(RMSE);“留1/10法”交互验证是指从训练集中每次筛除训练样本数的1/10个化合物,用其余的化合物建模,来预测所筛除化合物的性质,这样得到一个交互验证的均方根误差(RMS)来评价模型性能的好坏,其计算公式为:<img file="FSB00000617668100021.GIF" wi="604" he="197" />通过搜索,选取“留1/10法”交互检验的最小RMS所对应的那组参数作为模型的输入参数;应用搜索出的最优参数作为支持向量机的输入参数,建立相应的预测模型。(5)模型的评价与验证对所建立的QSPR模型的可靠程度及模型的预测能力进行评价和验证;评价主要针对几个方面:模型的拟合优度、稳健性和预测能力,模型的拟合优度采用复相关系数r<sup>2</sup>即回归系数的平方,代表模型所解释的方差来评价;模型的稳健性采用“留一法”即Leave-one-out,LOO交互验证方法来进行检验,“留一法”交互检验是指从训练集中每次筛除一个化合物,用其余的化合物建模,来预测筛除化合物的性质,这样得到一个交互验证的r<sup>2</sup>即Q<sup>2</sup>来评价模型稳健性,其计算公式为:<img file="FSB00000617668100022.GIF" wi="596" he="261" />模型预测能力的验证通过用所建立的模型来预测测试集化合物的相关性质,然后计算相应的均方根误差(RMS)和平均绝对误差(AAE)的方式进行;只有具有统计上的显著性、稳健的和具有高度预测能力的模型才能够进行应用;(6)预测模型的应用;利用所建模型的预测能力对其它未知化合物的相关燃爆特性进行预测。
地址 210009 江苏省南京市中山北路200号