发明名称 通过定量构效关系模型预测大气中有机物与羟基反应速率常数的方法
摘要 本发明公开了一种预测大气中有机物与羟基反应速率常数(kOH)的模型方法。在获得化合物分子结构的基础上,通过多元线性回归方法,构建了298K和温度依附性的kOH模型,可快捷、高效地预测有机化合物在298K或其它温度下kOH值;还依照经济合作与发展组织(OECD)关于QSAR模型构建和验证导则,对模型拟合优度、稳健性和预测能力进行了表征;模型应用域明确,涵盖不同种类化合物近900种;预测模型简明、易于程序化,能为有机化学品的环境持久性评价提供重要数据支持。
申请公布号 CN103425872A 申请公布日期 2013.12.04
申请号 CN201310307098.0 申请日期 2013.07.20
申请人 大连理工大学 发明人 李雪花;李超;乔显亮;陈景文
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 大连理工大学专利中心 21200 代理人 梅洪玉
主权项 一种通过定量构效关系模型预测大气中有机物与羟基反应速率常数的方法,其特征在于,首先,收集得到化合物数据集涵盖温度T为206K~1364K的1543个kOH数值,其中在温度为298K的数据872个;然后,对收集得到的1543个kOH数值进行建模,包括温度依附性的kOH QSAR模型和298K的kOH QSAR模型;将上述收集得到的1543个和872个化合物数据集分别按照4:1的比例拆分为训练集和验证集,其中,温度依附性的kOH QSAR模型训练集化合物个数为n=1234,验证集化合物个数next=309;298K的kOH QSAR模型训练集化合物个数为n=696,验证集化合物个数next=176;上述两种模型选取2种来源的描述符:(1)量子化学描述符,选取了6个量子化学描述符;(2)DRAGON描述符,基于优化后的构型得到了2000多种分子结构描述符;建模过程中,将温度T及1/T作为温度依附性的kOH QSAR模型描述符;分别对训练集中的kOH数据和上述所有描述符进行MLR回归分析;两个模型的线性关系式如下:模型1:温度依附性的kOH QSAR模型logkOH=‑8.613‑0.02100×X%+14.38×EHOMO‑0.6430×Mor29u+0.5870×NdsCH+0.5870×GATS1e+0.5770×X3A‑0.2450×SdsCH‑167.0×(1/T)+1.103×BIC1+0.1170×RDF015m‑1.044×SpMin8_Bh(p)+0.2390×nR=Cp‑0.1980×NssssC‑0.5080×F02[F‑Br](1)模型2:T=298K的kOH QSAR模型log(kOH)=‑6.511+15.85×EHOMO‑0.03800×AMW+0.1300×NdsCH+0.1630×Mor14i+0.3170×nR=Cp+0.7790×nP+0.3930×nRCHO‑0.01900×X%‑0.4550×SpMaxA_AEA(dm)+0.5890×(C‑020)‑0.05600×nCbH+0.1410×CATS2D_03_DL(2)其中,X%表示卤素原子在分子中所占的百分比,EHOMO表示最高占据分子轨道能量,Mor29u表示未加权的3D分子结构描述符,NdsCH表示分子中具有=CH‑结构的数目,GATS1e表示Sanderson电负性加权的lag1的Geary自相关指数,X3A表示3阶平均连接指数,SdsCH表示=CH‑结构电性拓扑态的总和,1/T表示温度的倒数,BIC1表示1阶临近对称键信息内容指标,RDF015m表示0.15质量加权的径向分布函数,SpMin8_Bh(p)表示极化率加权的burden矩阵的最小特征值,nR=Cp表示末端sp2杂化的主碳数目,NssssC表示分子中含>C<结构的个数,F02[F‑Br]表示在拓扑距离为2处F‑Br出现的频率AMW表示平均分子质量,Mor14i 表示离子化势加权的3D分子结构描述符,nP表示分子中磷原子个数,nRCHO表示分子中脂肪族醛的个数,SpMaxA_AEA(dm)表示偶极矩加权的来自于扩增边缘临界处的标准化的主要特征值,C‑020表示分子中=CX2结构信息,nCbH表示非取代苯环上sp2杂化碳的数目,CATS2D_03_DL表示位于lag03处的CATS2D亲脂性供体。
地址 116024 辽宁省大连市凌工路2号