发明名称 一种预测有机化学品的皮肤渗透系数的方法
摘要 本发明涉及健康风险评估测试策略领域,具体来说,涉及一种预测有机化学品的皮肤渗透系数方法。在获得化合物分子结构的基础上,通过计算表征结构特征的描述符,应用定量结构活性关系QSAR构建预测模型,与传统试验方法测定皮肤渗透参数相比,符合动物福利保护,减少了测试时间和成本,能够快速有效的预测皮肤渗透系数。本发明严格按照经济合作与发展组织(OECD)提出QSAR模型构建和使用准则规定的5个标准,通过计算化合物物理化学、电性能、拓扑和量子化学参数作为预测描述符,利用K-S分组将原始数据进行分类,筛选出7种最优描述符,运用清晰、简单、快速、透明的GA-MLR算法,模型应用域明确,具有良好的拟合效果、稳健性和预测能力。皮肤渗透系数预测模型能够准确、高效地完成化合物皮肤渗透系数的预测,为有机化合物健康危害评价提供有效方法。
申请公布号 CN104376221A 申请公布日期 2015.02.25
申请号 CN201410676421.6 申请日期 2014.11.21
申请人 环境保护部南京环境科学研究所 发明人 刘济宁;范德玲;王蕾;石利利
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 北京亿腾知识产权代理事务所 11309 代理人 陈惠莲
主权项 一种预测有机化学品的皮肤渗透系数的方法,其特征在于:步骤一、从收集132个化合物的皮肤渗透系数数据;步骤二、按照K‑S分组方法将步骤一的样本数据集进行分组,其中训练集共选取92个样本化合物,验证集共选取40个样本化合物;所述训练集用于构建预测模型,验证集数据用于外部验证,内部验证采用留一法交互验证;分组后的数据如下:皮肤渗透性模型化合物信息<img file="FDA0000613765890000011.GIF" wi="1734" he="2079" /><img file="FDA0000613765890000021.GIF" wi="1736" he="2814" /><img file="FDA0000613765890000031.GIF" wi="1736" he="2814" />步骤三、建立模型:采用遗传算法进行变量选择,所使用的相关参数为:种群数100,变异概率0.5,模型中允许的最大特征个数10,其他参数均为默认值;当增加变量数目对模型结果影响不大时,筛选出影响皮肤渗透性的7个最优描述符数,采用多元线性回归方法建立了线性模型;筛选出7种分子描述符及模型如下:GLA‑MLR线性方程:Log Fl=–0.323–0.510BEHm8–0.316GGI2–0.064RDF030u–2.173Mor17v–0.446G2s+1.587H5m+2.546RTu+(n<sub>tr</sub>=92  R<sup>2</sup><sub>tr</sub>=0.862  RMSE<sub>tr</sub>=0.290  n<sub>tr</sub>=40  R<sup>2</sup><sub>tst</sub>=0.614RMSE<sub>tst</sub>=0.290  Q<sup>2</sup><sub>loo</sub>=0.835  Q<sup>2</sup><sub>ext</sub>=0.705);所述BEHm8表示Burden特征值,GGI2表示拓扑电荷指数,RDF030u表示分子体积,Mor17v表示分子的3D结构和大小,G2s属于WHIM描述符,H5m表示分子的大小和原子的性质,RTu+表示化合物结构片段的相关信息;所述训练集和验证集实验值和预测值的相关系数分别达到0.862和0.614;其中,n为样本化合物的数目,R<sup>2</sup>为内部检验的相关系数,RMSE为均方根误差,Q<sup>2</sup>为外部检验的相关系数;步骤四、预测未知化合物的皮肤渗透系数,未知化合物经过分子结构的输入和结构优化过程,通过Dragon软件计算7种描述符,分别为上述BEHm8、GGI2、RDF030v、Mor17v、G2s、H5m、RTu+,利用步骤三的预测模型得到未知化合物预测值。
地址 210042 江苏省南京市玄武区蒋王庙8号