发明名称 基于化合物特征的天然产物活性成分计算识别方法
摘要 本发明公开了一种判别能力强的、基于化合物特征的天然产物活性成分计算识别方法,它是一种从已知结构的天然产物提取物分子中,利用化合物特征描述符,计算识别该分子有无生物活性的方法,该方法包括如下步骤:步骤A.构建用于建模的天然产物提取物分子的训练集和预测集;步骤B.搜集训练集和预测集的分子结构文件;步骤C.利用分子结构文件算出训练集和预测集的化合物特征描述符;步骤D.根据化合物特征描述符,用机器学软件对训练集进行分类建模;步骤E.用机器学软件结合步骤D的训练集模型来识别预测集的分子有无生物活性。该发明方法在高通量虚拟筛选和天然产物协同作用研究中有良好应用前景。
申请公布号 CN101477597A 申请公布日期 2009.07.08
申请号 CN200910095647.6 申请日期 2009.01.15
申请人 浙江大学 发明人 陈新;周犀;胡彬
分类号 G06F19/00(2006.01)I;G06F17/50(2006.01)I;G06K9/62(2006.01)I;G06N1/00(2006.01)I 主分类号 G06F19/00(2006.01)I
代理机构 杭州宇信知识产权代理事务所(普通合伙) 代理人 张宇娟
主权项 1. 一种基于化合物特征的天然产物活性成分计算识别方法,其特征在于:它是一种从已知结构的天然产物提取物分子中,利用化合物特征描述符,计算识别该分子有无生物活性的方法,该方法包括如下步骤:(A)构建用于建模的天然产物提取物分子的训练集和预测集,所述训练集是有生物活性说明的天然产物分子数据集,预测集是需要识别活性成分的天然产物提取物分子数据集;(B)搜集训练集和预测集的分子结构文件;(C)利用分子结构文件算出训练集和预测集的化合物特征描述符;(D)根据化合物特征描述符,用机器学习软件对训练集进行分类建模;(E)用机器学习软件结合步骤(D)的训练集模型来识别预测集的分子有无生物活性。
地址 310027浙江省杭州市余杭塘路388号浙江大学紫金港校区生命科学学院