一种新的基于ChEBI描述的药物分子相似性计算方法,申请号CN201710023857.9-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	一种新的基于ChEBI描述的药物分子相似性计算方法
摘要	本发明涉及一种新的融合ChEBI中化合物本体信息的药物分子相似性计算解决方法，从ChEBI网站中下载所有药物分子本体信息，以药物分子在KEGG中的代码搜索出未知药物化合物的定义，分别计算定义句子中的每个单词在所有ChEBI化合物定义中出现的次数。两个化合物的相似性采用对所有共同出现的单词在ChEBI定义中出现的总次数分别倒数求和表示。本发明融合化合物ChEBI中的本体信息，采用此发明中计算化合物相似性方法和多标签算法ML‑GKR用于化合物ATC分类预测器的预测成功率，比现有多标签算法预测成功率提高5%，具有广阔的运用前景。
申请公布号	CN106599609A	申请公布日期	2017.04.26
申请号	CN201710023857.9	申请日期	2017.01.13
申请人	景德镇陶瓷大学	发明人	肖绚;程翔
分类号	G06F19/16(2011.01)I	主分类号	G06F19/16(2011.01)I
代理机构		代理人
主权项	一种新的融合ChEBI中化合物本体信息的药物分子相似性计算解决方法，其特征在于包括以下步骤：（1）从ChEBI网站中下载所有药物分子本体信息，下载网址为：ftp://ftp.ebi.ac.uk/pub/databases/chebi/ontology/；（2）在下载文件中，以药物分子在KEGG中的代码搜索出未知药物化合物的定义；（3）ChEBI给出的定义为一英文句子，按照单词出现在定义中的先后顺序，用一个离散向量表示这个药物化合物<img file="674954dest_path_image001.GIF" wi="109" he="19" />，m为这个句子中出现单词的总个数，w<sub>11</sub>表示第一个单词，w<sub>12</sub>代表第二个单词，以此类推；（4）分别计算句子中的每个单词在所有ChEBI化合物定义中出现的次数，用1除以这个单词在ChEBI定义中出现的总次数表示其频率q<sub>ij</sub>；（5）计算两个化合物d<sub>1</sub>和d<sub>2</sub>相似性如下式：<img file="388832dest_path_image002.GIF" wi="451" he="191" />其中q<sub>ij</sub>为单词出现的频率，用1除以单词出现的总数表示。
地址	333001 江西省景德镇市珠山区新厂陶阳南路27号

您可能感兴趣的专利

STABLE BIOCIDAL DELIVERY SYSTEMS AND TREATMENT AGAINST BIOFOULING

SYSTEM AND METHOD FOR LAMINATING MODULES

METHOD OF REMOVING/PREVENTING REDEPOSITION OF PROTEIN SOILS

A milk conveyer device

Clip and clipping instrument for biological tissues

Rear seat structure of all terrain vehicles

Conveyor module with improved pin locking element

A cooling device with an ice machine

Vehicle protection system

SENSING HEAD SYSTEM FOR A COORDINATE MEASURING INSTRUMENT

Device for presentation of spectacles

Holster for a portable communication device

Robot arm control method and control device

CATIONIC POLYMER THICKENERS

METHOD AND DEVICE FOR TRANSMITTING AND RECEIVING DIGITAL INFORMATION BY USE OF A FEC FRAME COMPRISING AT LEAST TWO FEC FRAME HEADERS

VIBRATING PRILLING BUCKET FOR GRANULATION OF A FLUID SUBSTANCE

Agricultural device

AUTOMATIC DIAMETER DETERMINATION OF COINS

Nucleic acids for inhibiting hairless protein expression and methods of use thereof

Scooter-type vehicle