发明名称 一种智能语义网中本体概念模糊相似度度量方法
摘要 本发明属于智能语义网中本体概念相似度度量领域,具体涉及一种智能语义网中本体概念模糊相似度度量方法。其包括以下步骤:A.将本体概念扩展成为解释集<img file="2011102459282100004DEST_PATH_IMAGE002.GIF" wi="13" he="12" />,所述解释集包括isA子集、relatedTo子集和nearTo子集;B.将本体概念的解释集扩展成模糊解释集<img file="DEST_PATH_IMAGE004.GIF" wi="24" he="18" />;C.根据所述模糊解释集计算本体概念的相似度。本发明能够同时满足概念间相似度的三个特性,并支持复杂本体中子概念出现多父概念时相似度计算。
申请公布号 CN102426578B 申请公布日期 2014.07.02
申请号 CN201110245928.2 申请日期 2011.08.25
申请人 华南理工大学 发明人 刘发贵;肖芬;张杨
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 何淑珍
主权项 1.一种智能语义网中本体概念模糊相似度度量方法,其特征在于,包括以下步骤:A.将本体概念扩展成为解释集<img file="2011102459282100001DEST_PATH_IMAGE002.GIF" wi="12" he="21" />,所述解释集包括isA子集、relatedTo子集和nextTo子集;其具体是,将与所述本体概念相关的本体概念分为三类,第一类本体概念是本体概念本身及所述本体概念以上的祖父概念集,将第一类本体概念存储在isA子集内,第二类本体概念是与所述本体概念有属性关系的本体概念及有属性关系的本体概念以上的祖父概念集,将第二类本体概念存储在relatedTo子集内,第三类本体概念是与该本体概念有同一父节点的兄弟概念集,将第三类本体概念存储在nextTo子集内;所述解释集<img file="DEST_PATH_IMAGE002A.GIF" wi="12" he="21" />表示如下:<img file="2011102459282100001DEST_PATH_IMAGE004.GIF" wi="401" he="33" />,其中<img file="2011102459282100001DEST_PATH_IMAGE006.GIF" wi="12" he="42" />、<img file="2011102459282100001DEST_PATH_IMAGE008.GIF" wi="15" he="42" />、<img file="2011102459282100001DEST_PATH_IMAGE010.GIF" wi="15" he="42" />表示三个子集对解释集的权重,不失合理性,有<img file="2011102459282100001DEST_PATH_IMAGE012.GIF" wi="99" he="42" />,且<img file="2011102459282100001DEST_PATH_IMAGE014.GIF" wi="96" he="42" />;B.将本体概念的解释集扩展成模糊解释集<img file="2011102459282100001DEST_PATH_IMAGE016.GIF" wi="24" he="27" />,所述模糊解释集包括分别与isA子集、relatedTo子集和nextTo子集相对应的双模糊集vIsA子集、vRelatedTo子集和vNextTo子集;其具体为:所述模糊解释集表示如下:<img file="2011102459282100001DEST_PATH_IMAGE018.GIF" wi="483" he="39" />,对于本体概念X,其各解释子集isA、nextTo、relatedTo对应的模糊解释子集vIsA、vNextTo、vRelatedTo的计算方式为:当存在唯一一条路径path,使X通过isA子集的语义路径到达本体的根节点,根节点用THING表示,令该路径为<img file="2011102459282100001DEST_PATH_IMAGE020.GIF" wi="189" he="42" />,其中<img file="2011102459282100001DEST_PATH_IMAGE022.GIF" wi="12" he="42" />与<img file="2011102459282100001DEST_PATH_IMAGE024.GIF" wi="24" he="42" />为isA子集中的概念,用<img file="2011102459282100001DEST_PATH_IMAGE026.GIF" wi="15" he="42" />表示概念<img file="DEST_PATH_IMAGE022A.GIF" wi="12" he="42" />与<img file="DEST_PATH_IMAGE024A.GIF" wi="24" he="42" />之间的isA关系,令<img file="2011102459282100001DEST_PATH_IMAGE028.GIF" wi="41" he="42" />,<img file="2011102459282100001DEST_PATH_IMAGE030.GIF" wi="75" he="42" /><img file="2011102459282100001DEST_PATH_IMAGE032.GIF" wi="553" he="56" />,其中<img file="2011102459282100001DEST_PATH_IMAGE034.GIF" wi="23" he="42" />、<img file="2011102459282100001DEST_PATH_IMAGE036.GIF" wi="21" he="42" />为<img file="DEST_PATH_IMAGE022AA.GIF" wi="12" he="42" />在<img file="2011102459282100001DEST_PATH_IMAGE038.GIF" wi="63" he="42" />模糊集中的真隶属度和假隶属度,其计算方法如下:<img file="2011102459282100001DEST_PATH_IMAGE040.GIF" wi="152" he="42" />,<img file="2011102459282100001DEST_PATH_IMAGE042.GIF" wi="141" he="42" />,其中<img file="2011102459282100001DEST_PATH_IMAGE044.GIF" wi="18" he="42" />表示概念<img file="2011102459282100001DEST_PATH_IMAGE046.GIF" wi="15" he="42" />非继承自父概念<img file="2011102459282100001DEST_PATH_IMAGE048.GIF" wi="29" he="42" />的属性的数目,<img file="2011102459282100001DEST_PATH_IMAGE050.GIF" wi="21" he="42" />表示子概念<img file="DEST_PATH_IMAGE046A.GIF" wi="15" he="42" />拥有的父概念的个数,<img file="2011102459282100001DEST_PATH_IMAGE052.GIF" wi="21" he="42" />表示父概念<img file="DEST_PATH_IMAGE048A.GIF" wi="29" he="42" />所拥有的子概念个数,<img file="2011102459282100001DEST_PATH_IMAGE054.GIF" wi="36" he="42" />用于调节<img file="DEST_PATH_IMAGE044A.GIF" wi="18" he="42" />、<img file="DEST_PATH_IMAGE050A.GIF" wi="21" he="42" />、<img file="DEST_PATH_IMAGE052A.GIF" wi="21" he="42" />对置信度的影响,其取值范围在于保证<img file="2011102459282100001DEST_PATH_IMAGE056.GIF" wi="78" he="42" />,<img file="2011102459282100001DEST_PATH_IMAGE058.GIF" wi="77" he="42" />;当存在多条路径<img file="2011102459282100001DEST_PATH_IMAGE060.GIF" wi="15" he="42" />、<img file="2011102459282100001DEST_PATH_IMAGE062.GIF" wi="20" he="42" />…、<img file="2011102459282100001DEST_PATH_IMAGE064.GIF" wi="17" he="42" />使X经过isA子集的语义路径到达本体的根节点,令<img file="2011102459282100001DEST_PATH_IMAGE066.GIF" wi="60" he="42" />为经过<img file="2011102459282100001DEST_PATH_IMAGE068.GIF" wi="12" he="42" />路径的双模糊集,则<img file="DEST_PATH_IMAGE070.GIF" wi="296" he="21" />;将本体概念X的兄弟概念集存储在<img file="DEST_PATH_IMAGE072.GIF" wi="81" he="42" />集中,令<img file="DEST_PATH_IMAGE074.GIF" wi="41" he="42" />,si与父概念的isA子集语义关系为<img file="DEST_PATH_IMAGE026A.GIF" wi="15" he="42" />,vNextTo对nextTo的双模糊扩展为:<img file="2011102459282100001DEST_PATH_IMAGE076.GIF" wi="443" he="42" />;将与概念X直接关联的概念存储在<img file="2011102459282100001DEST_PATH_IMAGE078.GIF" wi="81" he="42" />集中,vRelatedTo子集将relatedTo子集扩展为:<img file="2011102459282100001DEST_PATH_IMAGE080.GIF" wi="309" he="21" />;C.根据所述模糊解释集计算本体概念的相似度;将概念X、Y分别扩展成为模糊解释集<img file="DEST_PATH_IMAGE082.GIF" wi="29" he="21" />、<img file="DEST_PATH_IMAGE084.GIF" wi="29" he="21" />,其中X包含双模糊子集vIsA(X)、vNextTo(X)及vRelatedTo(X),Y包含双模糊子集vIsA(Y)、vNextTo(Y)及vRelatedTo(Y),通过分别计算双模糊子集vIsA(X)与vIsA(Y)的相似度<img file="DEST_PATH_IMAGE086.GIF" wi="156" he="42" />、双模糊子集vNextTo(X)与vNextTo(Y)的相似度<img file="DEST_PATH_IMAGE088.GIF" wi="219" he="42" />、双模糊子集vRelatedTo(X)与vRelatedTo (Y)的相似度<img file="DEST_PATH_IMAGE090.GIF" wi="264" he="42" />,结合步骤A所述权重<img file="DEST_PATH_IMAGE006A.GIF" wi="12" he="42" />、<img file="DEST_PATH_IMAGE008A.GIF" wi="15" he="42" />、<img file="2011102459282100001DEST_PATH_IMAGE010A.GIF" wi="15" he="42" />,计算得到概念X与概念Y的相似度为:<img file="DEST_PATH_IMAGE092.GIF" wi="553" he="44" />。
地址 510640 广东省广州市天河区五山路381号