发明名称 一种农业领域本体有效性评估方法
摘要 本发明公开了一种农业领域本体有效性评估方法,结合查全率R、查准率P和F1指数对农业领域本体概念进行评估,结合概念间的语义相似度对农业领域本体概念间分类关系的一致性、准确性、简洁性进行评估,根据评估指标对农业领域本体概念间对象属性关系进行评估。如此,重点解决了农业领域本体有效性评估中存在的三个重要问题——本体概念的有效性评估、本体分类关系的有效性评估和本体非分类关系的有效性评估。本发明提出的农业领域本体有效性评估方法体系以农业领域本体为研究对象,可有效地评估农业领域本体的质量,提升农业本体构建效率。
申请公布号 CN106372099A 申请公布日期 2017.02.01
申请号 CN201610534240.9 申请日期 2016.07.07
申请人 安徽农业大学 发明人 李绍稳;章丽;张筱丹;刘超;赵会园;许高建;徐济成;耿凡凡;孔晨;李景霞;孙靓
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 合肥市长远专利代理事务所(普通合伙) 34119 代理人 程笃庆;黄乐瑜
主权项 一种农业领域本体有效性评估方法,其特征在于,包括以下步骤:S1、评估农业领域本体概念;S2、评估农业领域本体概念间分类关系;S3、评估农业领域本体概念间非分类关系;步骤S1具体包括以下分步骤:S11、将待评估的农业领域本体按照概念进行解析,得到概念集合;S12、设置概念评估指标,概念评估指标包括查全率R、查准率P和F1指数,其中,<img file="FDA0001043839490000011.GIF" wi="595" he="135" /><img file="FDA0001043839490000012.GIF" wi="494" he="135" />定义在查全率和查准率会出现矛盾的情况下,对这查全率和查准率进行加权调和平均获得的值为F指数,<maths num="0001"><math><![CDATA[<mrow><mi>F</mi><mo>=</mo><mfrac><mrow><mo>(</mo><msup><mi>&alpha;</mi><mn>2</mn></msup><mo>+</mo><mn>1</mn><mo>)</mo><mi>P</mi><mo>&times;</mo><mi>R</mi></mrow><mrow><msup><mi>&alpha;</mi><mn>2</mn></msup><mrow><mo>(</mo><mi>P</mi><mo>+</mo><mi>R</mi><mo>)</mo></mrow></mrow></mfrac></mrow>]]></math><img file="FDA0001043839490000013.GIF" wi="378" he="127" /></maths>F1指数为α=1时的F指数,<maths num="0002"><math><![CDATA[<mrow><mi>F</mi><mn>1</mn><mo>=</mo><mfrac><mrow><mn>2</mn><mo>&times;</mo><mi>P</mi><mo>&times;</mo><mi>R</mi></mrow><mrow><mi>P</mi><mo>+</mo><mi>R</mi></mrow></mfrac></mrow>]]></math><img file="FDA0001043839490000014.GIF" wi="294" he="118" /></maths>S13、根据待评估本体的学科领域范围,选择或构建相应的领域词典;S14、根据概念评估指标即查全率、查准率和F1指数对概念进行评估,获得正确概念数;S15、输出查全率、查准率及F1指数的评估结果;步骤S2具体包括以下分步骤:S21、将待评估的农业领域本体按照概念间的subClassOf关系进行解析,并将其保存为数据结构为图G=&lt;V,E&gt;的数据文件,V为本体概念集合,E为分类关系集合;S22、设置分类关系评估的三项评估指标,分别是一致性、准确性和简洁性;S23、计算概念间的语义相似度,并设置最佳阈值ε;S24、建立概念语义相似度集合S(s<sub>1</sub>,s<sub>2</sub>,...,s<sub>n</sub>)和一致性、准确性及简洁性判断结果集合T(t<sub>1</sub>,t<sub>2</sub>,...,t<sub>n</sub>),S<sub>i</sub>=Sim(v<sub>i</sub>,v<sub>j</sub>),i、j都是自然数,概念vi为概念vj上位词,且v<sub>i</sub>≠v<sub>j</sub>;S25、判断概念vi上位词个数是否大于1,是,则判断概念vi分类错误并存入判断结果集合T(t<sub>1</sub>,t<sub>2</sub>,...,t<sub>n</sub>);S26、将Sim(v<sub>i</sub>,v<sub>j</sub>)与最佳阈值ε比较,并根据比较结果判断概念vi和概念vj是否符合分类关系,符合,则将S<sub>i</sub>存入概念语义相似度集合S(s<sub>1</sub>,s<sub>2</sub>,...,s<sub>n</sub>);不符合则判断概念vi分类错误并将判断结果存入判断结果集合T(t<sub>1</sub>,t<sub>2</sub>,...,t<sub>n</sub>);S27、判断是否存在Sim(v<sub>i</sub>,v<sub>j</sub>)=Sim(v<sub>i</sub>,v<sub>k</sub>),如果存在,则判断概念v<sub>j</sub>和概念v<sub>k</sub>发生冗余错误并存入判断结果集合T(t<sub>1</sub>,t<sub>2</sub>,...,t<sub>n</sub>);S28、重复步骤S25至S27,直到将本体概念集合V和分类关系集合E全部计算判断完毕;S29、输出相似度计算结果集合S和一致性、准确性及简洁性判断结果集合T;步骤S3具体包括以下分步骤:S31、按照对象属性关系对农业领域本体进行解析,将解析得到的属性关系图保存为数据结构为<img file="FDA0001043839490000021.GIF" wi="321" he="63" />的数据文件,并用邻接矩阵A表示;V为本体概念集合、E为属性关系集合、<img file="FDA0001043839490000022.GIF" wi="40" he="54" />为属性关系概念对;S32、设置农业领域本体概念间对象属性关系的评估指标,并根据评估指标设置判定集合Q;S33、根据评估指标对农业领域本体概念间对象属性关系进行评估,并将评估结果记录在判定集合Q中;S34、输出农业领域本体中的属性关系集合E、属性关系概念对<img file="FDA0001043839490000031.GIF" wi="40" he="55" />以及判定结果集合Q。
地址 230000 安徽省合肥市蜀山区长江西路130号