发明名称 一种构建领域本体的方法
摘要 本发明提供一种构建领域本体的方法,包括步骤:1)选取种子领域术语,建立领域本体,并设定种子领域术语的信息具化度;2)根据种子领域术语抽取领域术语,并根据种子领域术语的信息具化度计算领域术语的信息具化度;3)将领域术语按照其信息具化度排列,计算当前领域术语和领域本体中任一领域术语的相似度;4)根据信息具化度和相似度选择当前领域术语的可能的关联术语;5)在语料库中验证当前领域术语与其可能的关联术语之间可能存在的关系模式的可信度,如果可信,则将当前领域术语加入领域本体,否则,删除当前领域术语;6)重复步骤3)、4)和5),直到所有领域术语均已经加入领域本体或被删除。由此,更加准确有效地建立领域本体。
申请公布号 CN102117281B 申请公布日期 2013.05.08
申请号 CN200910243990.0 申请日期 2009.12.30
申请人 北京亿维讯科技有限公司 发明人 赵琦;高建忠;黄毓瑜;焦希泉
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京泛华伟业知识产权代理有限公司 11280 代理人 王勇
主权项 一种用于在基于语义的信息检索中构建领域本体的方法,包括下列步骤:1)选取种子领域术语,建立领域本体,并设定所述种子领域术语的信息具化度,其中,所述信息具化度反映了所述种子领域术语所代表的概念在领域中包含信息量的多少;2)根据所述种子领域术语抽取领域术语,并根据所述种子领域术语的信息具化度计算所述领域术语的信息具化度;3)将所述领域术语按照其信息具化度从低到高的顺序建立树,构成待插入的新领域术语队列,并选择其中信息具化度最低的领域术语作为当前领域术语,计算所述当前领域术语和领域本体中每个领域术语的相似度;4)根据所述信息具化度和所述相似度选择所述当前领域术语的可能的关联术语;5)在语料库中验证所述当前领域术语与其可能的关联术语之间可能存在的关系模式的可信度,如果可信,则将所述当前领域术语加入所述领域本体,否则,删除所述当前领域术语;6)重复所述步骤3)、4)和5),直到所有领域术语均已经加入所述领域本体或被删除;其中,所述步骤4)进一步包括下列步骤:(1)在领域本体中选择与所述当前领域术语相似度大于阈值的领域术语;(2)从所选择的领域术语中选择信息具化度小于/大于所述当前领域术语的领域术语作为候选上/下位术语;(3)从所述候选上/下位术语中选择信息具化度最高/最低的领域术语作为所述当前领域术语的可能的上/下位术语;并且其中,所述验证进一步包括下列步骤:根据所述当前领域术语与其可能的同义/上下位术语构建验证术语对;将所述验证术语对表示为符合可能的同义/上下位关系模式的表达式;在领域语料库中选取存在所述验证术语对的句子作为模式上下文,判断所述模式上下文中所述当前领域术语与其可能的同义/上下位术语之间的关系的可信度。
地址 100026 北京市朝阳区西大望路甲1号温特莱中心A座5A层