发明名称 一种挖掘领域术语间上下位关系的方法及装置
摘要 本发明提供了一种挖掘领域术语间上下位关系的方法及装置,该方法包括:依据多个第一预定领域术语,采集词库页面上的第一领域术语所在词条解释语句,第一领域术语是与第一预定领域术语语义相关的词语;利用预先采用条件随机场CRF工具生成的上下位关系模型文件,获取第一领域术语与词条解释语句中包括的词语之间的上下位关系。本发明的方案,利用词库页面中的领域术语的词条解释语句,使用CRF机器学技术进行训练和学,最终建立模型文件,并利用该模型文件获取领域术语与词条解释语句中包括的词语的上下位关系,提高了上下位关系获取的准确率。
申请公布号 CN106569993A 申请公布日期 2017.04.19
申请号 CN201510652163.2 申请日期 2015.10.10
申请人 中国移动通信集团公司 发明人 黄毅;邓路;夏爽
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京银龙知识产权代理有限公司 11243 代理人 许静;安利霞
主权项 一种挖掘领域术语间上下位关系的方法,其特征在于,包括:依据多个第一预定领域术语,采集词库页面上的第一领域术语所在词条解释语句,所述第一领域术语是与所述第一预定领域术语语义相关的词语;利用预先采用条件随机场CRF工具生成的上下位关系模型文件,获取所述第一领域术语与所述词条解释语句中包括的词语之间的上下位关系。
地址 100032 北京市西城区金融大街29号