发明名称 |
基于迭代的同义词挖掘方法及装置 |
摘要 |
本发明涉及一种基于迭代的同义词挖掘方法及装置,其中,所述方法包括:根据用户输入的用于获取答案的问题语料获取同义语对;根据所述同义语对中词语的一一对应关系获取第一候选同义词组;根据所述第一候选同义词组从更多所述同义语对中迭代抽取第二候选同义词组;根据所述第一候选同义词组和所述第二候选同义词组更新同义词词典中的对齐结果。本发明根据同义语对中词语的一一对应关系获取第一候选同义词组,以根据第一候选同义词组从更多同义语对中迭代抽取第二候选同义词组,进而更新同义词词典中的对齐结果,不需要基于模板、VSM或语义向量对同义词语进行挖掘,可以有效增加同义词的挖掘数量,进而提升语义匹配的准确率和召回率。 |
申请公布号 |
CN106202038A |
申请公布日期 |
2016.12.07 |
申请号 |
CN201610498013.5 |
申请日期 |
2016.06.29 |
申请人 |
北京智能管家科技有限公司 |
发明人 |
郭祥;郭瑞;雷宇 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
李相雨 |
主权项 |
一种基于迭代的同义词挖掘方法,其特征在于,包括:根据用户输入的用于获取答案的问题语料获取同义语对;其中,所述同义语对为具有相同语义的语句所构成的语句组合;根据所述同义语对中词语的一一对应关系获取第一候选同义词组;根据所述第一候选同义词组从更多所述同义语对中迭代抽取第二候选同义词组;根据所述第一候选同义词组和所述第二候选同义词组更新同义词词典中的对齐结果。 |
地址 |
101500 北京市密云县经济开发区西统路8号西田各庄镇政府办公楼508室-598 |