发明名称 | 词库更新装置、数据整合装置和方法以及电子设备 | ||
摘要 | 本公开提供一种词库更新装置和方法、数据整合装置和方法以及电子设备。该词库更新装置包括:语句表达单元,用于收集来自不同数据源的语句并对收集到的每个语句进行处理,以利用多元组来表达每个语句;候选词集合形成单元,用于基于多元组中的分量并且根据预定词库,形成用于更新该预定词库的候选词集合;候选词判定单元,用于针对候选词集合中的每个候选词,根据包含该候选词的至少一个多元组中除该候选词之外的一个或多个其它分量,判定该候选词是否与预定词库中的词是同一类型;词库更新单元,用于在候选词被判定为与该预定词库中的词是同一类型时,使用该候选词更新词库。本公开能够提高对预定词库更新的准确度率,从而提高数据处理的效率。 | ||
申请公布号 | CN103678371A | 申请公布日期 | 2014.03.26 |
申请号 | CN201210343121.7 | 申请日期 | 2012.09.14 |
申请人 | 富士通株式会社 | 发明人 | 周恩策;张军;邹纲;皮冰锋;松尾昭彦 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京集佳知识产权代理有限公司 11227 | 代理人 | 王萍;陈炜 |
主权项 | 一种用于自动更新预定词库的词库更新装置,包括:语句表达单元,用于收集来自不同数据源的语句并对收集到的每个语句进行处理,以利用多元组来表达每个语句;候选词集合形成单元,用于基于多元组中的分量并且根据预定词库,形成用于更新该预定词库的候选词集合;候选词判定单元,用于针对候选词集合中的每个候选词,根据包含该候选词的至少一个多元组中除该候选词之外的一个或多个其它分量,判定该候选词是否与预定词库中的词是同一类型;以及词库更新单元,用于在候选词被判定为与该预定词库中的词是同一类型时,使用该候选词更新该预定词库。 | ||
地址 | 日本神奈川县 |