发明名称 关联词典构建方法和装置
摘要 本发明公开了一种关联词典构建方法和装置。所述关联词典构建方法包括:从网络词典网页上获取源术语集合和目标术语集合;根据源术语与目标术语在所述网络词典网页上共同出现的情况构建初始直接关联矩阵;对所述源术语集合和目标术语集合进行扩充,使得扩充后的关联矩阵为方阵;对扩展后的关联矩阵进行幂运算,得到不同幂次的间接关联矩阵;对不同幂次的间接关联矩阵进行加权平均,得到表示不同术语之间的关联度的关联矩阵。本发明公开的关联词典构建方法和装置完成了对关联术语之间的关联度的计算,增加了关联词典中的数据量。
申请公布号 CN103605712B 申请公布日期 2017.02.08
申请号 CN201310565554.1 申请日期 2013.11.13
申请人 北京锐安科技有限公司 发明人 田晋坤
分类号 G06F17/30(2006.01)I;G06F17/28(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京品源专利代理有限公司 11332 代理人 胡彬
主权项 一种关联词典构建方法,其特征在于,包括:从网络词典网页上获取源术语集合和目标术语集合;根据源术语与目标术语在所述网络词典网页上共同出现的情况构建初始直接关联矩阵;使用内容分类器对所述源术语集合和所述目标术语集合中的术语进行分类,确定获取用于扩充的术语的网络词典网页的领域;使用从网络词典网页上获取的术语对所述源术语集合和所述目标术语集合进行扩充,使得扩充后的源术语集合和目标术语集合中的术语数目相同;根据扩充后的源术语集合和目标术语集合构建扩充后的直接关联矩阵,其中,所述扩充后的直接关联矩阵是方阵;将所述扩充后的直接关联矩阵与所述扩充后的直接关联矩阵的转置矩阵求和,得到扩充后的关联矩阵;对扩充后的关联矩阵进行幂运算,得到不同幂次的间接关联矩阵;对不同幂次的间接关联矩阵进行加权平均,得到表示不同术语之间的关联度的关联矩阵。
地址 100044 北京市海淀区中关村南大街乙56方圆大厦9层