发明名称 一种基于上下文窗口的词语语义相似度求解方法
摘要 一种基于上下文窗口的词语语义相似度求解方法,在统计方法模块中输入待比较词,确定待比较词的上下文范围,找出范围内权重最大的两句子,计算两句子之间的相似度,最后通过句子的相似度求解出待比较词的相似度。本发明对上下文语境有效范围的确定提供了非常有价值的定量化的描述,克服了前人主观描述的不足;上下文对关键词的描述能力相对位置由近及远逐渐递减,符合人们一般认识;权重贡献值线性与信噪比要更好,易于后续计算简便;权重贡献值归一化曲线准确率更高;考虑了关键词左右窗口中的句子成分关系对上下文有效窗口界定的影响;应用基于上下文窗口技术求解词语语义相似度得以实现,计算精度、准确度都更高。
申请公布号 CN106610942A 申请公布日期 2017.05.03
申请号 CN201610833572.7 申请日期 2016.09.20
申请人 四川用联信息技术有限公司 发明人 金平艳
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 代理人
主权项 一种基于上下文窗口的词语语义相似度求解方法,本发明涉及语义网络技术领域,具体涉及一种基于上下文窗口的词语语义相似度求解方法,其特征是,包括如下步骤:步骤1:初始化统计方法模块步骤2:将待比较词<img file="dest_path_image001.GIF" wi="94" he="22" />输入初始化统计方法模块中步骤3:分别确定待比较词<img file="159017dest_path_image001.GIF" wi="92" he="23" />的上下文词语范围“窗口”步骤4:根据步骤3得到的上下文词范围,分别找到待比较词<img file="42309dest_path_image002.GIF" wi="89" he="20" />所对应的权重最大的两句子<img file="872993dest_path_image003.GIF" wi="207" he="25" />步骤5:计算这两句子<img file="dest_path_image004.GIF" wi="205" he="24" />的相似度<img file="53045dest_path_image005.GIF" wi="116" he="38" />步骤6:由步骤5得到的两句子相似度<img file="829066dest_path_image006.GIF" wi="121" he="32" />计算待比较词<img file="dest_path_image007.GIF" wi="62" he="25" />的相似度<img file="198605dest_path_image008.GIF" wi="101" he="27" />。
地址 610054 四川省成都市成华区电子信息产业大厦1101室