发明名称 结合词性的英语近形词干扰项生成方法
摘要 本发明涉及一种结合词性的英语近形词干扰项生成方法,包括以下步骤:从词库中选取源单词作为源单词字符串,其他单词作为目标单词字符串,遍历单词库中的所有单词,根据归一化融合相似度算法求出源单词字符串和目标字符串的相似度;把相似度阈值控制在0.6~1.0之间,满足上述阈值范围的单词为候选词;对上步中输出的候选词和源单词进行结合词性的相似度计算,把相似度a阈值控制在0.6~1.0之间,即得到源单词的干扰项;结束一次处理过程。本发明引入了LCS算法进行归一化融合,改变了单纯依赖一种相似度算法计算英语单词相似度的盲目性,提高了生成英语近形词干扰项的可靠性和准确性,解决了相同词义但是不同词性重复出现的问题。
申请公布号 CN103902527A 申请公布日期 2014.07.02
申请号 CN201410126836.6 申请日期 2014.03.31
申请人 大连大学 发明人 盖荣丽;汪祖民;孙晓辉
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 沈阳优普达知识产权代理事务所(特殊普通合伙) 21234 代理人 张志伟
主权项 一种结合词性的英语近形词干扰项生成方法,其特征在于包括以下步骤:从词库中选取源单词作为源单词字符串str1,其他单词作为目标单词字符串str2,遍历单词库中的所有单词,根据归一化融合相似度算法求出源单词字符串str1和目标字符串str2的相似度a(str1,str2);把相似度阈值控制在0.6~1.0之间,即相似度0.6≤a(str1,str2)<1.0,满足上述阈值范围的单词输出,作为候选词;对上步中输出的候选词和源单词进行结合词性的相似度计算,把相似度a阈值控制在0.6~1.0之间,即相似度0.6≤a<1.0,输出单词,即得到源单词的干扰项;结束一次处理过程。
地址 116622 辽宁省大连市经济技术开发区学府大街10号大连大学