发明名称 一种变形词证认系统及证认方法
摘要 本发明公开了一种变形词证认系统及证认方法。在该变形词证认系统中,由原形词提供模块提供原形词,变形词生成模块在变形词库中查找原形词的变形词,将变形词提供给变形词检测模块,证认模块通过概念库的支持,检测待检测数据的语义背景与原形词概念集合的相似程度,变形词判别模块通过相似度值与预先设定的判别阈值比较,得出所检测的变形词是否为原形词的变形词的结论。本发明能够对常见词的各种变形词进行机器自动检测。在变形词证认的过程中,通过检测与证认的有机结合,对变形词的信度进行了有语义依据的评估,从而使变形词的判别结论有效可信。
申请公布号 CN103049434B 申请公布日期 2016.08.17
申请号 CN201210537803.1 申请日期 2012.12.12
申请人 北京海量融通软件技术有限公司 发明人 张作职;宋传宝;王树强
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京汲智翼成知识产权代理事务所(普通合伙) 11381 代理人 陈曦;董烨飞
主权项 一种变形词证认系统,所述变形词包括但不限于汉语拼音、同音词、拼音首字母词、易混词、拆字变形词,其特征在于:所述变形词证认系统包括数据提供模块、原形词提供模块、变形词生成模块、变形词库、变形词检测模块、证认模块、概念库及变形词判别模块;其中,所述数据提供模块分别与所述变形词检测模块和所述证认模块进行连接,以提供待检测数据;所述原形词提供模块与所述变形词生成模块连接,所述变形词生成模块分别连接所述变形词库和所述变形词检测模块,所述证认模块分别与所述变形词检测模块、所述变形词判别模块和所述概念库进行连接;所述原形词提供模块提供原形词,所述变形词生成模块在所述变形词库中查找所述原形词的变形词,将所述变形词提供给所述变形词检测模块,所述证认模块通过所述概念库的支持,检测所述待检测数据的语义背景与原形词概念集合的相似度值,所述变形词判别模块通过所述相似度值与预先设定的判别阈值比较,得出所检测的变形词是否为所述原形词的变形词的结论。
地址 100080 北京市海淀区西五道口紫金数码园3号楼11层1108室