发明名称 语句纠错方法及其系统
摘要 本发明尤其涉及一种语句纠错方法及其系统。所述方法包括:(a)获取用户输入的第一语句信息,并存储在一存储器中;(b)判断所输入的第一语句信息在第一映射表内是否有匹配结果,若无,则执行步骤(c),若有,执行步骤(f);(c)根据相似度最高的准则,对第一语句信息进行纠错,生成第二语句信息;(d)在用户界面上显示第二语句信息;(e)经用户确认后,将第二语句信息在一功能库内进行查找,若有匹配结果,则执行步骤(f),若无匹配结果,则执行结束;(f)经用户确认后,在用户界面上显示响应结果。本发明可以准确识别用户的口语化语句,实现对语句信息自动纠错;并对数据库进行动态添加信息,以使数据库的内容信息具有实效性、流行性。
申请公布号 CN102831177B 申请公布日期 2015.09.02
申请号 CN201210268302.8 申请日期 2012.07.31
申请人 聚熵信息技术(上海)有限公司 发明人 舒畅;唐璐;穆影英;胡金荣;王丽君;黄莎莎;张林;刘文;陈昱洁;沈玉龙;高迎;刘畅;廖益玄;孙彦玲
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海翼胜专利商标事务所(普通合伙) 31218 代理人 孙佳胤
主权项 一种语句纠错方法,其特征在于,包括以下步骤:(a)获取用户输入的第一语句信息,并存储在一存储器中;(b)判断所输入的第一语句信息在第一映射表内是否有匹配结果,若无,则执行步骤(c),若有,执行步骤(f);(c)根据相似度最高的准则,对第一语句信息进行纠错,并生成第二语句信息;其中步骤(c)进一步包括:(c1)将存储器中的第一语句信息在第一数据库中进行查找,找到与第一语句信息相似的语句信息;(c2)根据找到的相似的语句信息,通过贪婪算法和ROC曲线分析算法以及改进型的距离编辑算法来计算纠正第一语句信息的每一个词所需的成本和所述词对应的权重,得到纠正后的语句信息的总成本,其中改进型的距离编辑算法包含权重常数,所述权重常数是通过所述贪婪算法和ROC曲线分析算法而获得的,通过改进型的距离编辑算法而获得的编辑总成本为T=A*个数*a+D*个数*d+R*个数*r,式中的A表示添加操作的编辑成本,a表示添加操作的权重,D表示删除操作的编辑成本,d表示删除操作的权重,R表示替换操作的编辑成本,r表示替换操作的权重;(c3)找出总成本最小的语句信息,并将所述总成本最小的语句信息设置为第二语句信息;(c4)将第一语句信息与第二语句信息进行彼此映射;(d)在用户界面上显示第二语句信息;(e)经用户确认后,将第二语句信息在功能库内进行查找,若有匹配结果,则执行步骤(f),若无匹配结果,则执行结束;(f)经用户确认后,在用户界面上显示响应结果。
地址 201210 上海市浦东新区张江高科技园区郭守敬路498号14幢22301-1481座