发明名称 基于改进最大匹配算法的交叉型伪歧义识别方法
摘要 本发明公开了一种基于改进最大匹配算法的交叉型伪歧义识别方法。包括交叉型歧义检测、交叉型歧义真伪性的判断和伪歧义消解三部分核心功能。交叉型歧义检测算法不仅可以保证交叉型歧义的100%检测,而且所需开销小、执行速度快,算法复杂度低,仅为O(N),同时,还不需要借助任何歧义词表或相关统计数据,简单有效;伪歧义消解方法不仅对伪歧义具有较高的识别能力,还可以辨别交叉型歧义的真伪性,避免对真歧义的误识别,而且所需数据简单,容易获得,还可以辨别交叉型歧义的真伪性,避免对真歧义的误识别。
申请公布号 CN102622339A 申请公布日期 2012.08.01
申请号 CN201210050154.2 申请日期 2012.02.24
申请人 安徽博约信息科技有限责任公司 发明人 周俊;郑中华;张炜
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 代理人
主权项 一种基于改进最大匹配算法的交叉型伪歧义识别方法,其特征在于,包括步骤如下:(1)输入汉语语句,通过改进最大匹配算法检测语句中存在的交叉歧义,并放入交叉型歧义集合,若集合为空,表示输入语句中无交叉型歧义,不进行任何处理,直接返回;否则,遍历集合中的所有歧义,进入第(2)步骤处理;(2)采用基于深度优先搜索的递归方法,对歧义进行路径全切分,得到所有路径的集合,遍历路径集合,对每条路径做第(3)步骤处理;(3)根据给定的选择可能性计算数学模型,对歧义切分路径进行建模,计算并记录相应路径的选择可能性数值,计算歧义的路径集合中最大的两个选择可能性数值的差值,若在某一给定阈值内,则认定该歧义为真歧义,停止消解,并递交给真歧义消解模块处理,否则,判断该歧义为伪歧义,并将选择可能性数值最大的路径作为该歧义的消解结果。
地址 230000 安徽省合肥市高新区黄山路602号大学科技园C2008室