发明名称 |
基于改进最大匹配算法的交叉型伪歧义识别方法 |
摘要 |
本发明公开了一种基于改进最大匹配算法的交叉型伪歧义识别方法。包括交叉型歧义检测、交叉型歧义真伪性的判断和伪歧义消解三部分核心功能。交叉型歧义检测算法不仅可以保证交叉型歧义的100%检测,而且所需开销小、执行速度快,算法复杂度低,仅为O(N),同时,还不需要借助任何歧义词表或相关统计数据,简单有效;伪歧义消解方法不仅对伪歧义具有较高的识别能力,还可以辨别交叉型歧义的真伪性,避免对真歧义的误识别,而且所需数据简单,容易获得,还可以辨别交叉型歧义的真伪性,避免对真歧义的误识别。 |
申请公布号 |
CN102622339A |
申请公布日期 |
2012.08.01 |
申请号 |
CN201210050154.2 |
申请日期 |
2012.02.24 |
申请人 |
安徽博约信息科技有限责任公司 |
发明人 |
周俊;郑中华;张炜 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于改进最大匹配算法的交叉型伪歧义识别方法,其特征在于,包括步骤如下:(1)输入汉语语句,通过改进最大匹配算法检测语句中存在的交叉歧义,并放入交叉型歧义集合,若集合为空,表示输入语句中无交叉型歧义,不进行任何处理,直接返回;否则,遍历集合中的所有歧义,进入第(2)步骤处理;(2)采用基于深度优先搜索的递归方法,对歧义进行路径全切分,得到所有路径的集合,遍历路径集合,对每条路径做第(3)步骤处理;(3)根据给定的选择可能性计算数学模型,对歧义切分路径进行建模,计算并记录相应路径的选择可能性数值,计算歧义的路径集合中最大的两个选择可能性数值的差值,若在某一给定阈值内,则认定该歧义为真歧义,停止消解,并递交给真歧义消解模块处理,否则,判断该歧义为伪歧义,并将选择可能性数值最大的路径作为该歧义的消解结果。 |
地址 |
230000 安徽省合肥市高新区黄山路602号大学科技园C2008室 |