发明名称 | 汉语语句切分的方法及其系统 | ||
摘要 | 一种汉语语句切分的方法及系统。其先提供一汉语语句的输入,此汉语语句是由多个字符所组成的一文字字串。再根据一词语库,对此文字字串进行词语匹配。接着,判断经匹配后的分词路径是否唯一;若是,则完成该汉语语句切分的方法;若否,则选择该多个分词路径中的最短者。然后,判断该最短分词路径是否唯一;若是,则完成该汉语语句切分的方法;若否,则根据一词语词频库,计算该最短分词路径相对应的词语数量,确定该最短分词路径之中的最佳者。最后,将最佳最短分词路径输出。 | ||
申请公布号 | CN1204811A | 申请公布日期 | 1999.01.13 |
申请号 | CN98118413.8 | 申请日期 | 1998.08.13 |
申请人 | 英业达股份有限公司 | 发明人 | 张景嵩;张金玉;郑奕 |
分类号 | G06F17/20 | 主分类号 | G06F17/20 |
代理机构 | 中国专利代理(香港)有限公司 | 代理人 | 王勇;陈景峻 |
主权项 | 1.一种汉语语句切分方法,包括下列步骤:(a)输入一汉语语句,该汉语语句是由多个字符所组成的一文字字串;(b)根据一词语库,对该文字字串进行词语匹配;(c)判断经匹配后的分词路径是否唯一;若是,则完成该汉语语句切分过程;否则,(d)选择该分词路径中最短者;(e)判断该最短分词路径是否唯一,若是,则完成该汉语语句切分过程;否则(f)根据一词语词频库,选择该最短分词路径可能性最高者;以及(g)输出该可能性最高的最短分词路径。 | ||
地址 | 台湾省台北市 |