发明名称 汉语语句切分的方法及其系统
摘要 一种汉语语句切分的方法及系统。其先提供一汉语语句的输入,此汉语语句是由多个字符所组成的一文字字串。再根据一词语库,对此文字字串进行词语匹配。接着,判断经匹配后的分词路径是否唯一;若是,则完成该汉语语句切分的方法;若否,则选择该多个分词路径中的最短者。然后,判断该最短分词路径是否唯一;若是,则完成该汉语语句切分的方法;若否,则根据一词语词频库,计算该最短分词路径相对应的词语数量,确定该最短分词路径之中的最佳者。最后,将最佳最短分词路径输出。
申请公布号 CN1204811A 申请公布日期 1999.01.13
申请号 CN98118413.8 申请日期 1998.08.13
申请人 英业达股份有限公司 发明人 张景嵩;张金玉;郑奕
分类号 G06F17/20 主分类号 G06F17/20
代理机构 中国专利代理(香港)有限公司 代理人 王勇;陈景峻
主权项 1.一种汉语语句切分方法,包括下列步骤:(a)输入一汉语语句,该汉语语句是由多个字符所组成的一文字字串;(b)根据一词语库,对该文字字串进行词语匹配;(c)判断经匹配后的分词路径是否唯一;若是,则完成该汉语语句切分过程;否则,(d)选择该分词路径中最短者;(e)判断该最短分词路径是否唯一,若是,则完成该汉语语句切分过程;否则(f)根据一词语词频库,选择该最短分词路径可能性最高者;以及(g)输出该可能性最高的最短分词路径。
地址 台湾省台北市
您可能感兴趣的专利