发明名称 一种全自动汉语分词系统
摘要 一种全自动汉语分词系统,包括(1)汉语源语输入装置,(2)自动断句装置,(3)将句子字符转变成图结点的结点结构生成装置,(4)确定词长的边求解装置,在边求解的同时,进行歧义判断,并做相应的歧义标识,(5)推理消歧装置,(6)结果输出装置。该系统能高效、灵活、准确地将句子切分成词序列,为准确地翻译打下良好的基础。
申请公布号 CN1107276C 申请公布日期 2003.04.30
申请号 CN96100831.8 申请日期 1996.01.30
申请人 华建机器翻译有限公司 发明人 陈肇雄;黄河燕
分类号 G06F17/27 主分类号 G06F17/27
代理机构 北京北新智诚专利代理有限公司 代理人 张卫华
主权项 1、一种全自动汉语分词系统,其特征在于包括:(1)汉语源语输入装置;(2)根据汉语句末的标点符号自动断句的装置;(3)将句子字符转变成图结点的结点结构生成装置;(4)确定词长的边求解装置,该装置在边求解的同时,进行歧义判断,并做相应的歧义标识;(5)根据歧义标识,运用歧义规则推理消除歧义的推理消歧装置,其含有歧义规则库和叠词规则装置,消歧规则的形式为:前驱边属性集当前边属性集→上下文条件测试|动作函数名;(6)结果输出装置,该装置通过遍历词切分路径得到用于输出的词切分结构,汉语源语输入装置启动自动断句装置工作,结点结构生成装置将自动断句的装置所断的句子中的字符转变成图结点,形成待切的结点序列送边求解装置,边求解装置对结点序列求边,推理消歧装置对求得的边进行推理,得到切分后的句子,送入结果输出装置。
地址 100083北京市海淀区学院路30号科群大厦西楼华建集团公司李华