发明名称 文字转换方法与系统
摘要 本发明提供一种文字转换方法与系统。此系统包括储存单元、分类单元、和转换单元,储存单元储存来源语言与目标语言的字词对应关系的字词对照表;分类单元对符合来源语言的文字段落做断词处理得到多个断词结果,比对断词结果与字词对照表以判断文字段落中各来源语言字词属于第一或第二种类,第一种类的来源语言字词对应一目标语言字词,第二种类的来源语言字词对应多候选目标语言字词;转换单元依照字词对照表将第一种类的来源语言字词转换成目标语言字词,对第二种类的来源语言字词则根据对应的各候选目标语言字词及其与前后字词所组成的数个关联字词的共同出现关联性,从候选目标语言字词择一作为目标语言字词。
申请公布号 CN102486770B 申请公布日期 2014.09.17
申请号 CN201010576958.7 申请日期 2010.12.02
申请人 财团法人资讯工业策进会 发明人 杨秉哲;吴世弘;谷圳;林倩慧;卢家庆;谢文泰
分类号 G06F17/28(2006.01)I 主分类号 G06F17/28(2006.01)I
代理机构 北京同立钧成知识产权代理有限公司 11205 代理人 刘芳
主权项 一种文字转换方法,用以将符合一来源语言的一文字段落转换为一目标语言,其中该文字段落包括多个来源语言字词,其特征在于,该方法包括下面步骤:提供一字词对照表,该字词对照表记录该来源语言与该目标语言的字词对应关系;对该文字段落进行一断词处理而得到多个断词结果;比对该些断词结果与该字词对照表,以判断各该些来源语言字词属于一第一种类和一第二种类二者其中之一,其中属于该第一种类的来源语言字词仅对应单一目标语言字词,而属于该第二种类的来源语言字词对应复数个候选目标语言字词;依照该字词对照表所记录的字词对应关系,在该文字段落中将属于该第一种类的来源语言字词转换成对应的该目标语言字词;将属于该第二种类的来源语言字词,利用一语言模型分别计算各该些候选目标语言字词及其与该文字段落至少一前后字词所组成的复数个关联字词的共同出现关联性;从该些候选目标语言字词中,选择复数个较高共同出现关联性的候选目标语言字词,其中该些较高共同出现关联性的候选目标语言字词所对应的共同出现关联性大于一第一门槛值;以及利用支持该目标语言与一参考语言的一字典,分别将各该些较高共同出现关联性的候选目标语言字词的每一字,翻译为一对应参考语言字,并从该字典及各该对应参考语言字,判断各该些较高共同出现关联性的候选目标语言字词的各该对应参考语言字之间的关联性,以选择对应参考语言字的关联性最高的候选目标语言字词来作为该目标语言字词。
地址 中国台湾台北市和平东路二段106号11楼