主权项 |
一种文字转换方法,用以将符合一来源语言的一文字段落转换为一目标语言,其中该文字段落包括多个来源语言字词,其特征在于,该方法包括下面步骤:提供一字词对照表,该字词对照表记录该来源语言与该目标语言的字词对应关系;对该文字段落进行一断词处理而得到多个断词结果;比对该些断词结果与该字词对照表,以判断各该些来源语言字词属于一第一种类和一第二种类二者其中之一,其中属于该第一种类的来源语言字词仅对应单一目标语言字词,而属于该第二种类的来源语言字词对应复数个候选目标语言字词;依照该字词对照表所记录的字词对应关系,在该文字段落中将属于该第一种类的来源语言字词转换成对应的该目标语言字词;将属于该第二种类的来源语言字词,利用一语言模型分别计算各该些候选目标语言字词及其与该文字段落至少一前后字词所组成的复数个关联字词的共同出现关联性;从该些候选目标语言字词中,选择复数个较高共同出现关联性的候选目标语言字词,其中该些较高共同出现关联性的候选目标语言字词所对应的共同出现关联性大于一第一门槛值;以及利用支持该目标语言与一参考语言的一字典,分别将各该些较高共同出现关联性的候选目标语言字词的每一字,翻译为一对应参考语言字,并从该字典及各该对应参考语言字,判断各该些较高共同出现关联性的候选目标语言字词的各该对应参考语言字之间的关联性,以选择对应参考语言字的关联性最高的候选目标语言字词来作为该目标语言字词。 |