发明名称 一种文档文字的处理方法
摘要 本发明公开了一种文档文字的处理方法,包括以下步骤:(1)、提取待翻译文档中的文字信息,并统一格式;(2)、将文档自动拆分成最小单位的待译文字数据集合,去掉待译文字数据集合中的非译文字和重复的待译文字数据;(3)、建立译前处理文档,先将待译文字数据集合中的待译文字数据复制到原文列中,再将涉及到的专有术语的原文和译文写入对应的专有术语列,得到匹配有专有术语的译前处理文档;(4)、译员对译前处理文档中原文列对应的待译文字数据翻译,得到译后处理文档;(5)、使用替换功能将译文替换成原文,得到译文。本发明能够处理文档前预先去除文档中重复的单词、词组或单句,达到简化译员翻译量、提高翻译效率的目的。
申请公布号 CN105808528A 申请公布日期 2016.07.27
申请号 CN201610122855.0 申请日期 2016.03.04
申请人 张广睿 发明人 张广睿
分类号 G06F17/28(2006.01)I;G06F17/25(2006.01)I 主分类号 G06F17/28(2006.01)I
代理机构 成都天嘉专利事务所(普通合伙) 51211 代理人 邓小兵
主权项 一种文档文字的处理方法,其特征在于包括以下步骤:(1)、提取待翻译文档中的文字信息,并统一文字信息的格式,得到格式统一的文档;(2)、对格式统一的文档进行拆分,将其拆分成以单词、词组、单句中的任意一种或几种为最小单位的待译文字数据集合,去掉非译文字后再去掉待译文字数据集合中重复的待译文字数据,然后将剩下的每一个待译文字数据依次与笔译记忆库中的内容进行比对,而后删除待译文字数据集合中与笔译记忆库中相重复的内容;其中,所述的笔译记忆库中设置有原文列一和译文列一,原文列一中存储有已译文档的原文,译文列一中对应存储有已译文档的译文;(3)、建立一个译前处理文档,并在该译前处理文档中设置原文列、译文列和专有术语列,先将经步骤(2)处理后的待译文字数据集合中的每一个待译文字数据按顺序复制到原文列中,再根据预先制作的专有术语表,将每一个待译文字数据中涉及到的专有术语的原文和译文写入对应的专有术语列,最后得到匹配有专有术语的译前处理文档;(4)、由译员对译前处理文档中原文列对应的所有待译文字数据进行翻译,并将译文填写至对应的译文列,得到译后处理文档;(5)、先将待翻译文档中与译后处理文档中的原文列相同的待译文字数据替换成译文,再使用原文列一中原文所对应的译文列一中的译文替换待翻译文档中出现在原文列一中的原文,最后得到与待翻译文档相同格式的译文。
地址 四川省成都市青羊区东马棚街1号3单元8号