发明名称 |
一种待译文档的预处理方法 |
摘要 |
本发明公开了一种待译文档的预处理方法,包括:统计所述待译文档包括的行业类别属性的数量和所述待译文档的实义词密度;分别判断所述待译文档包括的行业类别属性的数量相对于行业类别属性设定阈值的大小、所述待译文档的实义词密度相对于实义词密度设定阈值的大小,根据所述待译文档的实义词密度相对于实义词密度设定阈值的大小匹配所述待译文档的翻译难度系数;根据这两种判断结果选择将所述待译文档按所述行业类别属性或者所述待译文档的翻译难度系数拆分。本发明通过对待译文档进行合理的预处理,将待译文档分配给译员翻译之前进行判断选择最合适的拆分方式,使待译文档能够匹配到最适合的译员,加快翻译待译文档的速度。 |
申请公布号 |
CN103714051A |
申请公布日期 |
2014.04.09 |
申请号 |
CN201310745397.2 |
申请日期 |
2013.12.30 |
申请人 |
传神联合(北京)信息技术有限公司 |
发明人 |
江潮 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京康盛知识产权代理有限公司 11331 |
代理人 |
张良 |
主权项 |
一种待译文档的预处理方法,其特征在于,包括:统计所述待译文档包括的行业类别属性的数量和所述待译文档的实义词密度;分别判断所述待译文档包括的行业类别属性的数量相对于行业类别属性设定阈值的大小、所述待译文档的实义词密度相对于实义词密度设定阈值的大小,根据所述待译文档的实义词密度相对于实义词密度设定阈值的大小匹配所述待译文档的翻译难度系数;根据这两种判断结果选择将所述待译文档按所述行业类别属性或者所述待译文档的翻译难度系数拆分。 |
地址 |
100022 北京市朝阳区东三环中路39号建外SOHO18号楼17层 |