发明名称 |
用于翻译教学系统的术语萃取方法 |
摘要 |
本发明公开了用于翻译教学系统的术语萃取方法,包括如下步骤:打开萃取翻译文件;人为设置翻译语料最大长度、最小长度和翻译语料出现的最小频率;翻译文件为中文或者是日语则运用盘古分词萃取数据,翻译文件为英语、俄语或则德语时则运用穷举法萃取数据;把萃取数据与设置的翻译语料最大长度、最小长度和翻译语料出现的最小频率进行比较,萃取数据的长度在翻译语料最大长度和最小长度之间且出现次数达到最小频率的就将该术语添加到术语库中;在术语库中显示添加的萃取数据。本方案通过上述原理,利用该种方法术语库能够根据不同客户的需要选择性的不断充实词汇量,克服了翻译库词汇无法完全收纳各个领域词汇的缺陷,专业性更强,灵活性更高。 |
申请公布号 |
CN105335359A |
申请公布日期 |
2016.02.17 |
申请号 |
CN201510792918.9 |
申请日期 |
2015.11.18 |
申请人 |
成都优译信息技术有限公司 |
发明人 |
张马成;王兴强;屈耕;熊易 |
分类号 |
G06F17/28(2006.01)I |
主分类号 |
G06F17/28(2006.01)I |
代理机构 |
成都行之专利代理事务所(普通合伙) 51220 |
代理人 |
谢敏 |
主权项 |
用于翻译教学系统的术语萃取方法,其特征在于,包括如下步骤:A)打开萃取翻译文件;B)人为设置翻译语料最大长度、最小长度和翻译语料出现的最小频率;C)翻译文件为中文或者是日语则运用盘古分词萃取数据,翻译文件为英语、俄语或则德语时则运用穷举法萃取数据;D)把萃取数据与设置的翻译语料最大长度、最小长度和翻译语料出现的最小频率进行比较,萃取数据的长度在翻译语料最大长度和最小长度之间且出现次数达到最小频率的就将该术语添加到术语库中,术语库中已存在的则不用添加;E)在术语库中显示添加的萃取数据。 |
地址 |
610000 四川省成都市高新区紫荆西路107号1幢1楼6号 |