发明名称 |
一种术语快速标注方法 |
摘要 |
本发明公开了一种术语快速标注方法,包括:建立前缀表,并将所述前缀表加载到内存中,读取文字,所述文字包括至少一个子串;提取所述文字中的一个子串,将所述子串在所述前缀表中进行术语的检索;将当前查找到的子串作为术语记录下来。本发明在进行术语标注时,借助预先建立的缓存在内存中的术语前缀表中作出预判断,从而大大减少了对术语库的检索次数。 |
申请公布号 |
CN101986308B |
申请公布日期 |
2013.07.31 |
申请号 |
CN201010545766.X |
申请日期 |
2010.11.16 |
申请人 |
传神联合(北京)信息技术有限公司 |
发明人 |
江潮 |
分类号 |
G06F17/30(2006.01)I;G06F17/28(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京康盛知识产权代理有限公司 11331 |
代理人 |
张良 |
主权项 |
一种术语快速标注方法,包括:建立前缀表,所述前缀表的结构包括术语的前缀、术语的最小长度和术语的最大长度;并将所述前缀表加载到内存中,读取文字,所述文字包括至少一个子串;如果所述子串的长度在术语的最小长度和最大长度之间,则检索术语库;提取所述文字的一个子串,将所述子串在所述前缀表中进行术语的检索,将当前查找到的子串作为术语记录下来;建立术语表,将所述术语表加载到内存中,将记录后的术语在所述术语表中检索,将所述术语统一到所述术语库中,进行检索获得所述术语的原文、译文以及附加信息。 |
地址 |
100085 北京市海淀区青云里满庭芳园小区9号楼青云当代大厦十七层1707A1房间 |