发明名称 |
一种语种识别的方法及装置 |
摘要 |
本发明公开了一种语种识别的方法及装置,涉及语种识别技术领域;解决了电子文档中文字语种难以识别的技术问题;该技术方案包括:步骤一,分批次读取文字;步骤二,识别读入的是一个字还是一个字符,如果是一个字符,判断接下来读取的内容,是一个字或还是一个字符,递归读取判断,直到完整识别出是一个字符还是连续的字符即一个词;步骤三,识别最终识别出来的一个字、一个词或是一个字符的语种。 |
申请公布号 |
CN106354711A |
申请公布日期 |
2017.01.25 |
申请号 |
CN201610685891.8 |
申请日期 |
2016.08.18 |
申请人 |
中译语通科技(北京)有限公司 |
发明人 |
程国艮;王建华 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京万贝专利代理事务所(特殊普通合伙) 11520 |
代理人 |
马红 |
主权项 |
一种语种识别的方法,其特征在于,包括:步骤一,分批次读取文字;步骤二,识别读入的是一个字还是一个字符,如果是一个字符,判断接下来读取的内容,是一个字或还是一个字符,递归读取判断,直到完整识别出是一个字符还是连续的字符即一个词;步骤三,识别最终识别出来的一个字、一个词或是一个字符的语种。 |
地址 |
100040 北京市石景山区中铁大厦16层 |