发明名称 一种语种识别的方法及装置
摘要 本发明公开了一种语种识别的方法及装置,涉及语种识别技术领域;解决了电子文档中文字语种难以识别的技术问题;该技术方案包括:步骤一,分批次读取文字;步骤二,识别读入的是一个字还是一个字符,如果是一个字符,判断接下来读取的内容,是一个字或还是一个字符,递归读取判断,直到完整识别出是一个字符还是连续的字符即一个词;步骤三,识别最终识别出来的一个字、一个词或是一个字符的语种。
申请公布号 CN106354711A 申请公布日期 2017.01.25
申请号 CN201610685891.8 申请日期 2016.08.18
申请人 中译语通科技(北京)有限公司 发明人 程国艮;王建华
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京万贝专利代理事务所(特殊普通合伙) 11520 代理人 马红
主权项 一种语种识别的方法,其特征在于,包括:步骤一,分批次读取文字;步骤二,识别读入的是一个字还是一个字符,如果是一个字符,判断接下来读取的内容,是一个字或还是一个字符,递归读取判断,直到完整识别出是一个字符还是连续的字符即一个词;步骤三,识别最终识别出来的一个字、一个词或是一个字符的语种。
地址 100040 北京市石景山区中铁大厦16层