发明名称 信息处理方法、装置及电子设备
摘要 本发明实施例公开了一种信息处理方法、装置及电子设备,从与待识别为电子文本的待识别信息相关联的电子文本文字中提取关键词,并将获取的关键词,关键词的同义词,以及与所提取的关键词相关联的词作为核心的训练数据库对识别出来的数据进行校正,而所获取的电子文本内容是经过人工校正后的文本,其识别正确率为100%,且,由于所获取的电子文本内容是与待识别为电子文本的待识别信息相关联,因此,通过本申请实施例提供的信息处理方法对通过光学字符识别出来的文字进行校正,提高了光学字符识别的正确率。
申请公布号 CN105404903A 申请公布日期 2016.03.16
申请号 CN201410468559.7 申请日期 2014.09.15
申请人 联想(北京)有限公司 发明人 贾沛;孙林;薛苏葵;李众庆
分类号 G06K9/68(2006.01)I;G06F17/30(2006.01)I 主分类号 G06K9/68(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王宝筠
主权项 一种信息处理方法,应用于电子设备,其特征在于,获取与待识别为电子文本的待识别信息相关联的电子文本内容;提取所获取的电子文本内容中的关键词;获取所提取的关键词的同义词,以及与所提取的关键词相关联的词;所提取的关键词,所述关键词的同义词,以及与所提取的关键词相关联的词构成词库;所述方法包括:对所述待识别信息中的第一信息进行识别得到的第一词;在所述词库中查找是否存在与所述第一词相似的第二词;当所述词库中存在与所述第一词相似的第二词时,将所述第一词替换为所述第二词。
地址 100085 北京市海淀区上地信息产业基地创业路6号