发明名称 用于OCR的基于文本图像质量的反馈
摘要 一种电子装置和方法按若干变焦等级捕捉现实世界的场景的多个图像,现实世界的所述场景含有一或多个大小的文本。接着所述电子装置和方法从所述多个图像中的每一者提取一或多个文本区域,接着分析与如从所述多个图像中的一或多者提取的第一文本区域的一或多个版本中的OCR相关的属性。当属性具有符合所述第一文本区域的版本中的光学字符辨识OCR的限制的值时,将所述第一文本区域的所述版本作为输入提供到OCR。
申请公布号 CN104871180B 申请公布日期 2017.05.03
申请号 CN201380064784.8 申请日期 2013.11.22
申请人 高通股份有限公司 发明人 P·K·拜哈提;A·S·比塞恩;R·桑德拉拉简;D·A·戈尔
分类号 G06K9/32(2006.01)I;G06K9/20(2006.01)I 主分类号 G06K9/32(2006.01)I
代理机构 北京律盟知识产权代理有限责任公司 11287 代理人 宋献涛
主权项 一种通过使用相同文本的多个图像改善文本辨识的方法,所述方法包括:按多个变焦等级捕捉现实世界的场景的多个图像,现实世界的所述场景含有一或多个大小的文本;从所述多个图像中的每一者提取一或多个文本区域;分析与从所述多个图像中的一或多者提取的第一文本区域的一或多个版本中的OCR相关的属性;当所述属性具有符合所述第一文本区域的版本中的光学字符辨识OCR的限制的值时,将所述第一文本区域的所述版本作为输入提供到OCR;当所述属性的值不符合OCR的所述限制时,计算所述第一文本区域的所述属性符合OCR的所述限制时的新的变焦等级,且将所述第一文本区域的至少一识别存储在列表中;对从所述多个图像中提取的其它文本区域,重复所述分析,并重复所述提供或所述计算且存储;使用所述列表识别使所述列表中的所有文本区域保留在相机视野中的最大变焦等级;以及基于所述最大变焦等级,产生反馈以捕捉至少一个额外图像。
地址 美国加利福尼亚州