发明名称 文档处理装置、文档处理方法以及扫描仪
摘要 本公开提供了一种文档处理设备和设备以及扫描仪。该文档处理装置包括:文本行提取单元,其从所输入的文档中提取文本行;语言分类单元,其确定所输入的文档的语言是否需要进行OCR处理;OCR单元,其在确定需要进行OCR时,通过进行OCR处理来确定OCR置信度;图形特征识别单元,其确定图形特征识别置信度;以及确定单元,其基于图形特征识别置信度以及OCR置信度中的至少一项来确定组合置信度,并且基于组合置信度来确定所输入的文档的朝向。根据本公开的技术方案,可以更好地判断文档的朝向,尤其适合于在文档的图像质量退化时判断文档的朝向。
申请公布号 CN103455806A 申请公布日期 2013.12.18
申请号 CN201210177541.2 申请日期 2012.05.31
申请人 富士通株式会社 发明人 潘屹峰;孙俊;何源;直井聪
分类号 G06K9/20(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王萍;陈炜
主权项 一种文档处理设备,其包括:文本行提取单元,其被配置为从所输入的文档中提取至少一个文本行;语言分类单元,其被配置为通过图形特征识别处理来确定所输入的文档的语言是否需要进行光学字符识别处理;光学字符识别单元,其被配置为在确定所输入的文档的语言需要进行光学字符识别时,通过进行光学字符识别处理来为至少一部分文本行中的每个确定针对各候选方向的光学字符识别置信度;图形特征识别单元,其被配置为通过进行图形特征识别处理来为每个文本行确定针对各候选方向的图形特征识别置信度;以及确定单元,其被配置为基于所确定的图形特征识别置信度以及光学字符识别置信度中的至少一项来为所述至少一部分文本行中的每个确定针对各候选方向的组合置信度,并且基于组合置信度来确定所输入的文档的朝向。
地址 日本神奈川县