发明名称 分析数字文档图像的方法
摘要 对输入图像进行分析,输入图像是存储在存储器中的数字化图像或来自于扫描仪的扫描图像。通过以下操作来根据输入图像形成特征图像:将输入图像划分成多个像素块,使输入图像中的每个像素块与特征图像中的单个像素相关联,以及输出特征图像以进一步分析或存储在存储器中。示例实施例从文档图像中提取并分析特征,以检测与页面区域、失真区域和书脊区域相关联的具体特性。可以对所提取的特征进行进一步分析,以在段落、行、词和字符级别上检测文档特性。
申请公布号 CN102737240B 申请公布日期 2014.10.29
申请号 CN201210037636.4 申请日期 2012.02.17
申请人 精工爱普生株式会社 发明人 拉斯蒂拉夫·卢卡
分类号 G06K9/20(2006.01)I;G06K9/32(2006.01)I 主分类号 G06K9/20(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 李敬文
主权项 一种对具有K<sub>1</sub>×K<sub>2</sub>个像素x<sub>(r,s)</sub>的输入图像x进行分析的方法,其中(r,s)表示像素位置,r=1,2,...,K<sub>1</sub>表示图像行,s=1,2,...,K<sub>2</sub>表示图像列,所述输入图像是存储在存储器中的数字化图像或来自于扫描仪的扫描图像,所述方法包括:使用处理器通过以下操作来根据输入图像x形成特征图像z:将输入图像x划分成多个像素块,每个像素块的块大小是g<sub>1</sub>×g<sub>2</sub>个像素,其中g<sub>1</sub>表示像素块中的图像行数,g<sub>2</sub>表示像素块中的图像列数,使输入图像x中的每个像素块与特征图像z中的单个像素相关联,其中特征图像z由K<sub>1</sub>/g<sub>1</sub>×K<sub>2</sub>/g<sub>2</sub>个像素构成,以及输出特征图像z以进一步分析或存储在存储器中;其中,特征图像z是具有特征像素z<sub>(m,n)</sub>=[f<sub>(m,n)</sub>,b<sub>(m,n)</sub>]的双通道图像,其中m=1,2,...,K<sub>1</sub>/g<sub>1</sub>,n=1,2,...,K<sub>2</sub>/g<sub>2</sub>,f<sub>(m,n)</sub>和b<sub>(m,n)</sub>分别表示特征像素z<sub>(m,n)</sub>的前景分量和背景分量;其中,特征像素z<sub>(m,n)</sub>的前景分量和背景分量分别定义为:f<sub>(m,n)</sub>=min{x<sub>(r,s)</sub>;(m‑1)g<sub>1</sub><r≤mg<sub>1</sub>,(n‑1)g<sub>2</sub><s≤ng<sub>2</sub>}b<sub>(m,n)</sub>=max{x<sub>(r,s)</sub>;(m‑1)g<sub>1</sub><r≤mg<sub>1</sub>,(n‑1)g<sub>2</sub><s≤ng<sub>2</sub>}其中min和max是最小值运算符和最大值运算符;其中,处理器根据以下等式来检测页面:<img file="FDA0000547910210000011.GIF" wi="1234" he="162" />其中,θ和<img file="FDA0000547910210000012.GIF" wi="37" he="45" />是可调参数,用于评估输入图像x中前景和背景之间的相似度,以及标识具有背景分量和前景分量的大贡献的像素,d<sub>(m,n)</sub>是尺寸与特征图像z的尺寸相同的二进制图d中的像素,值d<sub>(m,n)</sub>=1表示特征图像z中的位置(m,n)与页面区域相对应。
地址 日本东京