发明名称 文档图像分割系统
摘要 公开了一种用于文档图像分割的系统和方法。通过在文档图像里形成不同簇获得图像段。文档图像可能包括公司标志、产品标记或商标的图像。本发明能够对于任意类型的复杂的彩色图像执行图像分割,并且能够识别包括文本或图形的标志,产品标记或商标,其中文本可以是统一的字形或不均匀的字形,例如花式字形、书法风格或具有不同的方向。
申请公布号 CN101901484A 申请公布日期 2010.12.01
申请号 CN201010195123.7 申请日期 2010.04.02
申请人 塔塔咨询服务有限公司 发明人 J·皮尼特;G·希兰梅;K·阿布什
分类号 G06T7/00(2006.01)I;G06T7/40(2006.01)I;G06K9/32(2006.01)I;G06F17/30(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 北京市中咨律师事务所 11247 代理人 杨晓光;于静
主权项 一种用于文档图像分割的系统,所述系统包括:·输入装置,适于输入文档图像;·图像预处理装置,适于通过保持高宽比来预处理所述文档图像,所述预处理装置包括颜色量化装置以提供预处理后的量化图像;·颜色空间转换装置,适于接收所述预处理后的量化图像并且为所述量化图像提供色调、饱和度和纯度颜色空间转换,以获得仅仅包括所述量化图像的饱和度分量的转换图像;·第一图像能量计算装置,适于接收所述转换图像并且计算所述转换图像的水平和垂直能量,以通过累积两种计算出的转换图像的能量来提供第一能量图像;·灰度图像转换装置,适于接收所述预处理后的量化图像,并且对所述量化图像执行灰度转换操作,以提供灰度图像;·第二图像能量计算装置,适于接收所述灰度图像并且计算所述灰度图像的水平和垂直能量,以通过累积两种计算出的能量和所述灰度图像来提供第二能量图像;·计算装置,适于接收所述第一能量图像和第二能量图像以计算两种能量的最大值并且提供最大能量图像;·二值化装置,适于接收所述最大能量图像并且提供二值化的图像;·扩张装置,适于接收所述二值化的图像并且执行扩张操作以提供扩张的图像;·簇集装置,适于接收所述扩张的图像并且基于扩张区域的密度来制订不同的簇,并且提供簇集的图像;以及·框产生装置,适于产生包围簇集的图像里的每一个簇的边界框,以形成具有图像段的文档图像。
地址 印度马哈拉施特拉邦