发明名称 图文分离及文字增强方法
摘要
申请公布号 申请公布日期 2011.07.01
申请号 TW096112964 申请日期 2007.04.13
申请人 致伸科技股份有限公司 发明人 廖武杰;殷孟云
分类号 G06T7/00;G06K9/62 主分类号 G06T7/00
代理机构 代理人 陈志明 台北市内湖区瑞光路669号
主权项 一种图文分离方法,用以分离一影像所包含之一图片部与一文字部,包含:(a).一粗略分类步骤,包含:a1.将该影像分割为复数列,并将每一该列分割为复数片段,其中每一该片段包含复数个像素;a2.将该复数片段分为图片片段,白色片段,黑色片段,网点片段,半网点片段以及未定义片段;a3.计算每一该片段之亮度转态数目,以判断该片段是否为一转态片段或一图片上文字片段;(b).一进阶分类步骤,包含:b1.判断该未定义型态片段是否为文字片段;b2.将该复数片段分割为复数区块,其中每一该区块包含JxK个片段并依据每一该区块所包含之片段之型态的数量决定每一该区块系为图片区块,背景区块或非图片区块;b3.修正每一该区块内之片段之属性;b4.依据一非图片区块之二侧相邻区块之属性判断是否修改该非图片区块为图片区块;以及(c)一图片上文字侦测步骤以一图片上文字片段为中心决定一另一区块范围,该另一区块范围包括LxM个片段,并依据该另一区块范围内包含之图片上文字片段数目判断是否将该另一区块范围内之转态片段修正为图片上文字片段或是将该该另一区块范围内之图片上文字片段修正为图片片段。如申请专利范围第1项之图文分离方法,其中,于该a2步骤中系使用彩度统计,亮度统计,网点侦测以及边缘侦测决定该等片段所属之型态。如申请专利范围第2项之图文分离方法,其中该彩度统计包括:将该每一该片段之每一像素分类为高彩度像素、中彩度像素或低彩度像素;以及决定该像素是否为一图片像素。如申请专利范围第3项之图文分离方法,其中该影像之每一像素系依据以下方式而被区分为高彩度像素、中彩度像素或低彩度像素:以该像素为中心,计算该像素之一周边范围内所包含之复数像素之每一像素之彩度及亮度,其中该周边范围系一MxM矩阵;依据该彩度及亮度将该周边范围内之该复数像素区分为高彩度像素、中彩度像素以及低彩度像素;以及依据该周边范围内之像素所包含之高彩度像素数目或中彩度像素数目而决定该像素是否属于该图片像素。如申请专利范围第4项之图文分离方法,其中,依据每一该片段所包含之该图片像素之数目而决定该片段是否为一图片片段。如申请专利范围第5项之图文分离方法,其中该亮度统计包括:使用该影像之像素之亮度资料将该影像之每一像素分类为白色像素,灰色像素或黑色像素。如申请专利范围第6项之图文分离方法,其中该像素系依据以下方法而被分类为白色像素,灰色像素或黑色像素:以该像素为中心,计算该像素之该周边范围内所包含之复数像素之每一像素之亮度;依据该亮度将该周边范围内之该复数像素分类为白色像素,灰色像素或黑色像素;以及依据该周边范围内之像素所包含之白色像素,灰色像素或黑色像素数目而决定该像素系属于白色像素,灰色像素或黑色像素。如申请专利范围第7项之图文分离方法,其中,依据每一片段所包含之背景像素数目决定该片段是否为白色片段、依据每一片段所包含之灰色像素数目决定该片段是否为图片片段以及依据每一片段所包含之黑色像素数目决定该片段是否为黑色片段。如申请专利范围第8项之图文分离方法,其中该边缘侦测包括:计算该影像之每一像素之边缘值(edge value);依据该边缘值之绝对值判断该像素是否为有效边缘;计算属于有效边缘之像素之梯度值(gradient);以及将该梯度值大于零之像素归类为文字像素,而将该梯度值小于零之像素归类为白色像素。如申请专利范围第9项之图文分离方法,其中依据每一该片段所包含之该网点型态像素数目而决定该片段是否为一网点片段或一半网点片段。如申请专利范围第9项之图文分离方法,其中该像素系依据以下方法而被判断是否为一网点像素:以该像素为中心,使用一拉普拉斯(Laplacian)梯度运算子计算该像素之该周边范围内所包含之复数像素是否位于一网点区域;依据该周边范围内位于该网点区域内之像素数目决定该像素是否为一网点像素。如申请专利范围第11项之图文分离方法,其中该亮度转态计算包括:依据每一该片段之像素之亮度分布计算每一该片段之亮度转态(transition)数目;设定具有至少一亮度转态之片段为转态片段;以及依据三个相邻转态片段所包含之亮度转态数目来判断该复转态数转态片段是否至少有一转态片段被认定为图片上文字片段,其中当该三个相邻转态片段之亮度转态数目在一数字范围内且位于该三个相邻转态片段中间之片段为图片片段时,判断该三个相邻转态片段之中间片段为图片上文字片段。如申请专利范围第12项之图文分离方法,其中于该b2步骤包括:依据该区块所包含之网点片段数目以及图片片段数目判断该区块是否为一非图片区块;依据该区块所包含之图片片段数目,网点片段数目以及半网点片段数目之总和而判断该区块是否为图片区块;依据该区块所包含之图片片段数目与网点片段数目之总和以及黑色片段数目而判断该区块是否为图片区块;依据该区块所包含之图片片段数目而判断该区块是否为图片区块;以及依据该区块所包含之背景片段数目而判断该区块是否为背景区块。如申请专利范围第13项之图文分离方法,于步骤b4中,当一非图片区块之相邻二侧之至少一区块皆为图片区块时,修正该非图片区块为图片区块;以及将图片区块中所包含之网点片段及黑色片段修正为图片片段。
地址 台北市内湖区瑞光路669号