发明名称 一种唐卡图像与非唐卡图像的区分方法
摘要 唐卡图像与非唐卡图像的区分方法,在计算机上按下述步骤实现,实现过程包括训练阶段与识别阶段;训练阶段包括预处理、特征提取、相似性度量和分类器设计;识别阶段包括预处理、特征提取、相似性度量和分类器识别。训练阶段首先是对训练集图像进行归一化、分块和灰度化等预处理;通过对图像信息熵、图像颜色变化率以及图像对称性等特征的提取,得到用于区分唐卡图像与非唐卡图像的鉴别特征;然后对图像信息熵特征、图像颜色变化率特征和图像对称性特征进行模板、阈值训练和相似性度量;最后采用间隔阈值渐进算法设计分类器。识别阶段是对待识别图像预处理;再对提取图像特征使用分类器进行唐卡图像与非唐卡图像的分类识别。本发明判断正确率达到95%。
申请公布号 CN102509109A 申请公布日期 2012.06.20
申请号 CN201110320662.3 申请日期 2011.10.20
申请人 西北民族大学 发明人 王维兰;尹路;王铁君
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 甘肃省知识产权事务中心 62100 代理人 刘继春
主权项 1.一种唐卡图像与非唐卡图像的区分方法,在计算机上按下述步骤实现,整个实现过程包括训练阶段与识别阶段;训练阶段包括预处理、特征提取、相似性度量和分类器设计;识别阶段包括预处理、特征提取、相似性度量和分类器识别;训练阶段首先是对训练集图像进行归一化、分块和灰度化等预处理;通过对图像信息熵、图像颜色变化率以及图像对称性等特征的提取,得到用于区分唐卡图像与非唐卡图像的鉴别特征;然后对图像信息熵特征、图像颜色变化率特征和图像对称性特征进行模板、阈值训练和相似性度量;最后采用间隔阈值渐进算法设计分类器;识别阶段首先是对待识别图像进行归一化、分块和灰度化等预处理;通过对图像信息熵、图像颜色变化率以及图像对称性等特征的提取,得到用于区分唐卡图像与非唐卡图像的鉴别特征;然后对图像信息熵特征、图像颜色变化率特征和图像对称性特征,使用分类器进行唐卡图像与非唐卡图像的分类识别;所以,本发明的整个过程包括两大步骤:第一,对训练集图像实施的训练阶段,第二,对待识别图像进行的识别阶段,具体步骤如下:第一,对训练集图像实施的训练阶段<img file="260055DEST_PATH_IMAGE001.GIF" wi="84" he="23" />a.1归一化处理将图像宽度与长度大小归一化为:400×540;a.2分块处理按照每个像素块20×20的大小进行均匀分块,宽度上分为20块,高度上分为27块,把归一化后的图像分为540块;按照从左向右,从下往上的顺序进行编号,组成一个二维的分块矩阵;a.3图像的灰度化处理    采用平均值法,即求出每个像素点的R、G、B三分量亮度的平均值,然后将彩色图像中的这个平均值赋给这个像素的三个分量;<img file="222195DEST_PATH_IMAGE002.GIF" wi="110" he="23" />b.1提取图像信息熵特征图像信息熵特征提取的计算步骤:b.1.1大小归一化和分块、灰度化图像,灰度级为<img file="2011103206623100001DEST_PATH_IMAGE003.GIF" wi="85" he="19" />;b.1.2对图像中的每一个子块分别操作,在每个子块内部逐个像素点扫描,统计每个灰度级出现的概率<img file="788306DEST_PATH_IMAGE004.GIF" wi="99" he="19" />;b.1.3按照式(1)计算出每一个子块图像的信息熵<img file="2011103206623100001DEST_PATH_IMAGE005.GIF" wi="20" he="18" />,式(1):<img file="886712DEST_PATH_IMAGE006.GIF" wi="159" he="57" />540个子块计算完成之后,得到图像信息熵矩阵,也就是图像信息熵特征;b.1.4采用直方图排序法将540个子块的信息熵按照从小到大的顺序进行排列,得到图像信息熵直方图; b.2提取图像颜色变化率特征使用<img file="512865DEST_PATH_IMAGE007.GIF" wi="38" he="20" />颜色空间,对图像相邻像素点的颜色变化率算法如下:b.2.1以图像像素点矩阵的左下角的像素点作为原点建立坐标系;b.2.2两像素点<img file="2011103206623100001DEST_PATH_IMAGE008.GIF" wi="180" he="19" />之间的颜色变化用颜色值的欧氏距离式(2)计算,式(2):<img file="696722DEST_PATH_IMAGE009.GIF" wi="282" he="19" />其中,<img file="66523DEST_PATH_IMAGE010.GIF" wi="184" he="19" />分别是像素点的颜色坐标值;b.2.3横向和纵向两个方向的颜色变化分别用式(3)和式(4)计算;式(3)和式(4)分别是:          <img file="2011103206623100001DEST_PATH_IMAGE011.GIF" wi="174" he="114" />其中的<img file="789410DEST_PATH_IMAGE012.GIF" wi="16" he="17" />和<img file="2011103206623100001DEST_PATH_IMAGE013.GIF" wi="19" he="17" />分别为图像的高和宽;b.2.4将式(3)和式(4)计算结果求和再除以像素个数即得到式(5)所表示的颜色变化率参数<img file="586464DEST_PATH_IMAGE014.GIF" wi="88" he="19" />,式(5):<img file="2011103206623100001DEST_PATH_IMAGE015.GIF" wi="535" he="57" />对图像中的每一个子块都按照上述的图像颜色变化率算法计算,在每一子块图像内部计算得到图像颜色变化率,540个子块计算完成之后,组成图像颜色变化率矩阵;就是图像颜色变化率特征;b.3提取图像对称性特征b.3.1对图像的颜色变化率矩阵,每一子块设置一个标志为<img file="257617DEST_PATH_IMAGE016.GIF" wi="38" he="22" />,如果该子块颜色变化率参数小于50,则<img file="165530DEST_PATH_IMAGE016.GIF" wi="38" he="22" />的值为1,如果该子块颜色变化率参数大于或等于50,则<img file="176212DEST_PATH_IMAGE016.GIF" wi="38" he="22" />的值为0;b.3.2对图像的左半区域进行搜索,遍历每一子块,并将其与图像右半区域的对称位置块进行比较,判断是否具有相同的标志,如果标志相同则对称性系数<img file="2011103206623100001DEST_PATH_IMAGE017.GIF" wi="70" he="22" />加1,否则对称性系数<img file="206484DEST_PATH_IMAGE017.GIF" wi="70" he="22" />减1;颜色变化率矩阵中位置为<img file="302616DEST_PATH_IMAGE018.GIF" wi="34" he="26" />的子块其对称像素块的位置为<img file="2011103206623100001DEST_PATH_IMAGE019.GIF" wi="74" he="31" />(<img file="76537DEST_PATH_IMAGE020.GIF" wi="130" he="22" />);<img file="2011103206623100001DEST_PATH_IMAGE021.GIF" wi="153" he="23" />c.1训练图像的信息熵直方图模板与获取信息熵低阈值边界与高阈值边界c.1.1训练图像的信息熵直方图模板分别对850幅唐卡图像和850幅非唐卡图像的训练集通过如下三步进行:c.1.1.1计算分块信息熵矩阵,然后用直方图进行统计,横轴表示分块的标号,纵轴表示熵值;c.1.1.2采用直方图排序法将540个子块的信息熵按照从小到大的顺序进行排列;c.1.1.3对统计的所有唐卡图像按照式(6)进行训练,式(6):<img file="771086DEST_PATH_IMAGE022.GIF" wi="319" he="57" />其中,<img file="2011103206623100001DEST_PATH_IMAGE023.GIF" wi="19" he="19" />表示训练所用的图像数,<img file="909943DEST_PATH_IMAGE024.GIF" wi="26" he="19" />表示图像的灰度级;<img file="2011103206623100001DEST_PATH_IMAGE025.GIF" wi="15" he="19" />表示第<img file="290109DEST_PATH_IMAGE026.GIF" wi="13" he="19" />幅图像的信息熵直方图中,经过排序后处于第<img file="805404DEST_PATH_IMAGE027.GIF" wi="11" he="17" />个位置上的子块的信息熵;式(6)每计算一遍,即求得一个位置上的信息熵平均值;对所有灰度级完成训练之后得到的即为训练集图像的信息熵直方图模板;c.1.2 获取信息熵低阈值边界与高阈值边界采用式(7)进行图像信息熵特征的相似性度量,式(7):                         <img file="790678DEST_PATH_IMAGE028.GIF" wi="220" he="57" />其中,<img file="162753DEST_PATH_IMAGE029.GIF" wi="33" he="19" />是图像<img file="967898DEST_PATH_IMAGE030.GIF" wi="12" he="19" />的统计直方图,<img file="21305DEST_PATH_IMAGE031.GIF" wi="37" he="19" />为c.1训练得到的信息熵直方图模板<img file="923402DEST_PATH_IMAGE032.GIF" wi="16" he="19" />,<img file="2011103206623100001DEST_PATH_IMAGE033.GIF" wi="23" he="19" />为灰度等级,<img file="964914DEST_PATH_IMAGE034.GIF" wi="37" he="19" />为<img file="2011103206623100001DEST_PATH_IMAGE035.GIF" wi="37" he="17" />之间的相似性距离,即图像信息熵特征的相似性度量结果;将200幅图像信息熵直方图与c.1.1获得的唐卡图像的信息熵直方图模板、非唐卡图像的信息熵直方图模板分别进行相似性计算,并将求得的相似性结果进行统计分析,获得图像相似的信息熵低阈值边界<img file="522934DEST_PATH_IMAGE036.GIF" wi="92" he="22" />的数值为63,信息熵高阈值边界<img file="2011103206623100001DEST_PATH_IMAGE037.GIF" wi="94" he="22" />的数值为416,从而确定了图像信息熵特征相似性度量的范围,在相似性度量中以它们为标准进行信息熵比较计算;c.2 训练颜色变化率特征的高阈值和低阈值将图像颜色变化率参数矩阵中的每个分块数据予以统计与分析,把颜色变化率参数低于50的称为颜色变化率低值子块;分别对850幅唐卡图像和850幅非唐卡图像计算颜色变化率低值子块的个数,综合统计结果得到:图像颜色变化率参数下边界阈值<img file="176769DEST_PATH_IMAGE038.GIF" wi="78" he="22" />的数值为100,图像颜色变化率参数上边界阈值<img file="2011103206623100001DEST_PATH_IMAGE039.GIF" wi="80" he="22" />的数值为157,从而确定了图像颜色变化率特征相似性度量的范围,在相似性度量中以它们为标准进行颜色变化率比较计算;c.3训练对称性特征阈值将图像颜色变化率参数矩阵中的每个子块数据加以统计,图像颜色变化率矩阵的对称性判断如下:对图像的颜色变化率矩阵每一子块设置一个标志为<img file="136635DEST_PATH_IMAGE016.GIF" wi="38" he="22" />,如果该子块颜色变化率参数小于50,则<img file="850513DEST_PATH_IMAGE016.GIF" wi="38" he="22" />为1;如果该子块颜色变化率参数大于或等于50,则<img file="630250DEST_PATH_IMAGE016.GIF" wi="38" he="22" />为0;对图像的左半区域进行搜索,遍历每一子块,并将其与图像右半区域的位置对称块进行比较,判断是否具有相同的标志,如果标志相同则对称性系数<img file="25460DEST_PATH_IMAGE017.GIF" wi="70" he="22" />加1,否则对称性系数<img file="902149DEST_PATH_IMAGE017.GIF" wi="70" he="22" />减1,最后得到对称性特征阈值<img file="724611DEST_PATH_IMAGE040.GIF" wi="94" he="22" />的数值为<img file="2011103206623100001DEST_PATH_IMAGE041.GIF" wi="25" he="20" />;颜色变化率矩阵中位置为<img file="991644DEST_PATH_IMAGE018.GIF" wi="34" he="26" />的子块其对称像素块的位置为<img file="754326DEST_PATH_IMAGE019.GIF" wi="74" he="31" />(<img file="423205DEST_PATH_IMAGE020.GIF" wi="130" he="22" />);<img file="416569DEST_PATH_IMAGE042.GIF" wi="120" he="23" />d.1图像信息熵特征的相似性度量通过c.1.2的方法计算图像<img file="2011103206623100001DEST_PATH_IMAGE043.GIF" wi="17" he="22" />的信息熵直方图与训练得到的图像信息熵直方图模板之间的距离参数<img file="233215DEST_PATH_IMAGE044.GIF" wi="18" he="18" />,若<img file="DEST_PATH_IMAGE045.GIF" wi="122" he="22" />,则图像<img file="298123DEST_PATH_IMAGE046.GIF" wi="17" he="21" />为唐卡图像,若<img file="DEST_PATH_IMAGE047.GIF" wi="125" he="22" />则图像<img file="821508DEST_PATH_IMAGE048.GIF" wi="16" he="21" />判断为非唐卡图像,若<img file="DEST_PATH_IMAGE049.GIF" wi="225" he="22" /><img file="48090DEST_PATH_IMAGE050.GIF" wi="13" he="24" />,则需要进一步的判断;<b> </b>其中<img file="2011103206623100001DEST_PATH_IMAGE051.GIF" wi="125" he="22" />,<img file="289716DEST_PATH_IMAGE052.GIF" wi="137" he="22" />;d.2图像颜色变化率特征的相似性度量用<img file="385411DEST_PATH_IMAGE053.GIF" wi="20" he="20" />表示一幅图像的颜色变化率参数小于50的低值子块个数;低阈值下边界为<img file="763303DEST_PATH_IMAGE054.GIF" wi="77" he="22" />、低阈值上边界为<img file="364049DEST_PATH_IMAGE039.GIF" wi="80" he="22" />,低值子块相似度量方法是:若<img file="2011103206623100001DEST_PATH_IMAGE055.GIF" wi="106" he="22" />,则这幅图像为唐卡图像;若<img file="889708DEST_PATH_IMAGE056.GIF" wi="110" he="22" />,则待分类图像为非唐卡图像;如果<img file="2011103206623100001DEST_PATH_IMAGE057.GIF" wi="197" he="22" />则需要进一步判断;<img file="296418DEST_PATH_IMAGE058.GIF" wi="116" he="22" />,<img file="528817DEST_PATH_IMAGE059.GIF" wi="118" he="22" />;d.3图像对称性特征的相似性度量将待分类图像的对称性特征与唐卡图像的对称性特征阈值<img file="300464DEST_PATH_IMAGE040.GIF" wi="94" he="22" />进行比较,如果待分类图像的对称性特征大于或等于<img file="251102DEST_PATH_IMAGE040.GIF" wi="94" he="22" />则为唐卡图像,对称性特征小于<img file="195924DEST_PATH_IMAGE040.GIF" wi="94" he="22" />则为非唐卡图像,<img file="548408DEST_PATH_IMAGE060.GIF" wi="128" he="22" />;<img file="490956DEST_PATH_IMAGE061.GIF" wi="115" he="23" />用下述间隔阈值渐近算法,对唐卡与非唐卡图像进行分类识别:f.1对归一化和灰度化处理的图像<img file="492673DEST_PATH_IMAGE062.GIF" wi="14" he="18" />,用步骤b.1计算待识别图像<img file="178869DEST_PATH_IMAGE062.GIF" wi="14" he="18" />的信息熵直方图,并与c.1所得的唐卡图像信息熵直方图模板进行相似性匹配,获得图像相似性距离参数<img file="385859DEST_PATH_IMAGE063.GIF" wi="18" he="18" />;f.2若<img file="499309DEST_PATH_IMAGE064.GIF" wi="121" he="22" />,则图像<img file="486857DEST_PATH_IMAGE062.GIF" wi="14" he="18" />为唐卡图像,若<img file="711164DEST_PATH_IMAGE065.GIF" wi="124" he="22" />则图像<img file="38241DEST_PATH_IMAGE062.GIF" wi="14" he="18" />判断为非唐卡图像,若<img file="119329DEST_PATH_IMAGE066.GIF" wi="225" he="22" />,则转入:f.3对大小归一化图像,用步骤b.2计算待识别图像<img file="531856DEST_PATH_IMAGE062.GIF" wi="14" he="18" />的颜色变化率矩阵,统计颜色变化率参数小于50的低值子块的个数,记为<img file="559855DEST_PATH_IMAGE067.GIF" wi="18" he="20" />,若<img file="803754DEST_PATH_IMAGE068.GIF" wi="108" he="22" />,则判断<img file="259006DEST_PATH_IMAGE062.GIF" wi="14" he="18" />为唐卡图像,若<img file="893250DEST_PATH_IMAGE069.GIF" wi="110" he="22" />,则判断<img file="459361DEST_PATH_IMAGE062.GIF" wi="14" he="18" />为非唐卡图像,若<img file="321881DEST_PATH_IMAGE070.GIF" wi="196" he="22" />,则转入:f.4应用对称性特征算法的步骤对待识别图像<img file="948034DEST_PATH_IMAGE062.GIF" wi="14" he="18" />的对称性进行计算并得到对称性系数<img file="69574DEST_PATH_IMAGE071.GIF" wi="14" he="20" />,若<img file="501693DEST_PATH_IMAGE072.GIF" wi="118" he="22" />则判断<img file="657867DEST_PATH_IMAGE062.GIF" wi="14" he="18" />为唐卡图像,若<img file="454922DEST_PATH_IMAGE073.GIF" wi="118" he="22" />则判断<img file="126075DEST_PATH_IMAGE062.GIF" wi="14" he="18" />为非唐卡图像,算法结束;第二,对待识别图像进行的识别阶段a.预处理与训练阶段的预处理相同;b.提取特征与训练阶段的提取特征相同;c. 用第一阶段步骤f所得分类器对唐卡与非唐卡图像进行分类识别:c.1对归一化和灰度化处理的图像<img file="33988DEST_PATH_IMAGE062.GIF" wi="14" he="18" />,用步骤b.1计算待识别图像<img file="44669DEST_PATH_IMAGE062.GIF" wi="14" he="18" />的信息熵直方图,并与第一阶段步骤c.1所得的唐卡图像信息熵直方图模板进行相似性匹配,获得图像相似性距离参数<img file="12625DEST_PATH_IMAGE063.GIF" wi="18" he="18" />;c.2若<img file="171074DEST_PATH_IMAGE064.GIF" wi="121" he="22" />,则图像<img file="882678DEST_PATH_IMAGE062.GIF" wi="14" he="18" />为唐卡图像,若<img file="311648DEST_PATH_IMAGE065.GIF" wi="124" he="22" />则图像<img file="450505DEST_PATH_IMAGE062.GIF" wi="14" he="18" />为非唐卡图像,若<img file="33933DEST_PATH_IMAGE066.GIF" wi="225" he="22" />,则转入:c.3对大小归一化图像,用步骤b.2计算待识别图像<img file="611545DEST_PATH_IMAGE062.GIF" wi="14" he="18" />的颜色变化率矩阵,统计颜色变化率参数小于50的低值子块的个数,记为<img file="331239DEST_PATH_IMAGE067.GIF" wi="18" he="20" />,若<img file="640998DEST_PATH_IMAGE068.GIF" wi="108" he="22" />,则判断<img file="774039DEST_PATH_IMAGE062.GIF" wi="14" he="18" />为唐卡图像,若<img file="827446DEST_PATH_IMAGE069.GIF" wi="110" he="22" />,则判断<img file="667226DEST_PATH_IMAGE062.GIF" wi="14" he="18" />为非唐卡图像,若<img file="210203DEST_PATH_IMAGE070.GIF" wi="196" he="22" />,则转入:c.4应用对称性特征算法的步骤对待识别图像<img file="768223DEST_PATH_IMAGE062.GIF" wi="14" he="18" />的对称性进行计算并得到对称性系数<img file="359741DEST_PATH_IMAGE071.GIF" wi="14" he="20" />,若<img file="620739DEST_PATH_IMAGE072.GIF" wi="118" he="22" />则判断<img file="537880DEST_PATH_IMAGE062.GIF" wi="14" he="18" />为唐卡图像,若<img file="317617DEST_PATH_IMAGE073.GIF" wi="118" he="22" />,则判断<img file="775143DEST_PATH_IMAGE062.GIF" wi="14" he="18" />为非唐卡图像,算法结束。
地址 730030 甘肃省兰州市城关区西北新村1号