基于四元数和模糊C均值聚类的图像分割方法,申请号CN201410105856.5-传众专利搜索

发明名称	基于四元数和模糊C均值聚类的图像分割方法
摘要	基于四元数和模糊C均值聚类的图像分割方法，将待分割图片转换到四元数空间中，指定聚类数目，初始化隶属度矩阵U，利用定义的四元数距离衡量当前聚类中心和像素之间的差异度，计算目标函数、新的隶属度矩阵和聚类中心，若目标函数小于或等于迭代停止阈值，则分割完成，输出分割效果图；若目标函数大于迭代停止阈值，则利用新的隶属度矩阵和聚类中心重复计算四元数距离和目标函数这一过程，直至目标函数满足迭代停止条件，完成分割。本发明在统模糊C均值聚类算法基础上提出一种基于四元数空间的图像分割方法，有效地将R、G、B三通道作为统一的整体考虑，可以有效地保持颜色信息的完整性，分割结果更符合人眼视觉。
申请公布号	CN103839269A	申请公布日期	2014.06.04
申请号	CN201410105856.5	申请日期	2014.03.21
申请人	南京大学	发明人	李勃;王云烨;刘闯文;朱鹏伟;陈惠娟;廖娟;陈启美
分类号	G06T7/00(2006.01)I	主分类号	G06T7/00(2006.01)I
代理机构	南京天翼专利代理有限责任公司 32112	代理人	黄明哲
主权项	1.基于四元数和模糊C均值聚类的图像分割方法，其特征是包括以下步骤：1)对待分割图像数据进行处理，每个像素的色彩特征用四元数形式表示，从RGB空间R<sup>+</sup>转至四元数空间Q<sup>+</sup>，图像中某一像素I(R<sub>t</sub>，G<sub>t</sub>，B<sub>t</sub>)的四元数形式表示为q<sub>t</sub>=R<sub>t</sub>i+G<sub>t</sub>j+B<sub>t</sub>k：Q<sup>+</sup>={q\|q=Ri+Gj+Bk，R，G，B∈R<sup>+</sup>}(1)式中i<sup>2</sup>=-1，j<sup>2</sup>=-1，k<sup>2</sup>=-1为虚数，存储得到的四元数数据；2)用[0，1]之间的随机数初始化隶属度矩阵U，并指定聚类中心的数目c，即聚类个数，所述隶属度矩阵U用于确定每个四元数数据隶属于各个聚类类簇的程度，0表示完全不隶属，1表示完全隶属，隶属度矩阵U的行表示不同的聚类中心，列表示图像像素，矩阵元素u<sub>st</sub>表示第t列的像素对第s行的聚类中心的隶属程度；隶属度矩阵中的元素u<sub>st</sub>满足归一化要求，即一个像素q<sub>t</sub>隶属于各个聚类中心C<sub>s</sub>的隶属度的总和唯一：<maths num="0001"><![CDATA[<math><mrow><msubsup><mi>Σ</mi><mrow><mi>s</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></msubsup><msub><mi>u</mi><mi>st</mi></msub><mo>=</mo><mn>1</mn><mo>,</mo><mo>&ForAll;</mo><mi>t</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>n</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow></math>]]></maths>式中n为图像的总像素数；3)定义四元数形式下两个像素的距离公式：像素q<sub>1</sub>=R<sub>1</sub>i+G<sub>1</sub>j+B<sub>1</sub>k和像素q<sub>2</sub>=R<sub>2</sub>i+G<sub>2</sub>j+B<sub>2</sub>k的四元数加权表示为：q<sub>3</sub>=R<sub>3</sub>i+G<sub>3</sub>j+B<sub>3</sub>k=q<sub>1</sub>+μq<sub>2</sub>μ<sup>-1</sup> (3)式中μ是单位灰度向量，<img file="FDA0000480007270000012.GIF" wi="443" he="77" />q<sub>3</sub>与图像的对角线均值UQ=(i+j+k)／3的距离为：d<sub>1</sub>=\|\|(R<sub>3</sub>-UQ)i+(G<sub>3</sub>-UQ)j+(B<sub>3</sub>-UQ)k\|\|(4)q<sub>1</sub>和q<sub>2</sub>之间的相对距离为：d<sub>2</sub>=\|(R<sub>1</sub>-R<sub>2</sub>+G<sub>1</sub>-G<sub>2</sub>+B<sub>1</sub>-B<sub>2</sub>)／3\|(5)则四元数形式下两个像素的距离为：<maths num="0002"><![CDATA[<math><mrow><msub><mi>DQ</mi><mrow><msub><mi>q</mi><mn>1</mn></msub><mo>,</mo><msub><mi>q</mi><mn>2</mn></msub></mrow></msub><mo>=</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mi>w</mi><mo>)</mo></mrow><msub><mi>d</mi><mn>1</mn></msub><mo>+</mo><msub><mi>wd</mi><mn>2</mn></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow></math>]]></maths>式中w是用来平衡色度和亮度的固定参数，称为距离因子，w取值在[0，1]之间；根据公式(6)，计算各个像素到各个聚类中心的四元素距离，获得距离矩阵D；4)计算聚类的目标函数和聚类中心，并更新隶属度矩阵U：依据模糊C聚类算法计算聚类的目标函数、聚类中心和隶属度矩阵，其中用步骤3)中定义的四元数距离取代欧式距离带入计算，四元数空间中模糊C均值聚类的目标函数为：<maths num="0003"><![CDATA[<math><mrow><mi>J</mi><mrow><mo>(</mo><mi>U</mi><mo>,</mo><msub><mi>C</mi><mn>1</mn></msub><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mi>C</mi><mi>c</mi></msub><mo>)</mo></mrow><mo>=</mo><msubsup><mi>Σ</mi><mrow><mi>s</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></msubsup><msub><mi>J</mi><mi>s</mi></msub><mo>=</mo><msubsup><mi>Σ</mi><mrow><mi>s</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></msubsup><msubsup><mi>Σ</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msubsup><mi>u</mi><mi>st</mi><mi>m</mi></msubsup><msubsup><mi>d</mi><mi>st</mi><mn>2</mn></msubsup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中C<sub>s</sub>，s=1，2，…，c是第s个模糊类簇的聚类中心；m∈(1，+∞)为加权指数；0≤u<sub>st</sub>≤1表示第t个像素隶属于第s个聚类中心的程度；d<sub>st</sub>=\|C<sub>s</sub>-q<sub>t</sub>\|是第t个像素与第s个聚类中心之间的四元数距离；J<sub>s</sub>是第s个聚类中心的目标函数值；引入拉格朗日乘子(λ<sub>1</sub>，λ<sub>2</sub>，…，λ<sub>n</sub>)构造带条件极值的价值函数，使得式(7)式在满足式(2)的前提下取得最小值，即：<maths num="0004"><![CDATA[<math><mrow><mfenced open='' close=''><mtable><mtr><mtd><mover><mi>J</mi><mo>&OverBar;</mo></mover><mrow><mo>(</mo><mi>U</mi><mo>,</mo><msub><mi>C</mi><mn>1</mn></msub><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mi>C</mi><mi>c</mi></msub><mo>,</mo><msub><mi>λ</mi><mn>1</mn></msub><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mi>λ</mi><mi>n</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>J</mi><mrow><mo>(</mo><mi>U</mi><mo>,</mo><msub><mi>C</mi><mn>1</mn></msub><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mi>C</mi><mi>c</mi></msub><mo>)</mo></mrow><mo>+</mo><munderover><mi>Σ</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>λ</mi><mi>t</mi></msub><mrow><mo>(</mo><munderover><mi>Σ</mi><mrow><mi>s</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><msub><mi>u</mi><mi>st</mi></msub><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mo>=</mo><msubsup><mi>Σ</mi><mrow><mi>s</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></msubsup><msubsup><mi>Σ</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msubsup><mi>u</mi><mi>st</mi><mi>m</mi></msubsup><msubsup><mi>d</mi><mi>st</mi><mn>2</mn></msubsup><mo>+</mo><msubsup><mi>Σ</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msub><mi>λ</mi><mi>t</mi></msub><mrow><mo>(</mo><msubsup><mi>Σ</mi><mrow><mi>s</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></msubsup><msub><mi>u</mi><mi>st</mi></msub><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow></math>]]></maths>对于式(8)中所有输出参量求导，并令求导后的式子为零，求解出的C<sub>s</sub>和u<sub>st</sub>：<maths num="0005"><![CDATA[<math><mrow><msub><mi>C</mi><mi>s</mi></msub><mo>=</mo><mfrac><mrow><msubsup><mi>Σ</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><mrow><mo>(</mo><msubsup><mi>u</mi><mi>st</mi><mi>m</mi></msubsup><msub><mi>q</mi><mi>t</mi></msub><mo>)</mo></mrow></mrow><mrow><msubsup><mi>Σ</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msubsup><mi>u</mi><mi>st</mi><mi>m</mi></msubsup></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>9</mn><mo>)</mo></mrow></mrow></math>]]></maths>且<maths num="0006"><![CDATA[<math><mrow><msub><mi>u</mi><mi>st</mi></msub><mo>=</mo><mfrac><mn>1</mn><mrow><msubsup><mi>Σ</mi><mrow><msup><mi>s</mi><mo>′</mo></msup><mo>=</mo><mn>1</mn></mrow><mi>c</mi></msubsup><msup><mrow><mo>(</mo><mfrac><msub><mi>d</mi><mrow><msub><mi>C</mi><mi>s</mi></msub><msub><mi>q</mi><mi>t</mi></msub></mrow></msub><msub><mi>d</mi><mrow><msub><mi>C</mi><msup><mi>s</mi><mo>′</mo></msup></msub><msub><mi>q</mi><mi>t</mi></msub></mrow></msub></mfrac><mo>)</mo></mrow><mfrac><mn>2</mn><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></mfrac></msup></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>10</mn><mo>)</mo></mrow></mrow></math>]]></maths>式中t∈[1，n]，q<sub>t</sub>是图像中的像素，计算q<sub>t</sub>和某个聚类中心C<sub>s</sub>的隶属度u<sub>st</sub>时，需要用到q<sub>t</sub>与每个聚类中心之间的距离<img file="FDA0000480007270000025.GIF" wi="150" he="80" />s′∈[1，c]；由此计算出当前聚类中心C<sub>k</sub>和隶属度矩阵U，设置聚类计算的迭代停止阈值ε，若当前目标函数的值大于迭代停止阈值，将当前聚类中心C<sub>s</sub>和隶属度矩阵U带入步骤4)重新计算目标函数，迭代更新聚类中心和隶属度矩阵；若目标函数的值等于或小于迭代停止阈值，停止迭代，当前的计算得到的聚类中心即为待分割图片的最佳聚类中心，将图像数据根据聚类结果进行划分，完成分割。
地址	210093 江苏省南京市鼓楼区汉口路22号