一种基于局部约束稀疏表征的花卉类别辨识方法,申请号CN201310250693.5-传众专利搜索

发明名称	一种基于局部约束稀疏表征的花卉类别辨识方法
摘要	本发明公开了一种基于局部约束稀疏表征的花卉类别辨识方法，首先收集花卉图像数据库和建立花卉科普知识库，然后提取花卉图片的各种图像特征；接着利用稀疏编码理论建立训练数据特征与测试数据特征的线性表示；在建模线性表示时，不仅考虑测试图像特征与训练图像特征集的线性表示误差最小，同时增加测试数据特征和训练数据特征的局部性特征相似性结构的权重约束，并利用核函数扩展的统计梯度下降方法进行有效求解，完成花卉类别辨识学过程；最后将待识别的花卉图像提取特征代入花卉类别判决公式，得到辨识结果，并从花卉科普知识库中调出该花卉类别对应的文字说明。本发明具有识别性能高的优点。
申请公布号	CN103336974B	申请公布日期	2016.12.28
申请号	CN201310250693.5	申请日期	2013.06.21
申请人	华南理工大学	发明人	郭礼华
分类号	G06K9/66(2006.01)I	主分类号	G06K9/66(2006.01)I
代理机构	广州市华学知识产权代理有限公司 44245	代理人	陈文姬
主权项	一种基于局部约束稀疏表征的花卉类别辨识方法，其特征在于，包括以下步骤：(1)收集花卉图像数据库和建立花卉科普知识库：利用现有的植物花卉维基百科定义S个常用的花卉类别的名称，利用网络搜索引擎搜索各个花卉类别对应的花卉文字介绍和图片，将图片组成花卉图像数据库；将文字说明归入花卉科普知识库；S为自然数；(2)对步骤(1)得到的花卉图像数据库中的所有图片进行特征提取，每张图片提取的特征为m个；m为自然数；(3)花卉类别辨识学习过程：(3‑1)从花卉图像数据库中挑选p张图片，将p张图片的特征作为测试数据集Y，每张图片的测试数据特征y<sup>k</sup>当k＝1...m时分别代表每张图片提取的m个特征，p＜N,N为花卉图像数据库中的图片数；花卉图像数据库中其余的N‑p张图片的特征作为训练数据集X，每张图片的训练数据特征<img file="FDA0001063789450000011.GIF" wi="73" he="69" />当j＝1,2…S，表示花卉的类别，当k＝1...m时分别代表每张图片提取的m个特征；(3‑2)将测试数据特征y<sup>k</sup>用训练数据特征<img file="FDA0001063789450000012.GIF" wi="71" he="74" />线性表示为：<img file="FDA0001063789450000013.GIF" wi="288" he="71" />其中<img file="FDA0001063789450000014.GIF" wi="59" he="71" />是训练数据集表征测试数据集的权重系数，其值大于0；(3‑3)为了训练数据集和测试数据集线性表示误差最小，同时增加测试数据特征和训练数据特征的局部性特征相似性结构的权重约束，建立下面的最优化学习准则：<maths num="0001"><math><![CDATA[<mrow><munder><mrow><mi>min</mi><mfrac><mn>1</mn><mn>2</mn></mfrac></mrow><msubsup><mi>w</mi><mi>j</mi><mi>k</mi></msubsup></munder><munderover><mo>Σ</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mo>\|</mo><mo>\|</mo><msup><mi>y</mi><mi>k</mi></msup><mo>-</mo><munderover><mo>Σ</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>S</mi></munderover><msubsup><mi>X</mi><mi>j</mi><mi>k</mi></msubsup><msubsup><mi>w</mi><mi>j</mi><mi>k</mi></msubsup><mo>\|</mo><msubsup><mo>\|</mo><mn>2</mn><mn>2</mn></msubsup><mo>+</mo><mi>λ</mi><munderover><mo>Σ</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>S</mi></munderover><mo>\|</mo><mo>\|</mo><msubsup><mi>D</mi><mi>j</mi><mi>k</mi></msubsup><msubsup><mi>Θw</mi><mi>j</mi><mi>k</mi></msubsup><mo>\|</mo><msub><mo>\|</mo><mn>2</mn></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001063789450000015.GIF" wi="1414" he="186" /></maths>其中Θ表示向量点乘；λ是约束项权重，是用来平衡线性表示误差与权重系数之间的常数变量；<img file="FDA0001063789450000016.GIF" wi="374" he="99" />为测试数据特征y<sup>k</sup>与训练数据特征<img file="FDA0001063789450000017.GIF" wi="71" he="69" />的欧式距离；(3‑4)采用统计梯度下降法对<img file="FDA0001063789450000018.GIF" wi="58" he="76" />进行迭代更新，更新方程为：<maths num="0002"><math><![CDATA[<mrow><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msubsup><mi>w</mi><mi>j</mi><mrow><mi>k</mi><mo>,</mo><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msubsup><mo>=</mo><msubsup><mi>w</mi><mi>j</mi><mrow><mi>k</mi><mo>,</mo><mi>t</mi></mrow></msubsup><mo>-</mo><mi>η</mi><msub><mo>&dtri;</mo><mi>w</mi></msub></mrow></mtd></mtr><mtr><mtd><mrow><msub><mo>&dtri;</mo><mi>w</mi></msub><mo>=</mo><mo>-</mo><msubsup><mi>X</mi><mi>j</mi><mi>k</mi></msubsup><msup><mi>y</mi><mi>k</mi></msup><mo>+</mo><msubsup><mi>X</mi><mi>j</mi><mi>k</mi></msubsup><msubsup><mi>X</mi><mi>j</mi><mi>k</mi></msubsup><msubsup><mi>w</mi><mi>j</mi><mrow><mi>k</mi><mo>,</mo><mi>t</mi></mrow></msubsup><mo>+</mo><mi>λ</mi><mo>\|</mo><mo>\|</mo><msup><mi>y</mi><mi>k</mi></msup><mo>-</mo><msubsup><mi>X</mi><mi>j</mi><mi>k</mi></msubsup><mo>\|</mo><msubsup><mo>\|</mo><mn>2</mn><mn>2</mn></msubsup><mo>·</mo><msubsup><mi>w</mi><mi>j</mi><mrow><mi>k</mi><mo>,</mo><mi>t</mi></mrow></msubsup></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001063789450000019.GIF" wi="1750" he="248" /></maths>其中，t是SGD迭代过程的迭代次数，η是统计梯度下降迭代过程的学习率；(3‑5)利用非线性函数φ将训练和测试数据的特征进行非线性映射到高维的再生核希尔伯特空间，即φ(x<sub>i</sub>)<sup>T</sup>φ(x<sub>j</sub>)＝g(x<sub>i</sub>,x<sub>j</sub>)，其中g(x<sub>i</sub>,x<sub>j</sub>)为χ<sup>2</sup>核函数，x<sub>i</sub>和x<sub>j</sub>是数据特征；公式(2)变换成：<maths num="0003"><math><![CDATA[<mrow><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msubsup><mi>w</mi><mi>j</mi><mrow><mi>k</mi><mo>,</mo><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msubsup><mo>=</mo><msubsup><mi>w</mi><mi>j</mi><mrow><mi>k</mi><mo>,</mo><mi>t</mi></mrow></msubsup><mo>-</mo><mi>η</mi><msub><mo>&dtri;</mo><mi>w</mi></msub></mrow></mtd></mtr><mtr><mtd><mrow><msub><mo>&dtri;</mo><mi>w</mi></msub><mo>=</mo><mo>-</mo><msup><mi>h</mi><mi>k</mi></msup><mo>+</mo><msup><mi>G</mi><mi>k</mi></msup><msubsup><mi>w</mi><mi>j</mi><mrow><mi>k</mi><mo>,</mo><mi>t</mi></mrow></msubsup><mo>+</mo><mi>λ</mi><mrow><mo>(</mo><msup><mi>P</mi><mi>k</mi></msup><mo>-</mo><mn>2</mn><msup><mi>h</mi><mi>k</mi></msup><mo>+</mo><msup><mi>G</mi><mi>k</mi></msup><mo>)</mo></mrow><mo>·</mo><msubsup><mi>w</mi><mi>j</mi><mrow><mi>k</mi><mo>,</mo><mi>t</mi></mrow></msubsup></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001063789450000021.GIF" wi="1710" he="246" /></maths>其中<img file="FDA0001063789450000022.GIF" wi="357" he="71" />是训练数据特征<img file="FDA0001063789450000023.GIF" wi="67" he="71" />与测试数据特征y<sup>k</sup>的点乘核函数,<img file="FDA0001063789450000024.GIF" wi="382" he="71" />是训练数据特征<img file="FDA0001063789450000025.GIF" wi="66" he="79" />与自身的点乘核函数，P<sup>k</sup>＝φ(y<sup>k</sup>)φ(y<sup>k</sup>)是测试数据特征y<sup>k</sup>与自身的点乘核函数；经过公式(3)的多次迭代，得到最优的表征权重系数<img file="FDA0001063789450000026.GIF" wi="83" he="78" />(4)辨识花卉：用户拍摄待辨识花卉的图像，对待识别的花卉图像提取特征Z<sup>k</sup>，其中k＝1...m分别代表每张图片提取的m个特征；根据Z<sup>k</sup>，由花卉类别判决公式辨识花卉类别，并从花卉科普知识库中调出该花卉类别对应的文字说明；其中花卉类别判决公式为：<img file="FDA0001063789450000027.GIF" wi="1178" he="135" />其中j<sup>*</sup>表示利用某个j类别的训练数据的线性表示与测试数据的最小误差值，通过最小选择，j即为识别得到的花卉类别。
地址	510641 广东省广州市天河区五山路381号