一种基于改进SOM算法的地基云图识别方法,申请号CN201410198927.0-传众专利搜索

发明名称	一种基于改进SOM算法的地基云图识别方法
摘要	本发明公开了一种基于改进SOM算法的地基云图识别方法，包括以下步骤：步骤一、使用成像设备采集云图图片，用于SOM分类器训练以及云图的识别；步骤二、对采集到的云图图片进行预处理；步骤三、利用聚类分析，将预处理后的云图图片前景与背景进行分离；步骤四、计算云图的特征；步骤五、使用已知类别的云图特征数据样本，采用k-means和SOM相结合的学算法来训练分类器。本发明提高了识别的准确率，提升气象台站云观测的自动化能力，同时提高云观测的效率和准确性，从而达到较高的云图分类准确率；本发明结构简单，利用现有的图形采集设备和普通计算机即可进行实现，提高了实用性和适用性。
申请公布号	CN104008402A	申请公布日期	2014.08.27
申请号	CN201410198927.0	申请日期	2014.05.12
申请人	南京信息工程大学	发明人	李涛;李娟;邱忠阳;周欢乐;范文波
分类号	G06K9/66(2006.01)I	主分类号	G06K9/66(2006.01)I
代理机构	南京经纬专利商标代理有限公司 32200	代理人	朱小兵
主权项	1.一种基于改进SOM算法的地基云图识别方法，其特征在于，包括以下步骤：步骤一、使用成像设备采集云图图片，用于SOM分类器训练以及云图的识别；步骤二、对采集到的云图图片逐个进行预处理，获取对应云图灰度图像；步骤三、利用聚类分析，将预处理后的云图图片前景与背景进行分离；步骤四、计算云图的特征；步骤五、使用已知类别的云图特征数据样本，根据步骤四得到的云图的特征，采用k-means和SOM相结合的学习算法来训练分类器，具体步骤如下：(501)初始化各连接权值：给定已知类别的云图特征数据样本{x<sub>1</sub>,x<sub>2</sub>,…,x<sub>α</sub>,…,x<sub>n</sub>}，n为输入层节点数，α为输入层节点序号，x<sub>α</sub>即输入样本的第α个特征向量，使用k-means算法将云图样本进行分类，类别数为{c<sub>1</sub>,c<sub>2</sub>,…,c<sub>β</sub>,…,c<sub>δ</sub>}，δ为最大类别取值，β为类序号，c<sub>β</sub>即第β个类，则第β个类的第α个分量的坐标C<sub>β_α_x</sub>为：<maths num="0001"><![CDATA[<math><mrow><msub><mi>C</mi><mrow><mi>β</mi><mo>_</mo><mi>α</mi><mo>_</mo><mi>x</mi></mrow></msub><mo>=</mo><mfrac><mn>1</mn><mi>λ</mi></mfrac><munderover><mi>Σ</mi><mrow><mi>β</mi><mo>=</mo><mn>1</mn></mrow><mi>λ</mi></munderover><msub><mi>x</mi><mrow><mi>α</mi><mo>_</mo><mi>β</mi></mrow></msub><mo>,</mo><mi>α</mi><mo>&Element;</mo><mo>{</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>n</mi><mo>}</mo><mo>;</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中，x<sub>α_β</sub>为属于第β个类的样本的第α个特征向量，λ为第β个聚类中的样本个数；W<sub>αγ</sub>＝C<sub>β_α_x</sub>+ε，α∈{1,2,…,n}； (2)其中，γ为竞争层节点序号，γ∈{1,2,…,m}，m为竞争层节点数，W<sub>αγ</sub>为第α个输入层与第γ个竞争层的连接权值，ε为均衡参数，ε∈[-1,1]；对所有从输入神经元到输出神经元的连接权值W<sub>αγ</sub>按式(1)、(2)的确定；(502)对网络输入模式x<sup>θ</sup>＝(x<sub>1</sub>,x<sub>2</sub>,..,x<sub>n</sub>)，θ表示第θ个样本，计算网络输入模式x<sup>θ</sup>与全部输出节点所连接权向量W<sub>γ</sub>的距离d<sub>γ</sub>，<maths num="0002"><![CDATA[<math><mrow><msub><mi>d</mi><mi>γ</mi></msub><mo>=</mo><msqrt><munderover><mi>Σ</mi><mrow><mi>α</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msubsup><mi>x</mi><mi>α</mi><mi>θ</mi></msubsup><mo>-</mo><msub><mi>W</mi><mi>αγ</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>,</mo><mi>γ</mi><mo>&Element;</mo><mo>{</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>m</mi><mo>}</mo><mo>;</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中<img file="FDA0000503640590000013.GIF" wi="69" he="78" />为第θ个样本的第α个特征向量；(503)找出获胜神经元u，使得对于任意的γ，都有：d<sub>u</sub>＝min(d<sub>γ</sub>)，γ∈{1,2,…,m}； (4)其中，d<sub>u</sub>为最小距离，min(d<sub>γ</sub>)指网络输入模式x<sup>θ</sup>与全部输出节点所连接权向量W<sub>γ</sub>的距离d<sub>γ</sub>中的最小值；(504)确定获胜神经元u的邻域N<sub>u</sub>(E)，<maths num="0003"><![CDATA[<math><mrow><msub><mi>N</mi><mi>u</mi></msub><mrow><mo>(</mo><mi>E</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close='' separators=''><mtable><mtr><mtd><mn>0.7</mn><msub><mi>N</mi><mn>0</mn></msub><mo>,</mo></mtd><mtd><mi>E</mi><mo>></mo><mn>70</mn><mo>%</mo><mrow><mo>(</mo><msub><mi>E</mi><mn>0</mn></msub><mo>-</mo><mi>GOAL</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mn>0.4</mn><msub><mi>N</mi><mn>0</mn></msub><mo>,</mo></mtd><mtd><mi>E</mi><mo>></mo><mn>40</mn><mo>%</mo><mrow><mo>(</mo><msub><mi>E</mi><mn>0</mn></msub><mo>-</mo><mi>GOAL</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mn>1</mn><mo>,</mo></mtd><mtd><mi>E</mi><mo>></mo><mn>10</mn><mo>%</mo><mrow><mo>(</mo><msub><mi>E</mi><mn>0</mn></msub><mo>-</mo><mi>GOAL</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mn>0</mn><mo>,</mo></mtd><mtd><mi>E</mi><mo>≤</mo><mn>10</mn><mo>%</mo><mrow><mo>(</mo><msub><mi>E</mi><mn>0</mn></msub><mo>-</mo><mi>GOAL</mi><mo>)</mo></mrow></mtd></mtr></mtable><mo>;</mo></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中，N<sub>0</sub>为初始邻域，取为样本数据的类别数，E为每组输入样本通过网络后，赢得此样本的竞争神经元权值与该组输入样本的绝对值距离之和，E<sub>0</sub>为初始误差，GOAL为目标误差；(505)分别调整获胜神经元u及其几何邻域N<sub>u</sub>(t<sub>die</sub>)内的节点所连接的权值：<maths num="0004"><![CDATA[<math><mrow><msub><mi>W</mi><mi>αγ</mi></msub><mo>=</mo><mi>η</mi><mrow><mo>(</mo><msub><mi>t</mi><mi>die</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><msubsup><mi>x</mi><mi>α</mi><mi>λ</mi></msubsup><mo>-</mo><msub><mi>W</mi><mi>αγ</mi></msub><mo>)</mo></mrow><mo>,</mo><mi>α</mi><mo>&Element;</mo><mo>{</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>n</mi><mo>}</mo><mo>;</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow></math>]]></maths>W<sub>αγ</sub>(t<sub>die</sub>+1)＝W<sub>αγ</sub>(t<sub>die</sub>)+W<sub>αγ</sub>； (7)其中，η(t<sub>die</sub>)为学习率，t<sub>die</sub>为迭代次数；计算获胜神经元u的学习率η(t<sub>die</sub>)：<img file="FDA0000503640590000022.GIF" wi="1679" he="166" />式中，η<sub>0</sub>为获胜神经元初始学习率，t<sub>die</sub>为迭代次数，T<sub>总</sub>为总的学习次数；计算获胜神经元的邻域神经元学习率η′(t)：<img file="FDA0000503640590000023.GIF" wi="1554" he="155" />其中，η'<sub>0</sub>为邻域初始学习率；(506)计算网络输出：<maths num="0005"><![CDATA[<math><mrow><msub><mi>O</mi><mi>u</mi></msub><mo>=</mo><mi>v</mi><mrow><mo>(</mo><mmultiscripts><mrow><mo>(</mo><msub><mi>d</mi><mi>γ</mi></msub><mo>)</mo></mrow><mprescripts/><mrow><mi>γ</mi><mo>&Element;</mo><mo>{</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>m</mi><mo>}</mo></mrow><none/><mi>min</mi></mmultiscripts><mo>)</mo></mrow><mo>;</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>10</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中，v(.)为0-1函数或非线性函数；(507)当分类不再改变时，训练结束，将训练好的SOM分类器用于新云图样本的识别；否则迭代次数t<sub>die</sub>逐次累加，转回(502)。
地址	215101 江苏省苏州市吴中区木渎镇中山东路70号吴中科技创业园2号楼2310室