发明名称 一种基于改进SOM算法的地基云图识别方法
摘要 本发明公开了一种基于改进SOM算法的地基云图识别方法,包括以下步骤:步骤一、使用成像设备采集云图图片,用于SOM分类器训练以及云图的识别;步骤二、对采集到的云图图片进行预处理;步骤三、利用聚类分析,将预处理后的云图图片前景与背景进行分离;步骤四、计算云图的特征;步骤五、使用已知类别的云图特征数据样本,采用k-means和SOM相结合的学算法来训练分类器。本发明提高了识别的准确率,提升气象台站云观测的自动化能力,同时提高云观测的效率和准确性,从而达到较高的云图分类准确率;本发明结构简单,利用现有的图形采集设备和普通计算机即可进行实现,提高了实用性和适用性。
申请公布号 CN104008402A 申请公布日期 2014.08.27
申请号 CN201410198927.0 申请日期 2014.05.12
申请人 南京信息工程大学 发明人 李涛;李娟;邱忠阳;周欢乐;范文波
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 朱小兵
主权项 1.一种基于改进SOM算法的地基云图识别方法,其特征在于,包括以下步骤:步骤一、使用成像设备采集云图图片,用于SOM分类器训练以及云图的识别;步骤二、对采集到的云图图片逐个进行预处理,获取对应云图灰度图像;步骤三、利用聚类分析,将预处理后的云图图片前景与背景进行分离;步骤四、计算云图的特征;步骤五、使用已知类别的云图特征数据样本,根据步骤四得到的云图的特征,采用k-means和SOM相结合的学习算法来训练分类器,具体步骤如下:(501)初始化各连接权值:给定已知类别的云图特征数据样本{x<sub>1</sub>,x<sub>2</sub>,…,x<sub>α</sub>,…,x<sub>n</sub>},n为输入层节点数,α为输入层节点序号,x<sub>α</sub>即输入样本的第α个特征向量,使用k-means算法将云图样本进行分类,类别数为{c<sub>1</sub>,c<sub>2</sub>,…,c<sub>β</sub>,…,c<sub>δ</sub>},δ为最大类别取值,β为类序号,c<sub>β</sub>即第β个类,则第β个类的第α个分量的坐标C<sub>β_α_x</sub>为:<maths num="0001"><![CDATA[<math><mrow><msub><mi>C</mi><mrow><mi>&beta;</mi><mo>_</mo><mi>&alpha;</mi><mo>_</mo><mi>x</mi></mrow></msub><mo>=</mo><mfrac><mn>1</mn><mi>&lambda;</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>&beta;</mi><mo>=</mo><mn>1</mn></mrow><mi>&lambda;</mi></munderover><msub><mi>x</mi><mrow><mi>&alpha;</mi><mo>_</mo><mi>&beta;</mi></mrow></msub><mo>,</mo><mi>&alpha;</mi><mo>&Element;</mo><mo>{</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>n</mi><mo>}</mo><mo>;</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中,x<sub>α_β</sub>为属于第β个类的样本的第α个特征向量,λ为第β个聚类中的样本个数;W<sub>αγ</sub>=C<sub>β_α_x</sub>+ε,α∈{1,2,…,n};     (2)其中,γ为竞争层节点序号,γ∈{1,2,…,m},m为竞争层节点数,W<sub>αγ</sub>为第α个输入层与第γ个竞争层的连接权值,ε为均衡参数,ε∈[-1,1];对所有从输入神经元到输出神经元的连接权值W<sub>αγ</sub>按式(1)、(2)的确定;(502)对网络输入模式x<sup>θ</sup>=(x<sub>1</sub>,x<sub>2</sub>,..,x<sub>n</sub>),θ表示第θ个样本,计算网络输入模式x<sup>θ</sup>与全部输出节点所连接权向量W<sub>γ</sub>的距离d<sub>γ</sub>,<maths num="0002"><![CDATA[<math><mrow><msub><mi>d</mi><mi>&gamma;</mi></msub><mo>=</mo><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>&alpha;</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msubsup><mi>x</mi><mi>&alpha;</mi><mi>&theta;</mi></msubsup><mo>-</mo><msub><mi>W</mi><mi>&alpha;&gamma;</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>,</mo><mi>&gamma;</mi><mo>&Element;</mo><mo>{</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>m</mi><mo>}</mo><mo>;</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中<img file="FDA0000503640590000013.GIF" wi="69" he="78" />为第θ个样本的第α个特征向量;(503)找出获胜神经元u,使得对于任意的γ,都有:d<sub>u</sub>=min(d<sub>γ</sub>),γ∈{1,2,…,m};     (4)其中,d<sub>u</sub>为最小距离,min(d<sub>γ</sub>)指网络输入模式x<sup>θ</sup>与全部输出节点所连接权向量W<sub>γ</sub>的距离d<sub>γ</sub>中的最小值;(504)确定获胜神经元u的邻域N<sub>u</sub>(E),<maths num="0003"><![CDATA[<math><mrow><msub><mi>N</mi><mi>u</mi></msub><mrow><mo>(</mo><mi>E</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close='' separators=''><mtable><mtr><mtd><mn>0.7</mn><msub><mi>N</mi><mn>0</mn></msub><mo>,</mo></mtd><mtd><mi>E</mi><mo>></mo><mn>70</mn><mo>%</mo><mrow><mo>(</mo><msub><mi>E</mi><mn>0</mn></msub><mo>-</mo><mi>GOAL</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mn>0.4</mn><msub><mi>N</mi><mn>0</mn></msub><mo>,</mo></mtd><mtd><mi>E</mi><mo>></mo><mn>40</mn><mo>%</mo><mrow><mo>(</mo><msub><mi>E</mi><mn>0</mn></msub><mo>-</mo><mi>GOAL</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mn>1</mn><mo>,</mo></mtd><mtd><mi>E</mi><mo>></mo><mn>10</mn><mo>%</mo><mrow><mo>(</mo><msub><mi>E</mi><mn>0</mn></msub><mo>-</mo><mi>GOAL</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mn>0</mn><mo>,</mo></mtd><mtd><mi>E</mi><mo>&le;</mo><mn>10</mn><mo>%</mo><mrow><mo>(</mo><msub><mi>E</mi><mn>0</mn></msub><mo>-</mo><mi>GOAL</mi><mo>)</mo></mrow></mtd></mtr></mtable><mo>;</mo></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中,N<sub>0</sub>为初始邻域,取为样本数据的类别数,E为每组输入样本通过网络后,赢得此样本的竞争神经元权值与该组输入样本的绝对值距离之和,E<sub>0</sub>为初始误差,GOAL为目标误差;(505)分别调整获胜神经元u及其几何邻域N<sub>u</sub>(t<sub>die</sub>)内的节点所连接的权值:<maths num="0004"><![CDATA[<math><mrow><msub><mi>W</mi><mi>&alpha;&gamma;</mi></msub><mo>=</mo><mi>&eta;</mi><mrow><mo>(</mo><msub><mi>t</mi><mi>die</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><msubsup><mi>x</mi><mi>&alpha;</mi><mi>&lambda;</mi></msubsup><mo>-</mo><msub><mi>W</mi><mi>&alpha;&gamma;</mi></msub><mo>)</mo></mrow><mo>,</mo><mi>&alpha;</mi><mo>&Element;</mo><mo>{</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>n</mi><mo>}</mo><mo>;</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow></math>]]></maths>W<sub>αγ</sub>(t<sub>die</sub>+1)=W<sub>αγ</sub>(t<sub>die</sub>)+W<sub>αγ</sub>;     (7)其中,η(t<sub>die</sub>)为学习率,t<sub>die</sub>为迭代次数;计算获胜神经元u的学习率η(t<sub>die</sub>):<img file="FDA0000503640590000022.GIF" wi="1679" he="166" />式中,η<sub>0</sub>为获胜神经元初始学习率,t<sub>die</sub>为迭代次数,T<sub>总</sub>为总的学习次数;计算获胜神经元的邻域神经元学习率η′(t):<img file="FDA0000503640590000023.GIF" wi="1554" he="155" />其中,η'<sub>0</sub>为邻域初始学习率;(506)计算网络输出:<maths num="0005"><![CDATA[<math><mrow><msub><mi>O</mi><mi>u</mi></msub><mo>=</mo><mi>v</mi><mrow><mo>(</mo><mmultiscripts><mrow><mo>(</mo><msub><mi>d</mi><mi>&gamma;</mi></msub><mo>)</mo></mrow><mprescripts/><mrow><mi>&gamma;</mi><mo>&Element;</mo><mo>{</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>m</mi><mo>}</mo></mrow><none/><mi>min</mi></mmultiscripts><mo>)</mo></mrow><mo>;</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>10</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中,v(.)为0-1函数或非线性函数;(507)当分类不再改变时,训练结束,将训练好的SOM分类器用于新云图样本的识别;否则迭代次数t<sub>die</sub>逐次累加,转回(502)。
地址 215101 江苏省苏州市吴中区木渎镇中山东路70号吴中科技创业园2号楼2310室