发明名称 一种用于遥感图像分类的基于类心对齐的迁移学方法
摘要 本发明提供了一种用于遥感图像分类的基于类心对齐的迁移学方法,(1)准备源域数据和目标域数据;(2)利用源域数据训练分类器;(3)利用分类器对目标域数据进行分类;(4)计算源域各类别数据的类心;(5)计算目标域各类别数据的类心;(6)计算源域和目标域各类别类心差;(7)对目标域的样本点,在目标域数据中搜索其k个近邻点;(8)计算目标域样本点移动方向;(9)计算移动后目标域数据;(10)利用分类器对移动后的目标域数据分类;(11)重复步骤(5)到(10)直到收敛。本发明使得移动后的目标域数据和源域数据光谱特征相似,达到迁移学的目的,多种遥感数据分类都表现良好适用性,具有明显的迁移学的效果。
申请公布号 CN105469109A 申请公布日期 2016.04.06
申请号 CN201510799789.6 申请日期 2015.11.19
申请人 中国地质大学(武汉) 发明人 马丽;祝蕾
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 武汉华旭知识产权事务所 42214 代理人 刘荣;江钊芳
主权项 一种用于遥感图像分类的基于类心对齐的迁移学习方法,其特征在于包括以下步骤:(1)选取源域图像中的训练数据X<sub>s</sub>以及目标域图像数据X<sub>t</sub>;其中X<sub>s</sub>是源域图像中的M个标记数据点的集合,每个数据点的维数是D,X<sub>s</sub>的标记信息表示为Y<sub>s</sub>,用M×1的向量表示,假设X<sub>s</sub>数据集中包含C种地物类型,其中第i种地物类型数据组成集合表示为X<sub>si</sub>,包含M<sub>i</sub>个数据点,那么X<sub>s</sub>=[X<sub>s1</sub>,…,X<sub>sC</sub>],M=M<sub>1</sub>+M<sub>2</sub>+…+M<sub>C</sub>;X<sub>t</sub>是目标域图像中N个数据点的集合,每个数据点的维数是D,Xt数据集中也包含C种地物类型,其中第i种地物类型数据组成集合表示为X<sub>ti</sub>,包含N<sub>i</sub>个数据点,那么X<sub>t</sub>=[X<sub>t1</sub>,…,X<sub>tC</sub>],N=N<sub>1</sub>+N<sub>2</sub>+…+N<sub>C</sub>;(2)用源域训练数据X<sub>s</sub>及其标记信息Y<sub>s</sub>训练分类器;(3)利用训练好的分类器对X<sub>t</sub>中的全部数据点进行预测,得到N个目标域图像数据X<sub>t</sub>的分类结果Y<sub>t</sub><sup>l</sup>,Y<sub>t</sub><sup>l</sup>是N×1的向量,其中l为当前迭代次数,初始值为1;(4)利用源域训练数据X<sub>s</sub>及其标记信息Y<sub>s</sub>,计算源域训练数据的C个类别数据的类心,表示为U<sub>s</sub>=[u<sub>s1</sub>,…,u<sub>sC</sub>],其中第i类类别数据的类心u<sub>si</sub>的计算包括以下过程:首先根据源域训练数据X<sub>s</sub>的标记信息Y<sub>s</sub>,找出属于第i个类别数据对应的所有源域训练数据点,组成集合X<sub>si</sub>=[x<sub>1</sub>,…,x<sub>Mi</sub>],i=1,…,C,然后通过以下公式计算集合X<sub>si</sub>的平均光谱u<sub>si</sub>做为源域第i类类别数据类心:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>u</mi><mrow><mi>s</mi><mi>i</mi></mrow></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>M</mi><mi>i</mi></msub></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>M</mi><mi>i</mi></msub></munderover><msub><mi>X</mi><mrow><mi>s</mi><mi>j</mi></mrow></msub><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>C</mi></mrow>]]></math><img file="FDA0000851544580000011.GIF" wi="534" he="151" /></maths>其中,x<sub>sj</sub>为集合X<sub>si</sub>中的数据点;(5)利用目标域图像数据X<sub>t</sub>和其预测结果Y<sub>t</sub><sup>l</sup>,计算C个类别数据的类心U<sub>t</sub><sup>l</sup>=[u<sub>t1</sub>,…,u<sub>tC</sub>],包括以下过程:首先根据目标域图像数据X<sub>t</sub>的预测标记信息Y<sub>t</sub><sup>l</sup>,找出属于第i个类别数据的所有目标域图像数据点,组成集合X<sub>ti</sub>=[x<sub>1</sub>,…,x<sub>Ni</sub>],i=1,…,C,然后通过以下公式计算集合X<sub>ti</sub>的平均光谱u<sub>ti</sub>做为目标域第i类类心:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>u</mi><mrow><mi>t</mi><mi>i</mi></mrow></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>i</mi></msub></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>i</mi></msub></munderover><msub><mi>X</mi><mrow><mi>t</mi><mi>j</mi></mrow></msub><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>C</mi></mrow>]]></math><img file="FDA0000851544580000012.GIF" wi="518" he="151" /></maths>其中,x<sub>tj</sub>为集合X<sub>ti</sub>中的数据点;(6)通过以下公式计算源域和目标域每个类别数据的类心差:d<sub>i</sub>=u<sub>ti</sub>‑u<sub>si</sub>,i=1,…,C其中d<sub>i</sub>为第i个类别数据的类心差;(7)对于目标域内任一样本点x<sub>t</sub>,t=1,…,N,利用基于光谱角制图距离度量方法在目标域图像数据中搜索x<sub>t</sub>的k个近邻点构成x<sub>t</sub>的近邻点集X=[x<sub>1</sub>,...,x<sub>k</sub>],x<sub>t</sub>的近邻点集X包括x<sub>t</sub>本身,这k个近邻点的预测标记结果为Y=[y<sub>1</sub>,...,y<sub>k</sub>];(8)对于目标域任一样本点x<sub>t</sub>,t=1,…,N,计算其移动方向d:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>d</mi><mo>=</mo><mfrac><mn>1</mn><mi>k</mi></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>k</mi></munderover><mi>&delta;</mi><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>,</mo><mi>j</mi><mo>)</mo></mrow><msub><mi>d</mi><mi>j</mi></msub></mrow>]]></math><img file="FDA0000851544580000021.GIF" wi="422" he="151" /></maths>其中δ为克罗内克函数,y<sub>i</sub>是x<sub>t</sub>的第i个近邻点x<sub>i</sub>的预测标签,d<sub>j</sub>是第j个类别数据的类心差,如果x<sub>i</sub>被预测为第j类,即y<sub>i</sub>等于j,那么函数δ(y<sub>i</sub>,j)=1,否则等于0;(9)将目标域样本点x<sub>t</sub>,t=1,…,N,按照其移动方向d移动,移动后的目标域样本点的光谱特征x<sub>ts</sub>为x<sub>ts</sub>=x<sub>t</sub>‑d,t=1,…,N;(10)更新迭代参数l使其累加1,利用步骤(2)训练得到的分类器对移动后的目标域图像数据x<sub>ts</sub>,t=1,…,N进行预测,得到新的分类结果Y<sub>t</sub><sup>l</sup>;(11)重复步骤(5)到步骤(10)至少5次,直到达到收敛条件,输出最后一次分类结果Y<sub>t</sub><sup>l</sup>;所述收敛条件为:连续5次分类结果Y<sub>t</sub><sup>l</sup>对应的总体分类精度的变化小于阈值T,总体分类精度为Y<sub>t</sub><sup>l</sup>和Y<sub>t</sub>中相同元素的个数除以N,阈值T在0.001~0.01范围内选择。
地址 430074 湖北省武汉市洪山区鲁磨路388号