一种用于遥感图像分类的基于类心对齐的迁移学方法,申请号CN201510799789.6-传众专利搜索

发明名称	一种用于遥感图像分类的基于类心对齐的迁移学方法
摘要	本发明提供了一种用于遥感图像分类的基于类心对齐的迁移学方法，(1)准备源域数据和目标域数据；(2)利用源域数据训练分类器；(3)利用分类器对目标域数据进行分类；(4)计算源域各类别数据的类心；(5)计算目标域各类别数据的类心；(6)计算源域和目标域各类别类心差；(7)对目标域的样本点，在目标域数据中搜索其k个近邻点；(8)计算目标域样本点移动方向；(9)计算移动后目标域数据；(10)利用分类器对移动后的目标域数据分类；(11)重复步骤(5)到(10)直到收敛。本发明使得移动后的目标域数据和源域数据光谱特征相似，达到迁移学的目的，多种遥感数据分类都表现良好适用性，具有明显的迁移学的效果。
申请公布号	CN105469109A	申请公布日期	2016.04.06
申请号	CN201510799789.6	申请日期	2015.11.19
申请人	中国地质大学（武汉）	发明人	马丽;祝蕾
分类号	G06K9/62(2006.01)I	主分类号	G06K9/62(2006.01)I
代理机构	武汉华旭知识产权事务所 42214	代理人	刘荣;江钊芳
主权项	一种用于遥感图像分类的基于类心对齐的迁移学习方法，其特征在于包括以下步骤：(1)选取源域图像中的训练数据X<sub>s</sub>以及目标域图像数据X<sub>t</sub>；其中X<sub>s</sub>是源域图像中的M个标记数据点的集合，每个数据点的维数是D，X<sub>s</sub>的标记信息表示为Y<sub>s</sub>，用M×1的向量表示，假设X<sub>s</sub>数据集中包含C种地物类型，其中第i种地物类型数据组成集合表示为X<sub>si</sub>，包含M<sub>i</sub>个数据点，那么X<sub>s</sub>＝[X<sub>s1</sub>,…,X<sub>sC</sub>]，M＝M<sub>1</sub>+M<sub>2</sub>+…+M<sub>C</sub>；X<sub>t</sub>是目标域图像中N个数据点的集合，每个数据点的维数是D，Xt数据集中也包含C种地物类型，其中第i种地物类型数据组成集合表示为X<sub>ti</sub>，包含N<sub>i</sub>个数据点，那么X<sub>t</sub>＝[X<sub>t1</sub>,…,X<sub>tC</sub>]，N＝N<sub>1</sub>+N<sub>2</sub>+…+N<sub>C</sub>；(2)用源域训练数据X<sub>s</sub>及其标记信息Y<sub>s</sub>训练分类器；(3)利用训练好的分类器对X<sub>t</sub>中的全部数据点进行预测，得到N个目标域图像数据X<sub>t</sub>的分类结果Y<sub>t</sub><sup>l</sup>，Y<sub>t</sub><sup>l</sup>是N×1的向量，其中l为当前迭代次数，初始值为1；(4)利用源域训练数据X<sub>s</sub>及其标记信息Y<sub>s</sub>，计算源域训练数据的C个类别数据的类心，表示为U<sub>s</sub>＝[u<sub>s1</sub>,…,u<sub>sC</sub>]，其中第i类类别数据的类心u<sub>si</sub>的计算包括以下过程：首先根据源域训练数据X<sub>s</sub>的标记信息Y<sub>s</sub>，找出属于第i个类别数据对应的所有源域训练数据点，组成集合X<sub>si</sub>＝[x<sub>1</sub>,…,x<sub>Mi</sub>]，i＝1,…,C，然后通过以下公式计算集合X<sub>si</sub>的平均光谱u<sub>si</sub>做为源域第i类类别数据类心：<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>u</mi><mrow><mi>s</mi><mi>i</mi></mrow></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>M</mi><mi>i</mi></msub></mfrac><munderover><mo>Σ</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>M</mi><mi>i</mi></msub></munderover><msub><mi>X</mi><mrow><mi>s</mi><mi>j</mi></mrow></msub><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>C</mi></mrow>]]></math><img file="FDA0000851544580000011.GIF" wi="534" he="151" /></maths>其中，x<sub>sj</sub>为集合X<sub>si</sub>中的数据点；(5)利用目标域图像数据X<sub>t</sub>和其预测结果Y<sub>t</sub><sup>l</sup>，计算C个类别数据的类心U<sub>t</sub><sup>l</sup>＝[u<sub>t1</sub>,…,u<sub>tC</sub>]，包括以下过程：首先根据目标域图像数据X<sub>t</sub>的预测标记信息Y<sub>t</sub><sup>l</sup>，找出属于第i个类别数据的所有目标域图像数据点，组成集合X<sub>ti</sub>＝[x<sub>1</sub>,…,x<sub>Ni</sub>]，i＝1,…,C，然后通过以下公式计算集合X<sub>ti</sub>的平均光谱u<sub>ti</sub>做为目标域第i类类心：<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>u</mi><mrow><mi>t</mi><mi>i</mi></mrow></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>i</mi></msub></mfrac><munderover><mo>Σ</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>i</mi></msub></munderover><msub><mi>X</mi><mrow><mi>t</mi><mi>j</mi></mrow></msub><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>C</mi></mrow>]]></math><img file="FDA0000851544580000012.GIF" wi="518" he="151" /></maths>其中，x<sub>tj</sub>为集合X<sub>ti</sub>中的数据点；(6)通过以下公式计算源域和目标域每个类别数据的类心差：d<sub>i</sub>＝u<sub>ti</sub>‑u<sub>si</sub>,i＝1,…,C其中d<sub>i</sub>为第i个类别数据的类心差；(7)对于目标域内任一样本点x<sub>t</sub>，t＝1,…,N，利用基于光谱角制图距离度量方法在目标域图像数据中搜索x<sub>t</sub>的k个近邻点构成x<sub>t</sub>的近邻点集X＝[x<sub>1</sub>,...,x<sub>k</sub>]，x<sub>t</sub>的近邻点集X包括x<sub>t</sub>本身，这k个近邻点的预测标记结果为Y＝[y<sub>1</sub>,...,y<sub>k</sub>]；(8)对于目标域任一样本点x<sub>t</sub>，t＝1,…,N，计算其移动方向d：<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>d</mi><mo>=</mo><mfrac><mn>1</mn><mi>k</mi></mfrac><munderover><mo>Σ</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>C</mi></munderover><munderover><mo>Σ</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>k</mi></munderover><mi>δ</mi><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>,</mo><mi>j</mi><mo>)</mo></mrow><msub><mi>d</mi><mi>j</mi></msub></mrow>]]></math><img file="FDA0000851544580000021.GIF" wi="422" he="151" /></maths>其中δ为克罗内克函数，y<sub>i</sub>是x<sub>t</sub>的第i个近邻点x<sub>i</sub>的预测标签，d<sub>j</sub>是第j个类别数据的类心差，如果x<sub>i</sub>被预测为第j类，即y<sub>i</sub>等于j，那么函数δ(y<sub>i</sub>,j)＝1，否则等于0；(9)将目标域样本点x<sub>t</sub>，t＝1,…,N，按照其移动方向d移动，移动后的目标域样本点的光谱特征x<sub>ts</sub>为x<sub>ts</sub>＝x<sub>t</sub>‑d，t＝1,…,N；(10)更新迭代参数l使其累加1，利用步骤(2)训练得到的分类器对移动后的目标域图像数据x<sub>ts</sub>，t＝1,…,N进行预测，得到新的分类结果Y<sub>t</sub><sup>l</sup>；(11)重复步骤(5)到步骤(10)至少5次，直到达到收敛条件，输出最后一次分类结果Y<sub>t</sub><sup>l</sup>；所述收敛条件为：连续5次分类结果Y<sub>t</sub><sup>l</sup>对应的总体分类精度的变化小于阈值T，总体分类精度为Y<sub>t</sub><sup>l</sup>和Y<sub>t</sub>中相同元素的个数除以N，阈值T在0.001～0.01范围内选择。
地址	430074 湖北省武汉市洪山区鲁磨路388号