发明名称 集成分类器及该装置的分类方法
摘要 集成分类器及该装置的分类方法,本发明涉及集成分类器及该装置的分类方法。本发明为了解决现有空间栅格数据监督分类领域中存在速度慢、精度低、属性子集具有偏置特性以及属性子集为非确定多项式的问题。本发明采用属性划分方式,将训练数据子集与并行计算技术结合起来,且能应用于高纬度栅格数据;并采用模糊粗糙集理论作为高纬度属性并行划分的标准,使得每个子集即有自己独立特性,又保持了决策完整性,适应于离散型、连续型的异构数据。本发明应用于遥感与地理信息系统领域。
申请公布号 CN102930290B 申请公布日期 2015.08.19
申请号 CN201210379640.9 申请日期 2012.10.09
申请人 中国科学院东北地理与农业生态研究所 发明人 张淑清;潘欣;张策;姜春雷
分类号 G06K9/62(2006.01)I;G06F9/38(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 哈尔滨市松花江专利商标事务所 23109 代理人 牟永林
主权项 集成分类器的分类方法,其特征在于,它包括下述步骤:步骤一、采用多进程和多线程组合的方式读取待处理的栅格数据,具体过程包括如下步骤:A、输入集成分类器的子分类器个数n;n为子分类器的个数,n大于等于2,通过期望算法将栅格数据的所有空间属性按照决策能力分为n份,每个分类器均具备全集全部的分类能力,B、启动n+1个进程;其中,n+1个进程为Rank 0、Rank 1…Rank n;Rank0为管理进程,Rank 1…Rankn均为运算进程,运算进程Rank 1…Rank n分别与n个子分类器一一对应,C、在当前进程为管理进程Rank 0时,构造空的粗糙关系表,将待处理的栅格数据均匀划分给每个运算进程;启动n个线程,每个线程单独对应一个运算进程;其中,线程包括第1线程、第2线程…第n线程,D、在当前进程为运算进程时,每个进程均同时读取待处理的栅格数据;步骤二、管理进程Rank0维护属性离散化区间表,并将该属性离散化区间表均匀划分给多个线程,所述多个线程同时启动对相应的空间连续属性的栅格数据进行离散化;步骤三、管理进程Rank0将空间属性均匀分给n个运算进程处理,并收集n个运算进程的处理结果、构建完整的粗糙关系表,将该粗糙关系表发给每个运算进程,每个运算进程根据粗糙关系表建立一个属性子集;所述步骤三中每个运算进程根据粗糙关系表建立一个属性子集的具体步骤为:步骤三一、在所述运算进程的粗糙关系表中随机选择一对粗糙关系不相关的属性,该属性的状态为“未使用”,将该属性加入所述运算进程的属性子集中,该子集为与所述运算进程一一对应的子集,并将其标记为“已使用”,属性的状态为“已使用”或“未使用”;步骤三二、在所述运算进程中,根据公式(8)计算每一对“未使用”的属性与所述运算进程的属性子集的关系,属性与属性子集的粗糙关系为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>RTD</mi><mo>=</mo><munderover><mi>&Sigma;</mi><mn>1</mn><mi>n</mi></munderover><msub><mi>RT</mi><mrow><mo>(</mo><mi>b</mi><mo>,</mo><mi>an</mi><mo>)</mo></mrow></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000681272800000011.GIF" wi="1019" he="138" /></maths>其中,b表示所述运算进程的属性子集,an表示任意一对“未使用”的属性,RT<sub>(b,an)</sub>表示所述运算进程的属性子集与任意一对“未使用”的属性的粗糙关系;步骤三三、选出计算结果最小的属性,将该属性加入到所述运算进程的属性子集中,并将所述运算进程的属性子集标记为“已使用”;步骤三四、根据公式(6)计算所述运算进程的属性子集与维度全集D的关系;<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>&gamma;</mi><mi>D</mi></msub><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>Card</mi><mrow><mo>(</mo><munder><mi>U</mi><mrow><mi>X</mi><mo>&Subset;</mo><mi>IND</mi><mrow><mo>(</mo><mi>w</mi><mo>)</mo></mrow></mrow></munder><msub><mi>POS</mi><mi>D</mi></msub><mrow><mo>(</mo><mi>X</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><mi>Card</mi><mrow><mo>(</mo><mi>U</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000681272800000021.GIF" wi="1373" he="164" /></maths>其中,w表示所述运算进程的属性子集,IND(w)为w子集所对应的不可区分关系,Card(U)为计算集合的秩,POS<sub>D</sub>(X)为X对应于D的正域;步骤三五、当γ<sub>D</sub>(w)=1时,输出所述运算进程的属性子集;步骤三六、当γ<sub>D</sub>(w)=0时,在所述运算进程中,根据公式(8)计算每一对“未使用”的属性与所述运算进程的属性子集的关系;步骤四、管理进程Rank0将每个运算进程根据所对应的属性子集进行并行训练子分类器产生模型,该子分类器为与所述的进程一一对应的子分类器,每个子分类器进行预测该子分类器对应的属性子集的类型,统计所有子分类器预测结果,以投票选举的方式选取投票最多的预测结果。
地址 150081 黑龙江省哈尔滨市南岗区哈平路138号