发明名称 一种基于代表性样本的增强型关系分类器
摘要 本发明涉及一种基于代表性样本的增强型关系分类器。该方法主要包含两步:首先,根据样本的聚类隶属度挑选出具有代表性的样本构成新的训练样本集合X<sub>new</sub>;然后,针对X<sub>new</sub>的聚类隶属度和类别隶属度,采用φ复合算子构建模糊关系矩阵R。本发明的主要特色有以下三点:(1)矩阵R可揭示出聚类和类别间的内在逻辑关系;(2)矩阵R的计算复杂度从O(NLc)降至O(MLc),其中L为类别个数,c为聚类个数,N是原始数据集X的样本个数,M是X<sub>new</sub>的样本个数,并且N>M;(3)当样本空间的某些区域不存在足够判别信息时,分类器将拒绝对落入该区域的测试样本做出决策,从而保证分类结果的可信度。
申请公布号 CN102799902A 申请公布日期 2012.11.28
申请号 CN201210287636.X 申请日期 2012.08.13
申请人 南京师范大学 发明人 蔡维玲
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南京知识律师事务所 32207 代理人 李媛媛
主权项 1.一种基于代表性样本的增强型关系分类器,其特征在于包括以下步骤:步骤1:采用无监督的模糊C均值产生聚类隶属度矩阵U和聚类中心V;步骤2:根据所有样本的聚类隶属度矩阵U,确定具有代表性的样本集合X<sub>new</sub>,具体方法是:根据聚类隶属度集合{u<sub>ij</sub>},对训练样本集合X进行硬划分,形成c个样本子集合C<sub>j</sub>;在每个样本子集合C<sub>j</sub>中,样本按照其对第j个聚类的隶属度值从大到小排列;在排列后的样本子集合C<sub>j</sub>中,选择聚类隶属度较大的前λ%样本形成代表性的样本集合<img file="FDA00002004548800011.GIF" wi="203" he="56" />λ∈(0,1);步骤3:根据代表性的样本集合X<sub>new</sub>的聚类隶属度及其类标号,利用φ复合算子建立聚类与类别间的模糊关系矩阵R,具体方法是:首先,利用φ复合算子计算代表性的样本集合X<sub>new</sub>中的每个样本点对应的关系矩阵R<sub>i</sub>:(r<sub>jl</sub>)<sub>i</sub>=min(1,1-u<sub>ji</sub>+y<sub>li</sub>),l=1,2,…,L,j=1,2,…,c    (1)其中y<sub>li</sub>为第i个样本对第l个类别的隶属度,其值由下式确定:<img file="FDA00002004548800012.GIF" wi="1185" he="142" />其次,通过模糊合成算子可将所有样本对应的关系矩阵R<sub>i</sub>聚合成最终的关系矩阵<img file="FDA00002004548800013.GIF" wi="206" he="103" />其中每个元素通过最小化函数来计算:<maths num="0001"><![CDATA[<math><mrow><msub><mi>r</mi><mi>jl</mi></msub><mo>=</mo><munder><mi>min</mi><mrow><mi>i</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>N</mi></mrow></munder><mo>[</mo><msub><mrow><mo>(</mo><msub><mi>r</mi><mi>jl</mi></msub><mo>)</mo></mrow><mi>i</mi></msub><mo>]</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow></math>]]></maths>步骤4:根据测试样本x与聚类中心V之间的距离计算该样本对所有聚类的隶属度<maths num="0002"><![CDATA[<math><mrow><msub><mover><mi>u</mi><mo>^</mo></mover><mi>x</mi></msub><mo>=</mo><mo>[</mo><msub><mover><mi>u</mi><mo>^</mo></mover><mrow><mn>1</mn><mi>x</mi></mrow></msub><mo>,</mo><msub><mover><mi>u</mi><mo>^</mo></mover><mrow><mn>2</mn><mi>x</mi></mrow></msub><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><msub><mover><mi>u</mi><mo>^</mo></mover><mi>jx</mi></msub><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><msub><mover><mi>u</mi><mo>^</mo></mover><mi>cx</mi></msub><mo>]</mo><mo>:</mo></mrow></math>]]></maths><maths num="0003"><![CDATA[<math><mrow><msub><mover><mi>u</mi><mo>^</mo></mover><mi>jx</mi></msub><mo>=</mo><mfrac><msup><mrow><mo>|</mo><mo>|</mo><mi>x</mi><mo>-</mo><msub><mi>v</mi><mi>j</mi></msub><mo>|</mo><mo>|</mo></mrow><mrow><mo>-</mo><mn>2</mn><mo>/</mo><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></msup><mrow><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><msup><mrow><mo>|</mo><mo>|</mo><mi>x</mi><mo>-</mo><msub><mi>v</mi><mi>j</mi></msub><mo>|</mo><mo>|</mo></mrow><mrow><mo>-</mo><mn>2</mn><mo>/</mo><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></msup></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中<img file="FDA00002004548800017.GIF" wi="50" he="48" />表示测试样本x对第j个聚类的隶属度;步骤5:利用隶属度<img file="FDA00002004548800018.GIF" wi="41" he="46" />和关系矩阵R计算测试样本x的类别隶属度<maths num="0004"><![CDATA[<math><mrow><msub><mover><mi>y</mi><mo>^</mo></mover><mi>x</mi></msub><mo>=</mo><mo>[</mo><msub><mover><mi>y</mi><mo>^</mo></mover><mrow><mn>1</mn><mi>x</mi></mrow></msub><mo>,</mo></mrow></math>]]></maths><maths num="0005"><![CDATA[<math><mrow><msub><mover><mi>y</mi><mo>^</mo></mover><mrow><mn>2</mn><mi>x</mi></mrow></msub><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><msub><mover><mi>y</mi><mo>^</mo></mover><mi>lx</mi></msub><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><msub><mover><mi>y</mi><mo>^</mo></mover><mi>Lx</mi></msub><mo>]</mo><mo>:</mo></mrow></math>]]></maths><img file="FDA000020045488000111.GIF" wi="1132" he="54" />其中°<sub>T</sub>为sup-t复合算子,类别隶属度<img file="FDA000020045488000112.GIF" wi="41" he="50" />中的每个元素按下式计算:<maths num="0006"><![CDATA[<math><mrow><msub><mover><mi>y</mi><mo>^</mo></mover><mi>lx</mi></msub><mo>=</mo><munder><mi>max</mi><mrow><mn>1</mn><mo>&le;</mo><mi>j</mi><mo>&le;</mo><mi>c</mi></mrow></munder><mo>[</mo><mi>max</mi><mrow><mo>(</mo><msub><mover><mi>u</mi><mo>^</mo></mover><mi>jx</mi></msub><mo>+</mo><msub><mi>r</mi><mi>jl</mi></msub><mo>-</mo><mn>1</mn><mo>,</mo><mn>0</mn><mo>)</mo></mrow><mo>]</mo><mo>,</mo><mi>l</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>L</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow></math>]]></maths>步骤6:根据类别隶属度<img file="FDA00002004548800022.GIF" wi="59" he="50" />用最大化算子获得测试样本x的类标号<img file="FDA00002004548800023.GIF" wi="344" he="82" />最后输出所述类别号。
地址 210046 江苏省南京市栖霞区文苑路1号