发明名称 一种局部分块的一类支持向量数据描述方法
摘要 一种局部分块的一类支持向量数据描述方法,通过局部分块和局部样本重构,使异常数据检测方法能够捕捉数据的全局几何结构,而且具备揭示数据局部几何结构信息的能力,具有较好监测异常数据的性能优势。
申请公布号 CN103870682A 申请公布日期 2014.06.18
申请号 CN201410071393.5 申请日期 2014.02.28
申请人 湖州师范学院 发明人 蒋云良;胡文军;王培良;陶剑文;楼俊钢;皋军
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 杭州宇信知识产权代理事务所(普通合伙) 33231 代理人 张宇娟
主权项 1.一种局部分块的一类支持向量数据描述方法,其特征在于:包括如下步骤:步骤1:对样本集X=(x<sub>1</sub>,…,x<sub>N</sub>)进行局部分块,得到各个局部分块P<sub>i</sub>(i=1,…,N),具体方法为:把x<sub>i</sub>对应最近邻个数K的最近邻样本集<img file="FDA0000471104070000011.GIF" wi="272" he="66" />所构成的局部区域称为x<sub>i</sub>在样本集X上的一个局部分块,其中,<img file="FDA0000471104070000012.GIF" wi="72" he="61" />表示x<sub>i</sub>的第p个最近邻样本点;步骤2:计算重构系数<maths num="0001"><![CDATA[<math><mrow><msub><mi>w</mi><mi>i</mi></msub><mo>=</mo><msup><mrow><mo>(</mo><msubsup><mi>w</mi><mi>i</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>/</mo><munderover><mi>&Sigma;</mi><mrow><mi>p</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>w</mi><mi>i</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow></msubsup><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msubsup><mi>w</mi><mi>i</mi><mrow><mo>(</mo><mi>N</mi><mo>)</mo></mrow></msubsup><mo>/</mo><munderover><mi>&Sigma;</mi><mrow><mi>p</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>w</mi><mi>i</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mi>T</mi></msup><mo>,</mo></mrow></math>]]></maths>其中,x<sub>i</sub>的局部重构系数<maths num="0002"><![CDATA[<math><mrow><msubsup><mi>w</mi><mi>i</mi><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mfrac><msup><mrow><mo>|</mo><mo>|</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>x</mi><mi>p</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup><mi>h</mi></mfrac><mo>)</mo></mrow><mo>,</mo></mtd><mtd><msub><mi>x</mi><mi>p</mi></msub><mo>&Element;</mo><msub><mi>P</mi><mi>i</mi></msub></mtd></mtr><mtr><mtd><mn>0</mn><mo>,</mo></mtd><mtd><msub><mi>x</mi><mi>p</mi></msub><mo>&NotElement;</mo><msub><mi>P</mi><mi>i</mi></msub></mtd></mtr></mtable></mfenced><mo>,</mo></mrow></math>]]></maths>h为热核参数,得到重构系数矩阵W=(W<sub>1</sub>,…W<sub>N</sub>),用来权衡局部分块内不同样本对该局部区域内在几何结构的贡献程度;步骤3:通过核函数<img file="FDA0000471104070000015.GIF" wi="655" he="65" />计算核矩阵K,其中<img file="FDA0000471104070000016.GIF" wi="513" he="65" />k(·,·)为核函数;步骤4:设定核化模型:<maths num="0003"><![CDATA[<math><mrow><msup><mrow><mi>min</mi><mi>R</mi></mrow><mn>2</mn></msup><mo>+</mo><mi>C</mi><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>&xi;</mi><mi>i</mi></msub></mrow></math>]]></maths><img file="FDA00004711040700000110.GIF" wi="799" he="167" />其中<img file="FDA00004711040700000111.GIF" wi="567" he="165" />通过拉格朗日获得所述核化模型的对偶形式:<maths num="0004"><![CDATA[<math><mfenced open='' close=''><mtable><mtr><mtd><msup><mrow><mi>min</mi><mi>&alpha;</mi></mrow><mi>T</mi></msup><mrow><mo>(</mo><msup><mi>W</mi><mi>T</mi></msup><mi>KW</mi><mo>)</mo></mrow><mi>&alpha;</mi><mo>-</mo><msup><mi>&alpha;</mi><mi>T</mi></msup><mi>diag</mi><mrow><mo>(</mo><msup><mi>W</mi><mi>T</mi></msup><mi>KW</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><msup><mi>&alpha;</mi><mi>T</mi></msup><mn>1</mn><mo>=</mo><mn>1</mn><mo>,</mo></mtd></mtr><mtr><mtd><mn>0</mn><mo>&le;</mo><msub><mi>&alpha;</mi><mi>i</mi></msub><mo>&le;</mo><mi>C</mi><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mi>N</mi><mo>.</mo></mtd></mtr></mtable></mfenced></math>]]></maths>步骤5:将步骤2得到的重构系数矩阵和步骤3得到的核矩阵代入步骤4的对偶形式,得到拉格朗日乘子向量α:α=(α<sub>1</sub>,…,α<sub>N</sub>)<sup>T</sup>;步骤6:根据决策函数f(x)=R<sup>2</sup>+2[k(x,x<sub>1</sub>),…,k(x,x<sub>N</sub>)]Wα-k(x,x)-α<sup>T</sup>(W<sup>T</sup>KW)α对未知样本x进行决策,其中<img file="FDA0000471104070000021.GIF" wi="432" he="88" />核化后的球心:<img file="FDA0000471104070000022.GIF" wi="605" he="121" />w<sub>s</sub>是拉格朗日乘子α<sub>s</sub>满足0<α<sub>s</sub><C条件所对应样本点x<sub>s</sub>的重构系数向量,若f(x)≥0,则x为正常样本,否则为异常样本。
地址 313000 浙江省湖州市学士路1号