主权项 |
1.一种对期货市场客户异常的识别方法,其特征在于:它包括以下步骤:步骤一:获取G个客户的注册信息和交易数据,PF<sub>k</sub>表示第k个客户,G为大于600的整数,k=1,2,3……G;步骤二:根据G个客户的注册信息和交易数据,提取每个客户的特征量F<sub>k</sub>(l),其中l为整数,l=1,2,3……24;步骤三:根据客户的特征量F<sub>k</sub>(l),用p范数距离来度量客户PF<sub>b</sub>和客户PF<sub>g</sub>之间的相似距离Dist(PF<sub>b</sub>,PF<sub>g</sub>):<maths num="0001"><![CDATA[<math><mrow><mi>Dist</mi><mrow><mo>(</mo><msub><mi>PF</mi><mi>b</mi></msub><mo>,</mo><msub><mi>PF</mi><mi>g</mi></msub><mo>)</mo></mrow><mo>=</mo><msup><mrow><mo>(</mo><munderover><mi>Σ</mi><mrow><mi>l</mi><mo>=</mo><mn>1</mn></mrow><mn>24</mn></munderover><msub><mi>a</mi><mi>l</mi></msub><msup><mrow><mo>|</mo><mo>|</mo><msub><mi>F</mi><mi>b</mi></msub><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>F</mi><mi>g</mi></msub><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow><mo>|</mo><mo>|</mo></mrow><mi>p</mi></msup><mo>)</mo></mrow><mfrac><mn>1</mn><mi>p</mi></mfrac></msup><mo>,</mo></mrow></math>]]></maths>式中a<sub>l</sub>为所述客户PF<sub>b</sub>和客户PF<sub>g</sub>的第l个特征量的距离计算权值,取a<sub>l</sub>为预置向量<img file="FDA0000116043370000012.GIF" wi="34" he="40" />的第l个维度量,预置向量<img file="FDA0000116043370000013.GIF" wi="34" he="40" />为24维度的特征权向量;b=1,2...,G,g=1,2...,G,建立全局距离矩阵D<sub>G×G</sub>:<img file="FDA0000116043370000014.GIF" wi="1371" he="362" />步骤四:建立有效性矩阵A<sub>G×G</sub>和反馈矩阵R<sub>G×G</sub>,同时根据客户PF<sub>b</sub>和客户PF<sub>g</sub>之间的相似距离Dist(PF<sub>b</sub>,PF<sub>g</sub>)获得每个客户PF<sub>k</sub>所归属的聚类中心样本fc<sub>k</sub>:<maths num="0002"><![CDATA[<math><mrow><mrow><msub><mi>fc</mi><mi>k</mi></msub><mo>=</mo><munder><mi>arg</mi><mi>f</mi></munder><mi>max</mi><mo>{</mo><mi>a</mi><mrow><mo>(</mo><mi>k</mi><mo>,</mo><mi>f</mi><mo>)</mo></mrow><mo>+</mo><mi>r</mi><mrow><mo>(</mo><mi>k</mi><mo>,</mo><mi>f</mi><mo>)</mo></mrow><mo>}</mo></mrow><mo>,</mo></mrow></math>]]></maths>式中a(k,f)为有效性矩阵A<sub>G×G</sub>中的第k行元素,r(k,f)为反馈矩阵R<sub>G×G</sub>中的第k行元素;步骤五:将具有相同聚类中心样本fc<sub>k</sub>的客户PF<sub>k</sub>归为一类聚类客户,将含有客户数量最少的聚类客户,判定为异常。 |