发明名称 自动特征分析、比较和异常检测
摘要 公开了用于自动数据分析的新方法和系统。可自动地分析数据以确定在诸如视野分析和比较的不同应用中的特征。可通过对象的聚类检测在成组的对象之间的异常。
申请公布号 CN104769578A 申请公布日期 2015.07.08
申请号 CN201380058287.7 申请日期 2013.11.11
申请人 加州理工学院 发明人 沃尔夫冈·芬克
分类号 G06F17/00(2006.01)I 主分类号 G06F17/00(2006.01)I
代理机构 北京安信方达知识产权代理有限公司 11262 代理人 陆建萍;郑霞
主权项 一种计算机实施的方法,包括:提供感测和分析设备,所述感测和分析设备包括配置成检测描述多个物理对象的多个物理特征的多个传感器;通过所述感测和分析设备,基于所述多个物理特征产生表示多个对象的多个特征向量,其中,所述多个特征向量包括描述所述多个物理特征的多个分量,其中,所述多个分量的每个分量具有数值范围,其中,所述多个物理特征的每个物理特征由每个特征向量中的至少一个分量表示;通过所述感测和分析设备,将每个分量的所述数值范围转换至0和1之间的范围,其中,所述转换通过以下公式执行<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mrow><mi>F</mi><mn>1</mn></mrow><mi>ij</mi></msub><mo>=</mo><mfrac><mrow><msub><mi>OrigF</mi><mi>ij</mi></msub><mo>-</mo><msub><mi>MinF</mi><mi>j</mi></msub></mrow><mrow><msub><mi>MaxF</mi><mi>j</mi></msub><mo>-</mo><msub><mi>MinF</mi><mi>j</mi></msub></mrow></mfrac></mrow>]]></math><img file="FDA0000712804040000011.GIF" wi="491" he="159" /></maths>其中,F1<sub>ij</sub>是第i个对象和第j个特征分量的归一化的值,OrigF<sub>ij</sub>是第i个对象的第j个原特征分量值,MinF<sub>j</sub>和MaxF<sub>j</sub>是第j个特征分量的最小值和最大值,从而获得第一多个归一化特征向量,其包括第一多个归一化分量,且还包括所述第一多个归一化特征向量的每个第一归一化特征向量的每个物理特征的全部数量的分量;对于所述第一多个特征向量的每个第一归一化特征向量,由所述感测和分析设备将每个第一归一化特征向量的每个物理特征的所述多个归一化分量除以所述第一归一化特征向量的每个物理特征的分量的总数,从而获得第二多个归一化特征向量;由所述感测和分析设备通过以下公式归一化所述第二多个归一化特征向量:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mrow><mi>F</mi><mn>3</mn></mrow><mi>ij</mi></msub><mo>=</mo><mfrac><msub><mrow><mi>F</mi><mn>2</mn></mrow><mi>ij</mi></msub><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msup><mrow><mo>(</mo><msub><mrow><mi>F</mi><mn>2</mn></mrow><mi>ij</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></msqrt></mfrac></mrow>]]></math><img file="FDA0000712804040000012.GIF" wi="407" he="235" /></maths>其中,F2<sub>ij</sub>是所述第二多个归一化特征向量的特征向量的分量,且F3<sub>ij</sub>是第三多个归一化特征向量的每个特征向量的合成分量;通过所述感测和分析设备,聚类所述第三多个归一化特征向量,从而获得多个聚类的归一化特征向量;通过所述感测和分析设备将主分量分析应用到所述多个聚类的归一化特征向量,从而获得距离标志值和第一评估的多个归一化特征向量;通过所述感测和分析设备,基于阈值通过计数所述多个聚类的归一化特征向量的每个特征向量计算数量标志值,从而获得第二评估的多个归一化特征向量;通过所述感测和分析设备基于所述第一评估的多个归一化特征向量或所述第二评估的多个归一化特征向量分析所述多个物理对象。
地址 美国加利福尼亚州