发明名称 用于使用支持向量机分析流式细胞术数据的方法和系统
摘要 提供了一种用于接收流式细胞术数据的输入并使用一个或多个支持向量机分析所述数据以产生输出的自动方法和系统,其中,所述流式细胞术数据被分类成两种或多种类别。所述一个或多个支持向量机使用捕获输入数据内的分布式数据的内核。这种分布式内核通过使用两个分布之间的距离函数(散度)来构造。在优选的实施方案中,使用了基于Bhattacharya亲和性的内核。所述分布式内核应用于从被怀疑有骨髓增生异常综合症的患者获得的流式细胞术数据的分类。
申请公布号 CN101981446B 申请公布日期 2016.03.09
申请号 CN200980110847.2 申请日期 2009.02.08
申请人 医疗探索公司 发明人 宏·章
分类号 G01N33/50(2006.01)I;G06F17/50(2006.01)I;G06F17/40(2006.01)I 主分类号 G01N33/50(2006.01)I
代理机构 北京安信方达知识产权代理有限公司 11262 代理人 张瑞;郑霞
主权项 一种用于流式细胞术数据的分析和分类的方法,其中,所述流式细胞术数据包括描述所述流式细胞术数据的多个特征,所述方法包括:将包括流式细胞术数据的输入数据集下载到包括处理器和存储设备的计算机系统中,其中,所述处理器被编程以执行至少一个支持向量机,并执行以下步骤:使用一个或多个特征选择算法来预处理所述输入数据集的第一部分,以选择所述多个特征的特征子集;使用所选择的特征子集,使用所述输入数据集的所述第一部分来训练包括分布式内核的支持向量机;使用所选择的特征子集以所述输入数据集的第二部分检验所训练的支持向量机,以确定是否实现了最优解;如果未实现最优解,重复训练和检验的步骤直至达到最优解;一旦达到最优解,就将实时数据集输入到所述计算机系统中;使用所训练和所检验的支持向量机,使用所选择的特征子集来处理所述实时数据集,以产生包括所述流式细胞术数据到两个不同种类之一的分类的结果;以及在显示设备处产生具有流式细胞术数据分类的识别的输出显示;其中,所述分布式内核包括Bhattacharya亲和性,所述Bhattacharya亲和性具有以下形式:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>k</mi><mrow><mo>(</mo><mi>p</mi><mo>,</mo><mi>q</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>e</mi><mrow><mo>-</mo><mi>&rho;</mi><mrow><mo>(</mo><mi>p</mi><mo>,</mo><mi>q</mi><mo>)</mo></mrow></mrow></msup><mo>=</mo><msup><mrow><mo>(</mo><msqrt><mfrac><mrow><mo>|</mo><mrow><mo>(</mo><msub><mi>&Sigma;</mi><mn>1</mn></msub><mo>+</mo><msub><mi>&Sigma;</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>/</mo><mn>2</mn><mo>|</mo></mrow><msqrt><mrow><mo>|</mo><msub><mi>&Sigma;</mi><mn>1</mn></msub><mo>|</mo><mo>&CenterDot;</mo><mo>|</mo><msub><mi>&Sigma;</mi><mn>2</mn></msub><mo>|</mo></mrow></msqrt></mfrac></msqrt><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><mi>exp</mi><mo>{</mo><mo>-</mo><mfrac><mn>1</mn><mn>8</mn></mfrac><msup><mrow><mo>(</mo><msub><mi>M</mi><mn>2</mn></msub><mo>-</mo><msub><mi>M</mi><mn>1</mn></msub><mo>)</mo></mrow><mi>T</mi></msup><msup><mrow><mo>&lsqb;</mo><mfrac><mrow><msub><mi>&Sigma;</mi><mn>1</mn></msub><mo>+</mo><msub><mi>&Sigma;</mi><mn>2</mn></msub></mrow><mn>2</mn></mfrac><mo>&rsqb;</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><mrow><mo>(</mo><msub><mi>M</mi><mn>2</mn></msub><mo>-</mo><msub><mi>M</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>}</mo><mo>,</mo></mrow>]]></math><img file="FDA0000771467070000011.GIF" wi="1752" he="198" /></maths>其中,p和q是输入数据点,M是正态分布的平均值,并且∑是协方差矩阵。
地址 美国佐治亚州