一种移动终端上的恶意应用软件的检测方法,申请号CN201310029515.X-传众专利搜索

发明名称	一种移动终端上的恶意应用软件的检测方法
摘要	一种移动终端上的恶意应用软件的检测方法用于手机信息安全领域，其特征在于：首先，采用放回的抽样方法从正常的应用下载软件中独立的抽取多个样本子集，每次随机抽取的样本数量与恶意的应用下载软件的数量相同。这些子集分别与恶意的应用下载软件结合，组成一系列新的训练样本子集；之后，解压新的训练样本子集中的各个样本文件，读取可执行文件和配置文件的内容，进而采用特征选择算法抽取能够代表样本文件的特征，得到特征子集；紧接着，选取在所有特征子集均出现的特征组合得到最终的特征集；然后对训练样本集中的样本重新训练，得到特征向量；最后，通过贝叶斯等分类算法进行分类，检测恶意应用软件。
申请公布号	CN103106365A	申请公布日期	2013.05.15
申请号	CN201310029515.X	申请日期	2013.01.25
申请人	北京工业大学	发明人	赖英旭;乔静静;杨震;刘静;李健;徐壮壮
分类号	G06F21/56(2013.01)I	主分类号	G06F21/56(2013.01)I
代理机构	北京思海天达知识产权代理有限公司 11203	代理人	楼艮基
主权项	1.一种移动终端上的恶意应用软件的检测方法，其特征在于是在计算机中一次按以下步骤实现的：步骤(1)、利用杀毒软件对手机的应用软件进行分类从网络上搜集手机应用的下载软件，分别利用卡巴斯基杀毒软件、网秦在线安全检测软件、360手机安全检测软件以及安全侠在线检测软件共四款杀毒软件对手机上的应用下载软件进行检测，得到正常应用软件和恶意应用软件两种类型；从中选取4份正常应用软件作为正常训练样本集，选取4份恶意应用软件作为恶意训练样本集，余下的一份正常应用软件作为正常测试样本集，余下的一份恶意应用软件作为恶意测试样本集；步骤（2）、按以下步骤利用相关性CHI算法从正常、恶意训练样本集中每个训练样本中提取共有的字符串信息作为特征集中的特征步骤（2.1）按以下步骤生成S个训练样本子集，利用所述的相关性CHI算法得到S个特征子集，S是对所述训练样本子集进行放回抽样的次数；步骤（2.1.1）从步骤(1)中所述的正常应用软件中随机抽取n<sub>1</sub>个样本构成正常训练样本子集，从所述的恶意应用软件中随机抽取n<sub>2</sub>个样本构成恶意训练样本子集，n<sub>1</sub>＝n<sub>2</sub>，两者组合成一个新的训练样本子集，有n<sub>1</sub>+n<sub>2</sub>个样本；步骤（2.1.2）对所述新的训练样本子集中的每个训练样本进行解压缩，从可执行文件中获取应用程序所需调用的系统库函数和该系统库函数所属的类名称，以及两者所对应的字符串信息，从配置文件中获得应用程序向系统申请的访问权限所对应的字符串信息，各除去重复的字符串信息后，得到各自惟一的字符串信息，经过拼合后，用N表示字符串信息的总数；步骤（2.1.3）统计步骤（2.1.2）中两种字符串信息拼合成后的N个字符串信息t在所述正常训练样本子集中共同出现的样本数m<sub>1</sub>，以及在所述恶意样本中集中共同出现的样本数m<sub>2</sub>，其中t简称为特征；步骤（2.1.4）按以下公式分别计算相关性步骤（2.1.4.1）按以下公式计算所述字符串信息t与正常类别C<sub>1</sub>的相关性，用CHI(t,C<sub>1</sub>)表示：<maths num="0001"><![CDATA[<math><mrow><mi>CHI</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>n</mi><msup><mrow><mo>[</mo><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>×</mo><mi>P</mi><mrow><mo>(</mo><mover><mi>t</mi><mo>&OverBar;</mo></mover><mo>,</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>-</mo><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>×</mo><mi>P</mi><mrow><mo>(</mo><mover><mi>t</mi><mo>&OverBar;</mo></mover><mo>,</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>]</mo></mrow><mn>2</mn></msup></mrow><mrow><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>×</mo><mi>P</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>×</mo><mi>P</mi><mrow><mo>(</mo><mover><mi>t</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mo>×</mo><mi>P</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>其中，n为步骤(2.1.1)中训练样本子集中的样本数，n＝n<sub>1</sub>+n<sub>2</sub>；P(t,C<sub>i</sub>)为所述训练样本子集中出现特征t并且出现在类别C<sub>i</sub>的样本子集中的概率，i＝1,2，C<sub>1</sub>类别即步骤(2.1.3)中所述正常训练样本子集简称正常类别，C<sub>2</sub>类别即恶意训练样本子集简称恶意类别，其中：<maths num="0002"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><msub><mi>m</mi><mn>1</mn></msub><mrow><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub></mrow></mfrac><mo>,</mo></mrow></math>]]></maths><img file="FDA00002777007100023.GIF" wi="314" he="77" /><img file="FDA00002777007100024.GIF" wi="131" he="63" />为所述训练样本子集中出现特征t并且不出现在类别C<sub>i</sub>中的样本的概率，其中：<maths num="0003"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><mover><msub><mi>C</mi><mn>1</mn></msub><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mo>=</mo><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths><maths num="0004"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><mover><msub><mi>C</mi><mn>2</mn></msub><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mo>=</mo><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths><img file="FDA00002777007100027.GIF" wi="129" he="61" />为所述训练样本子集中属于类别C<sub>i</sub>但不包含特征t的样本的出现概率，其中：<maths num="0005"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><mover><mi>t</mi><mo>&OverBar;</mo></mover><mo>,</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>n</mi><mn>1</mn></msub><mo>-</mo><msub><mi>m</mi><mn>1</mn></msub></mrow><mrow><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub></mrow></mfrac><mo>,</mo></mrow></math>]]></maths><maths num="0006"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>n</mi><mn>2</mn></msub><mo>-</mo><msub><mi>m</mi><mn>2</mn></msub></mrow><mrow><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub></mrow></mfrac><mo>;</mo></mrow></math>]]></maths><img file="FDA000027770071000210.GIF" wi="130" he="63" />为所述训练样本子集中既不包含特征t又不属于类别C<sub>i</sub>的样本出现的概率，其中：<img file="FDA000027770071000211.GIF" wi="344" he="63" /><img file="FDA000027770071000212.GIF" wi="344" he="63" />P(t)为所述训练样本子集中包含特征t的样本的出现概率，<img file="FDA000027770071000213.GIF" wi="257" he="78" /><img file="FDA000027770071000214.GIF" wi="76" he="62" />为所述训练样本子集中不包含特征t的样本的出现概率，<img file="FDA000027770071000215.GIF" wi="419" he="84" />P(C<sub>i</sub>)为所述训练样本子集中属于类别C<sub>i</sub>的样本出现的概率，<img file="FDA000027770071000216.GIF" wi="276" he="76" /><img file="FDA000027770071000217.GIF" wi="285" he="75" /><img file="FDA000027770071000218.GIF" wi="98" he="63" />为所述训练样本子集中不属于类别C<sub>i</sub>的样本的出现概率，其中：<maths num="0007"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><mover><msub><mi>C</mi><mn>1</mn></msub><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mo>=</mo><mi>P</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><msub><mi>n</mi><mn>2</mn></msub><mrow><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub></mrow></mfrac><mo>,</mo></mrow></math>]]></maths><maths num="0008"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><mover><msub><mi>C</mi><mn>2</mn></msub><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mo>=</mo><mi>P</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><msub><mi>n</mi><mn>1</mn></msub><mrow><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub></mrow></mfrac><mo>,</mo></mrow></math>]]></maths>因而，<maths num="0009"><![CDATA[<math><mrow><mi>CHI</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow><msup><mrow><mo>[</mo><mfrac><msub><mi>m</mi><mn>1</mn></msub><mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mrow></mfrac><mo>×</mo><mfrac><mrow><mo>(</mo><msub><mi>n</mi><mn>2</mn></msub><mo>-</mo><msub><mi>m</mi><mn>2</mn></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>-</mo><mfrac><msub><mi>m</mi><mn>2</mn></msub><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>×</mo><mfrac><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>-</mo><msub><mi>m</mi><mn>1</mn></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>]</mo></mrow><mn>2</mn></msup></mrow><mrow><mfrac><mrow><mo>(</mo><msub><mi>m</mi><mn>1</mn></msub><mo>+</mo><msub><mi>m</mi><mn>2</mn></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>×</mo><mfrac><msub><mi>n</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>×</mo><mfrac><mrow><mo>(</mo><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>-</mo><mrow><mo>(</mo><msub><mi>m</mi><mn>1</mn></msub><mo>+</mo><msub><mi>m</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>×</mo><mfrac><msub><mi>n</mi><mn>2</mn></msub><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac></mrow></mfrac><mo>;</mo></mrow></math>]]></maths>步骤（2.1.4.2）按以下公式计算所述字符串信息t与恶意类别C<sub>2</sub>的相关性，用CHI(t,C<sub>2</sub>)表示：<maths num="0010"><![CDATA[<math><mrow><mi>CHI</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow><msup><mrow><mo>[</mo><mfrac><msub><mi>m</mi><mn>2</mn></msub><mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mrow></mfrac><mo>×</mo><mfrac><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>-</mo><msub><mi>m</mi><mn>1</mn></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>-</mo><mfrac><msub><mi>m</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>×</mo><mfrac><mrow><mo>(</mo><msub><mi>n</mi><mn>2</mn></msub><mo>-</mo><msub><mi>m</mi><mn>2</mn></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>]</mo></mrow><mn>2</mn></msup></mrow><mrow><mfrac><mrow><mo>(</mo><msub><mi>m</mi><mn>1</mn></msub><mo>+</mo><msub><mi>m</mi><mn>2</mn></msub><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>×</mo><mfrac><msub><mi>n</mi><mn>2</mn></msub><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>×</mo><mfrac><mrow><mo>(</mo><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>-</mo><mrow><mo>(</mo><msub><mi>m</mi><mn>1</mn></msub><mo>+</mo><msub><mi>m</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac><mo>×</mo><mfrac><msub><mi>n</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>n</mi><mn>1</mn></msub><mo>+</mo><msub><mi>n</mi><mn>2</mn></msub><mo>)</mo></mrow></mfrac></mrow></mfrac><mo>;</mo></mrow></math>]]></maths>步骤（2.1.5）按以下步骤构造特征子集步骤（2.1.5.1）对步骤（2.1.4.1）得到的CHI(t,C<sub>1</sub>)值由大到小排序，顺序选取N/2个字符串信息作为正常训练样本的特征；步骤（2.1.5.2）对步骤（2.1.4.2）得到的CHI(t,C<sub>2</sub>)值由大到小排序，顺序选取N/2个与步骤（2.1.5.1）所选取的N/2个字符串信息不同的字符串信息作为恶意训练样本的特征；步骤（2.1.5.3）把步骤（2.1.5.1）得到的N/2个正常训练样本的特征与从步骤（2.1.5.2）得到的N/2个恶意训练样本的特征合并得到N个字符串信息，作为特征选入特征子集；步骤（2.1.6）把步骤（2.1.1）得到的正常训练样本子集放回到步骤（2.1.1）所述的正常训练样本集中；步骤（2.1.7）重复操作步骤（2.1.1-2.1.6）S次，进行S次随机抽样，得到S个训练样本子集以及对应的S个特征子集，S是步骤（1）中所述的正常应用软件与恶意应用软件之间的数量比，设定S=20；步骤（2.2）把步骤（2.1.7）中得到的S个特征子集中均出现的特征组成最终的特征集中的特征步骤（3）、统计步骤（2.1.6）得到的各个特征t在所述的正常训练样本集中出现的样本数n(t,C<sub>1</sub>)，以及在所述恶意训练样本集中出现的样本数n(t,C<sub>2</sub>)步骤（4）、把步骤（3）中得到的n(t,C<sub>1</sub>)、n(t,C<sub>2</sub>)和所述正常训练样本集中的样本数n(C<sub>1</sub>)、恶意训练样本集中的样本数n(C<sub>2</sub>)保存步骤（5）、按以下步骤对步骤（1）中所述的从网络上搜集的手机应用下载软件中的测试软件进行分类检测验证，所述测试软件包括所述的一个恶意测试样本集步骤（5.1）计算属于类别C<sub>i</sub>的样本在训练样本集中出现的概率：<maths num="0011"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>n</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow></mrow><mrow><mi>n</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>+</mo><mi>n</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow></mrow></mfrac><mo>,</mo></mrow></math>]]></maths><maths num="0012"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>n</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow></mrow><mrow><mi>n</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>+</mo><mi>n</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow></mrow></mfrac><mo>;</mo></mrow></math>]]></maths>步骤（5.2）计算特征t<sub>k</sub>所在类别的条件概率P(t<sub>k</sub>\|C<sub>i</sub>)，是指类别C<sub>i</sub>中出现特征t<sub>k</sub>的样本在类别C<sub>i</sub>的样本集中出现的概率：<maths num="0013"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>t</mi><mi>k</mi></msub><mo>\|</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>n</mi><mrow><mo>(</mo><msub><mi>t</mi><mi>k</mi></msub><mo>,</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow></mrow><mrow><mi>n</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow></mrow></mfrac><mo>,</mo></mrow></math>]]></maths><maths num="0014"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>t</mi><mi>k</mi></msub><mo>\|</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>n</mi><mrow><mo>(</mo><msub><mi>t</mi><mi>k</mi></msub><mo>,</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow></mrow><mrow><mi>n</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow></mrow></mfrac><mo>;</mo></mrow></math>]]></maths>步骤（5.3）计算所述测试软件属于正常类别C<sub>1</sub>的概率P(C<sub>1</sub>\|F),F为特征t<sub>k</sub>的集合，k＝1,2...K，<maths num="0015"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>1</mn></msub><mo>\|</mo><mi>F</mi><mo>)</mo></mrow><mo>&Proportional;</mo><mi>P</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo></mo><msubsup><mi>Π</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></msubsup><mi>P</mi><mrow><mo>(</mo><msub><mi>t</mi><mi>k</mi></msub><mo>\|</mo><msub><mi>C</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>步骤（5.4）计算所述测试软件属于恶意类别C<sub>2</sub>的概率P(C<sub>2</sub>\|F),F为特征t<sub>k</sub>的集合，k＝1,2...K，<maths num="0016"><![CDATA[<math><mrow><mi>P</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>2</mn></msub><mo>\|</mo><mi>F</mi><mo>)</mo></mrow><mo>&Proportional;</mo><mi>P</mi><mrow><mo>(</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow><mo></mo><msubsup><mi>Π</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></msubsup><mi>P</mi><mrow><mo>(</mo><msub><mi>t</mi><mi>k</mi></msub><mo>\|</mo><msub><mi>C</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>步骤（5.5）对步骤（5.3）和步骤（5.4）得到的P(C<sub>1</sub>\|F)和P(C<sub>2</sub>\|F)进行比较，选取概率值较大者作为验证测试软件的类别，给出提示。
地址	100124 北京市朝阳区平乐园100号