发明名称 |
一种基于标签传播的样本关联性检测方法及系统 |
摘要 |
本发明提出一种基于标签传播的样本关联性检测方法及系统,包括:获取样本集,并计算样本集在各维度的特征及关联度,以样本及样本特征为节点,以具有关联度的样本及节点的连线围边构建关联网络图,获取待检测样本的特征,并将其嵌入关联网络图,计算待检测样本在新关联网络图中与各连线上样本的权值乘积,若大于预设值,则输出对应连线上的样本。通过本发明的方法,能够利用代码及样本属性进行更多信息的判断,关联关系更准确,启发性更强。能够有效的输出具有关联性的样本,用于进一步判断待检测样本是否为仿冒文件,对恶意代码的检测具有辅助作用。 |
申请公布号 |
CN105975852A |
申请公布日期 |
2016.09.28 |
申请号 |
CN201511015286.1 |
申请日期 |
2015.12.31 |
申请人 |
武汉安天信息技术有限责任公司 |
发明人 |
张路;潘宣辰 |
分类号 |
G06F21/55(2013.01)I |
主分类号 |
G06F21/55(2013.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于标签传播的样本关联性检测方法,其特征在于,包括:收集已知白样本文件及黑样本文件,组成样本集;对样本集在多个维度进行特征提取;分别计算样本集中两样本间的关联度,如果相似度大于预设值,则两样本间具有关联性,否则两样本间不具有关联性;分别判断样本集中各样本在各维度上特征是否相同;如果是,则认为样本在对应维度上的特征具有关联性,并给出各关联特征间的权值;否则样本在对应维度上不具有关联性;根据样本间及样本在对应维度上特征的关联性,以样本及特征为节点,以具有关联性的样本及特征的连线为边,构建关联网络图;获取待检测样本在各维度上的特征,并计算待检测样本与样本集中样本的关联度,将所述特征及样本嵌入构建的关联网络图,连线构成新关联网络图;计算待检测样本在新关联网络图中与各连线上样本的权值乘积,并判断所述权值乘积是否超过预设值,如果超过预设值,则向用户输出对应连线上的特征所对应的样本。 |
地址 |
430000 湖北省武汉市东湖新技术开发区软件园东路1号软件产业4.1期B4栋12层01室 |