发明名称 一种基于标签传播的样本关联性检测方法及系统
摘要 本发明提出一种基于标签传播的样本关联性检测方法及系统,包括:获取样本集,并计算样本集在各维度的特征及关联度,以样本及样本特征为节点,以具有关联度的样本及节点的连线围边构建关联网络图,获取待检测样本的特征,并将其嵌入关联网络图,计算待检测样本在新关联网络图中与各连线上样本的权值乘积,若大于预设值,则输出对应连线上的样本。通过本发明的方法,能够利用代码及样本属性进行更多信息的判断,关联关系更准确,启发性更强。能够有效的输出具有关联性的样本,用于进一步判断待检测样本是否为仿冒文件,对恶意代码的检测具有辅助作用。
申请公布号 CN105975852A 申请公布日期 2016.09.28
申请号 CN201511015286.1 申请日期 2015.12.31
申请人 武汉安天信息技术有限责任公司 发明人 张路;潘宣辰
分类号 G06F21/55(2013.01)I 主分类号 G06F21/55(2013.01)I
代理机构 代理人
主权项 一种基于标签传播的样本关联性检测方法,其特征在于,包括:收集已知白样本文件及黑样本文件,组成样本集;对样本集在多个维度进行特征提取;分别计算样本集中两样本间的关联度,如果相似度大于预设值,则两样本间具有关联性,否则两样本间不具有关联性;分别判断样本集中各样本在各维度上特征是否相同;如果是,则认为样本在对应维度上的特征具有关联性,并给出各关联特征间的权值;否则样本在对应维度上不具有关联性;根据样本间及样本在对应维度上特征的关联性,以样本及特征为节点,以具有关联性的样本及特征的连线为边,构建关联网络图;获取待检测样本在各维度上的特征,并计算待检测样本与样本集中样本的关联度,将所述特征及样本嵌入构建的关联网络图,连线构成新关联网络图;计算待检测样本在新关联网络图中与各连线上样本的权值乘积,并判断所述权值乘积是否超过预设值,如果超过预设值,则向用户输出对应连线上的特征所对应的样本。
地址 430000 湖北省武汉市东湖新技术开发区软件园东路1号软件产业4.1期B4栋12层01室