发明名称 可信文件数字签名的获取方法及装置
摘要 本发明公开了一种可信文件数字签名的获取方法及装置。其中一种方法包括:收集多个可执行文件样本的数字签名;将多个数字签名分别进行分词操作处理,得到多个数字签名集合,每个数字签名集合包含至少一个单词;统计每个数字签名集合中每个单词的词频;根据数字签名集合中单词的词频和字符串长度,获取多个数字签名集合两两之间的字符串相似度;将字符串相似度高于设定阈值的数字签名集合聚为一类;根据同一类中已知可信文件数字签名的数量,确定该类中所有的数字签名是否为可信文件数字签名。本发明提供的方案在计算两个集合的字符串相似度的时候考虑到单词的词频和字符串长度的影响,因此更能反映两个集合的相关程度,由此提高了获取可信文件数字签名的准确率。
申请公布号 CN102982291B 申请公布日期 2015.11.25
申请号 CN201210436027.6 申请日期 2012.11.05
申请人 北京奇虎科技有限公司;奇智软件(北京)有限公司 发明人 张超旭;于春功
分类号 G06F21/64(2013.01)I 主分类号 G06F21/64(2013.01)I
代理机构 北京市浩天知识产权代理事务所(普通合伙) 11276 代理人 靳春鹰;宋菲
主权项 一种可信文件数字签名的获取方法,包括:收集多个可执行文件样本的数字签名;将多个数字签名分别进行分词操作处理,得到多个数字签名集合,其中每个数字签名集合包含至少一个单词;统计每个数字签名集合中每个单词的词频,所述单词的词频是该单词在所有数字签名集合中出现的频次;根据数字签名集合中单词的词频和字符串长度,获取多个数字签名集合两两之间的字符串相似度;将字符串相似度高于设定阈值的数字签名集合聚为一类;根据同一类中已知可信文件数字签名的数量,确定该类中所有的数字签名是否为可信文件数字签名;其中,所述获取多个数字签名集合两两之间的字符串相似度包括:对于多个数字签名集合中任意两个数字签名集合A和B,获取A和B的交集C;根据A中每个单词的词频和字符串长度以及B中每个单词的词频和字符串长度,分别获取A的长度因子和B的长度因子;根据所述A的长度因子、B的长度因子以及C中每个单词的词频和字符串长度,获取A和B的字符串相似度。
地址 100088 北京市西城区新街口外大街28号D座112室(德胜园区)