发明名称 |
Android应用相似性快速检测方法 |
摘要 |
本发明涉及一种Android应用相似性快速检测方法,包括:S1.采用Android API中的包名,类名,变量名与方法名作为关键词;S2.获取Android应用样本集;S3.反编译Android应用样本集中的所有样本,获取其Dalvik字节码文件;S4.依据逆文本频率指数算法,在Android应用样本集中的所有样本的Dalvik字节码文件中计算关键词的IDF;S5.反编译待比较Android应用,获取其Dalvik字节码文件;S6.统计每一待比较Android应用的Dalvik字节码文件中IDF非零的关键词的词频;S7.依据TF-IDF算法,计算每一个待比较Android应用的Dalvik字节码文件中所有关键词的TF-IDF权重;S8.依据每一个待比较Android应用的Dalvik字节码文件中所有关键词以及关键词的TF-IDF权重,计算每一个待比较Android应用的信息指纹;S9.依据待比较Android应用的信息指纹比较它们的相似性。 |
申请公布号 |
CN104063318A |
申请公布日期 |
2014.09.24 |
申请号 |
CN201410288712.8 |
申请日期 |
2014.06.24 |
申请人 |
湘潭大学 |
发明人 |
程戈;张云 |
分类号 |
G06F11/36(2006.01)I |
主分类号 |
G06F11/36(2006.01)I |
代理机构 |
北京卓恒知识产权代理事务所(特殊普通合伙) 11394 |
代理人 |
唐曙晖;刘明芳 |
主权项 |
Android应用相似性快速检测方法,所述方法包括以下步骤:1)、采用Android API中的包名,类名,变量名和方法名作为关键词;2)、获取Android应用样本集;3)、反编译Android应用样本集中的所有样本,获取其Dalvik字节码文件;4)、依据逆文本频率指数(Inverse Document Frequency,缩写IDF)算法,在Android应用样本集中的所有样本的Dalvik字节码文件中计算关键词的IDF;5)、反编译待比较Android应用,获取其Dalvik字节码文件;6)、统计每一个待比较Android应用的Dalvik字节码文件中IDF非零的关键词的词频(Term Frequency,缩写TF);7)、依据TF‑IDF算法,计算每一个待比较Android应用的Dalvik字节码文件中所有关键词的TF‑IDF权重;8)、依据每一个待比较Android应用的Dalvik字节码文件中所有关键词以及关键词的TF‑IDF权重,计算每一个待比较Android应用的信息指纹;和9)、依据待比较Android应用的信息指纹比较它们的相似性。 |
地址 |
411105 湖南省湘潭市雨湖区羊牯塘街道湘潭大学 |