发明名称 Android应用相似性快速检测方法
摘要 本发明涉及一种Android应用相似性快速检测方法,包括:S1.采用Android API中的包名,类名,变量名与方法名作为关键词;S2.获取Android应用样本集;S3.反编译Android应用样本集中的所有样本,获取其Dalvik字节码文件;S4.依据逆文本频率指数算法,在Android应用样本集中的所有样本的Dalvik字节码文件中计算关键词的IDF;S5.反编译待比较Android应用,获取其Dalvik字节码文件;S6.统计每一待比较Android应用的Dalvik字节码文件中IDF非零的关键词的词频;S7.依据TF-IDF算法,计算每一个待比较Android应用的Dalvik字节码文件中所有关键词的TF-IDF权重;S8.依据每一个待比较Android应用的Dalvik字节码文件中所有关键词以及关键词的TF-IDF权重,计算每一个待比较Android应用的信息指纹;S9.依据待比较Android应用的信息指纹比较它们的相似性。
申请公布号 CN104063318A 申请公布日期 2014.09.24
申请号 CN201410288712.8 申请日期 2014.06.24
申请人 湘潭大学 发明人 程戈;张云
分类号 G06F11/36(2006.01)I 主分类号 G06F11/36(2006.01)I
代理机构 北京卓恒知识产权代理事务所(特殊普通合伙) 11394 代理人 唐曙晖;刘明芳
主权项 Android应用相似性快速检测方法,所述方法包括以下步骤:1)、采用Android API中的包名,类名,变量名和方法名作为关键词;2)、获取Android应用样本集;3)、反编译Android应用样本集中的所有样本,获取其Dalvik字节码文件;4)、依据逆文本频率指数(Inverse Document Frequency,缩写IDF)算法,在Android应用样本集中的所有样本的Dalvik字节码文件中计算关键词的IDF;5)、反编译待比较Android应用,获取其Dalvik字节码文件;6)、统计每一个待比较Android应用的Dalvik字节码文件中IDF非零的关键词的词频(Term Frequency,缩写TF);7)、依据TF‑IDF算法,计算每一个待比较Android应用的Dalvik字节码文件中所有关键词的TF‑IDF权重;8)、依据每一个待比较Android应用的Dalvik字节码文件中所有关键词以及关键词的TF‑IDF权重,计算每一个待比较Android应用的信息指纹;和9)、依据待比较Android应用的信息指纹比较它们的相似性。
地址 411105 湖南省湘潭市雨湖区羊牯塘街道湘潭大学