发明名称 基于程序文法的指令集类型识别方法
摘要 本发明涉及一种基于程序文法的指令集类型识别方法,含有如下步骤:1:对各种处理器的指令编码和符号语言特征进行研究,抽取程序的词法、句法和段法特征,构成特征向量空间;2:对词法、句法和段法特征进行特征获取;3:根据2的结果生成目标设备代码的程序文法特征向量;采用向量归一化方法构建多属性决策矩阵;采用基于信息熵的权重分配方法生成带权多属性决策矩阵;4:采用AHP算法求取词法特征的相似度;采用改进后的汇编级相似度评估算法求取句法和段法特征的相似度,在特征向量空间中遍历求取目标设备代码与特征向量空间各项的相似度;5:根据相似度排名及分布情况对识别结果做出判定;本发明在通用性和准确性上具有突出的优势。
申请公布号 CN104063259A 申请公布日期 2014.09.24
申请号 CN201410248055.4 申请日期 2014.06.05
申请人 中国人民解放军信息工程大学 发明人 蒋烈辉;谢耀滨;常瑞;王震宇;刘铁铭;井靖;何红旗
分类号 G06F9/45(2006.01)I;G06F21/12(2013.01)I;G06F17/30(2006.01)I 主分类号 G06F9/45(2006.01)I
代理机构 郑州大通专利商标代理有限公司 41111 代理人 陈勇
主权项 一种基于程序文法的指令集类型识别方法,其特征是:步骤1:文法特征的定义和标准特征库的建立:对各种处理器的指令编码和符号语言特征进行统计研究,并利用不同指令集的二进制级代码和符号语言级代码的构造规律,抽取程序的词法特征、句法特征和段法特征,构成特征向量空间,刻画出不同指令集程序代码的表现形式;步骤2:目标代码文法特征的抽取:针对词法特征,采用基于散列的RK匹配算法进行特征获取;针对句法特征和段法特征,采用反汇编结果二次扫描策略进行特征获取,第一趟扫描反汇编结果后,获取指令频次表并统计汇编级特征指标,第二趟扫描反汇编结果后,获取特征指标CMP‑Jcc匹配度和子程序合理度的值;步骤3:目标代码文法特征的决策矩阵生成:根据步骤2获取的文法特征生成目标设备代码的程序文法特征向量;采用向量归一化方法构建多属性决策矩阵;采用基于信息熵的权重分配方法生成带权多属性决策矩阵;步骤4:指令集相似度的计算:采用AHP算法求取词法特征的相似度;采用改进后的汇编级相似度评估算法求取句法特征和段法特征的相似度,在特征向量空间中遍历求取目标设备代码与特征向量空间各项的相似度;步骤5:对相似度进行排序,根据相似度排名及分布情况对识别结果做出判定。
地址 450000 河南省郑州市科学大道62号