发明名称 可移植可执行文件的时序特征处理方法及装置
摘要 本发明公开了一种可移植可执行文件的时序特征处理方法及装置,涉及数据处理领域,用于解决由于每个向量本身的长度很长,使拼接后向量长度过长的问题更为凸显,导致计算效率低的问题。方法包括:从可移植可执行PE文件中提取第一数量的第一特征单元作为第一时序特征,在第一时序特征前面和/或后面分别获取与第一时序特征相关的预设数量的第二时序特征,分别根据每个第一时序特征的向量表示估算在每个第二时序特征的位置出现第二时序特征的第一概率,并计算各个根据第一时序特征确定的第一概率的对数的和的最大值;分别获取第一时序特征对应的目标向量。本发明主要应用于计算机病毒检测的过程中。
申请公布号 CN104317892A 申请公布日期 2015.01.28
申请号 CN201410572813.8 申请日期 2014.10.23
申请人 深圳市腾讯计算机系统有限公司 发明人 杨宜;于涛;李璐鑫
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京中博世达专利商标代理有限公司 11274 代理人 申健
主权项 一种可移植可执行文件的时序特征处理方法,其特征在于,包括:从可移植可执行PE文件中提取第一数量的第一特征单元作为第一时序特征,所述第一时序特征的向量表示的维度为所述第一数量的任意特征单元所能表示的最大值;在所述第一时序特征前面和/或后面分别获取与所述第一时序特征相关的预设数量的第二时序特征,所述第二时序特征由所述第一数量的第二特征单元组成;分别根据每个第一时序特征的向量表示估算在每个所述第二时序特征的位置出现所述第二时序特征的第一概率,并计算各个根据所述第一时序特征确定的第一概率的对数的和的最大值;分别获取每个所述第一时序特征对应的目标向量;或者,分别根据所述预设数量的第二时序特征的向量表示估算在所述第一时序特征的位置出现所述第一时序特征的第二概率,并计算各个根据所述预设数量的第二时序特征确定的第二概率的对数的和的最大值;分别获取所述第一时序特征对应的目标向量。
地址 518000 广东省深圳市南山区高新区高新南一路飞亚达大厦5-10楼