发明名称 将未知单协议数据流分离为不同类型的数据帧的方法
摘要 本发明公开了一种将未知单协议数据流分离为不同类型的数据帧的方法,首先利用n-gram技术对数据帧进行分割,根据齐夫分布,选择曲线图中最接近直线的n值作为所求,然后利用Jaccard参数对非频繁字节进行过滤,通过改变不同的阈值得到其最优解对n-gram进行过滤,得到出现次数多于阈值的n-gram集合;然后利用无监督的特征选择算法提取特征串集合,特征选择中将上一步得到的特征候选集作为输入,根据最大相关-最小冗余的特征选择标准,得到能更好的表征该协议不同类型消息的特征,以此作为特征向量用于聚类中;最后利用聚类算法实现协议消息的识别,将具有相同格式的消息聚在一起。本发明在ICMP上对该方法进行评估,消息识别的准确率和召回率均可达到90%以上。
申请公布号 CN104767736A 申请公布日期 2015.07.08
申请号 CN201510127295.3 申请日期 2015.03.23
申请人 电子科技大学 发明人 王勇;周洪川;张凤荔;张俊娇;刘渊
分类号 H04L29/06(2006.01)I 主分类号 H04L29/06(2006.01)I
代理机构 成都金英专利代理事务所(普通合伙) 51218 代理人 袁英
主权项 将未知单协议数据流分离为不同类型的数据帧的方法,其特征在于:它包括以下步骤:S1:n‑gram的产生:将原始的数据帧切分成长度为n的字节,为特征候选集的拼接做准备;S2:特征候选集的拼接:形成频繁长串,产生特征候选集;S3:特征选择:将步骤S3中得到的特征候选集作为输入,利用熵值中的互信息作为特征选择算法,根据最大相关‑最小冗余的特征选择标准,得到不同类型消息的特征,以此作为特征向量用于步骤S4的聚类中;S4:聚类:利用聚类算法实现协议消息的识别,将具有相同格式的消息聚在一起。
地址 610041 四川省成都市高新区(西区)西源大道2006号