发明名称 一种未知网络协议识别方法及系统
摘要 本发明涉及一种未知网络协议识别方法,包括:步骤1,以待识别的网络数据包为输入,并将每个网络数据包表征为可用于分类的特征向量;步骤2,以获得的特征向量为输入,形成特征向量数据集,利用面向支持向量机的主动学方法对该特征向量数据集进行学,获得针对待测网络协议的分类器;步骤3,利用得到的分类器,对待识别的网络数据包的协议属性做出判别。对应该方法,本发明还给出了一种未知网络协议识别系统,包括数据包建模模块、分类器构建模块和识别模块。本发明采用主动学方法,可使用较少的已标记样本达到较优的学效率,从而有效地降低了学过程中标记的样本数目,能够从混杂的网络流量中准确识别所分析的网络协议。
申请公布号 CN103297427B 申请公布日期 2016.01.06
申请号 CN201310189079.2 申请日期 2013.05.21
申请人 中国科学院信息工程研究所 发明人 云晓春;张永铮;王一鹏;周宇
分类号 H04L29/06(2006.01)I 主分类号 H04L29/06(2006.01)I
代理机构 北京轻创知识产权代理有限公司 11212 代理人 杨立
主权项 一种未知网络协议识别方法,其特征在于,包括:步骤1,以待识别的网络数据包为输入,并将每个网络数据包表征为能用于分类的特征向量;具体包括:步骤11,利用n‑gram模型将网络数据包转化为以n‑gram元素为基本单元的网络数据包;步骤12,将网络数据包向量化,且每个网络数据包表示为一个向量,向量的每个维度是唯一的n‑gram元素,向量的分量数值是n‑gram元素在网络数据包中出现的次数;步骤2,以步骤1获得的特征向量为输入,形成特征向量数据集,利用面向支持向量机的主动学习方法对该特征向量数据集进行学习,获得针对待测网络协议的分类器;步骤3,利用步骤2得到的分类器,对待识别的网络数据包的协议属性做出判别。
地址 100093 北京市海淀区闵庄路甲89号