发明名称 基于传输层特征的流量分类方法及装置
摘要 本发明涉及互联网应用技术领域,尤其涉及互联网应用中基于传输层特征对流量进行分类的方法。包含如下步骤:采集作为训练数据的数据包,利用从数据包中提取的数据流的传输层特征参数构建一个分类器;利用构建的分类器,实现对后续采集到的数据包中提取的数据流的分类。不需要了解数据包的端口号、特征字段等负载内容,只需要提取出流的传输层特征,就可识别该流的应用类型。不涉及用户的隐私,且使本技术能够识别基于动态端口号的、或已加密的流;而且本发明准确率高、完整性好,可以识别新型应用,还能提醒用户检查那些疑似的病毒攻击流。
申请公布号 CN102271090B 申请公布日期 2013.09.25
申请号 CN201110261935.1 申请日期 2011.09.06
申请人 电子科技大学 发明人 钱峰;刘萧;胡光岷
分类号 H04L12/26(2006.01)I 主分类号 H04L12/26(2006.01)I
代理机构 电子科技大学专利中心 51203 代理人 周永宏
主权项 基于传输层特征的流量分类方法,其特征在于,包括如下步骤:A、采集作为训练数据的数据包,利用从数据包中提取的数据流的传输层特征参数构建一个分类器,具体步骤为:A1.首先采集一段时间内的所有数据包,并从数据包中提取作为训练数据的数据流;A2.对数据流进行预处理后,提取数据流的传输层特征参数;所述传输层特征参数包括数据流的平均数据包大小、各数据包之间的到达时间间隔、IP层的数据部分大小的统计特征、数据包的控制字段大小、源端向目的端发送的数据包的数量和目的端向源端发送的数据包的数量;A3.根据传输层特征参数,对数据流进行手工分类,标记该数据流所属的应用类型;A4.对经过手工分类的数据流的传输层特征参数进行机器学习,不断得到作为分类器的决策树;A5.继续学习后续产生的数据流,直到决策树达到稳定的状态,即得到了一个有效的分类器;B、利用构建的分类器,实现对后续采集到的数据包中提取的数据流的分类。
地址 611731 四川省成都市高新区(西区)西源大道2006号