发明名称 一种基于自主学的网络业务识别方法
摘要 本发明涉及一种基于自主学的网络业务识别方法,包括两个工作阶段:离线阶段和在线识别阶段。1)在所述离线阶段中,对已识别的业务流的特征进行统计训练,将其8元组的统计特征向量存储到训练数据库中;2)在所述在线识别阶段中,对于每一个待识别的新业务流:首先统计足够数量的数据,构造一个8元组特征向量;若不能使用基于特征检测的方法进行识别,则将该统计特征向量与训练数据库中存储的统计特征向量进行基于欧氏距离和余弦相似性的指标匹配;判断所述指标是否满足阈值,若满足则表示匹配成功,更新训练数据库中对应业务流的统计特征向量;若不满足则表示匹配失败,在训练数据库中实时添加该新业务流。该方法通过自主学的方式在无需人工分析和标记的情况下,实现了加密/混合、迂回等未知业务流量的识别,加强了业务流的控制和管理。
申请公布号 CN105024862A 申请公布日期 2015.11.04
申请号 CN201510471494.6 申请日期 2015.08.05
申请人 福建师范大学 发明人 叶阿勇;李亚成;许力
分类号 H04L12/24(2006.01)I 主分类号 H04L12/24(2006.01)I
代理机构 福州元创专利商标代理有限公司 35100 代理人 蔡学俊
主权项 一种基于自主学习的网络业务识别方法,其特征在于:包括一离线训练阶段和一在线识别阶段,具体包括以下步骤:步骤S1:在所述离线训练阶段,对已识别的业务流的流量数据的特征进行统计训练,构造所述已识别的业务流的8元组的统计特征向量,并存储到训练数据库中;步骤S2:在所述线识别阶段中,对于每一个待识别的新业务流,统计足够数量的数据,计算其流量数据的特征,构造8元组的统计特征向量;若所述新业务流能够采用基于特征检测的方法被识别出来,则停止处理所述新业务流并删除其统计特征向量;若新业务流不能被识别,则进入步骤S3;步骤S3:将步骤S2中获得的新业务流的统计特征向量与训练数据库中存储的已识别的业务流的统计特征向量进行基于欧氏距离和余弦相似性的指标匹配;步骤S4:判断所述指标是否满足阈值,若满足则表示所述新业务流与所述已识别的业务流匹配成功,更新训练数据库中对应业务流的统计特征向量;若不满足则表示所述新业务流与所述已识别的业务流匹配失败,在训练数据库中添加该新业务流。
地址 350007 福建省福州市仓山区上三路8号