发明名称 一种P2P协议类型识别方法
摘要 本发明公开了一种P2P协议类型识别方法,属于计算机网络技术领域。本方法采用监督机器学的思路,具体分为线下(学)和线上(检测)两个部分,其中线下学是对事先标定应用协议种类的网络包,通过自动学和人工修正相结合,生成标定协议的指纹;而线上检测是利用线下学得到的指纹,实时判定当前网络环境中的主机是否运行上述协议,从而得到目标宿主机运行的协议。与现有技术相比,本发明识别效率更高,而且更符合P2P流量的特性。
申请公布号 CN102420830A 申请公布日期 2012.04.18
申请号 CN201110421888.2 申请日期 2011.12.15
申请人 北京大学 发明人 陈昱;平夏雨;韦韬;时亮;龚晓锐
分类号 H04L29/06(2006.01)I;H04L29/08(2006.01)I 主分类号 H04L29/06(2006.01)I
代理机构 北京君尚知识产权代理事务所(普通合伙) 11200 代理人 余长江
主权项 一种P2P协议类型识别方法,其步骤为:1)将用于机器学习的TCP协议网络数据包整理成TCP流;2)提取TCP流中的命令交互网络包,得到一命令交互网络包子序列;3)将所述命令交互网络包子序列的包长作为指纹学习对象采用机器学习算法进行学习,得到相应协议标签的指纹库,其中每一指纹对应一个包长子序列;4)为每一指纹设置一权重,并为每一协议设置一连接数阈值Th(C)和一指纹权重阈值Th(W);5)将在线抓取的目标宿主机TCP协议网络数据包整理成TCP流,提取命令交互网络包的包长序列并将其与所述指纹库进行匹配,得到该包长序列的目标协议;6)当与该目标宿主机连接的IP地址数大于目标协议的Th(C),而且在这些连接中具有目标协议标签的指纹权重之和大于Th(W),则将该目标宿主机判定为运行目标协议。
地址 100871 北京市海淀区颐和园路5号