发明名称 |
应用识别方法、数据挖掘方法、装置及系统 |
摘要 |
本发明实施例公开了一种数据挖掘方法、装置及系统,该UBA数据挖掘方法包括:获得待处理数据,所述待处理数据包括多条记录,其中每条记录包括:成对应关系的应用信息、远端三元组信息;对所述待处理数据中远端三元组信息及应用信息相同的记录进行聚类处理,并根据所述待处理数据中远端三元组信息及应用信息相同的记录计算对应于所述远端三元组信息及应用信息的服务负载量,得到包含成对应关系的远端三元组信息、应用信息及服务负载量的聚类结果;根据所述服务负载量的大小或比重从所述聚类结果中选取可信度高的成对应关系的远端三元组与应用信息;向DPI子系统发送所述可信度高的成对应关系的远端三元组与应用信息,从而提升DPI识别性能和应用识别率。 |
申请公布号 |
CN103051725A |
申请公布日期 |
2013.04.17 |
申请号 |
CN201210592203.5 |
申请日期 |
2012.12.31 |
申请人 |
华为技术有限公司 |
发明人 |
周韡;唐东;张洪丁 |
分类号 |
H04L29/08(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
H04L29/08(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种用户行为分析UBA数据挖掘方法,其特征在于,包括:获得待处理数据,所述待处理数据包括多条记录,其中每条记录包括:成对应关系的应用信息、远端三元组信息;其中,所述远端三元组信息包括传输协议、服务器端IP地址和服务器端端口;对所述待处理数据中远端三元组信息及应用信息相同的记录进行聚类处理,并根据所述待处理数据中远端三元组信息及应用信息相同的记录计算对应于所述远端三元组信息及应用信息的服务负载量,得到包含成对应关系的远端三元组信息、应用信息及服务负载量的聚类结果;根据所述服务负载量的大小或比重从所述聚类结果中选取可信度高的成对应关系的远端三元组与应用信息;向深度包检测DPI子系统发送所述可信度高的成对应关系的远端三元组与应用信息。 |
地址 |
518129 广东省深圳市龙岗区坂田华为总部办公楼 |