发明名称 基于域名特征的C&C域名识别方法
摘要 本发明公开了一种基于域名特征的C&amp;C域名识别方法,包括:S<sub>1</sub>、基于域名的定性特征,对给定的域名生成用于判定域名类别的量化指标;S<sub>2</sub>、从给定的域名中随机抽取部分域名进入训练数据集,剩余域名进入测试数据集,并应用决策树集成算法,基于训练数据集生成域名类别判定模型;S<sub>3</sub>、应用生成的域名类别判定模型对测试数据集中的剩余域名的域名类别进行判定,并与剩余域名的实际类别进行比较,计算所述域名类别判定模型的预测性能指标;S<sub>4</sub>、对应用所述域名类别判定模型判定的域名类别进行校正;S<sub>5</sub>、基于校正后的域名类别,生成单个域名的统计结果。本发明可以准确地寻找到C&amp;C域名,增强了模型的强落地性、可行性和可理解性。
申请公布号 CN105072214A 申请公布日期 2015.11.18
申请号 CN201510541217.8 申请日期 2015.08.28
申请人 携程计算机技术(上海)有限公司 发明人 唐力;岳扶天;周海燕
分类号 H04L29/12(2006.01)I;H04L29/06(2006.01)I 主分类号 H04L29/12(2006.01)I
代理机构 上海弼兴律师事务所 31283 代理人 薛琦;罗朗
主权项 一种基于域名特征的C&amp;C域名识别方法,其特征在于,包括以下步骤:S<sub>1</sub>、基于域名的定性特征,对给定的域名生成用于判定域名类别的量化指标;S<sub>2</sub>、从给定的域名中随机抽取部分域名进入训练数据集,剩余域名进入测试数据集,并应用决策树集成算法,基于训练数据集生成域名类别判定模型;S<sub>3</sub>、应用生成的域名类别判定模型对测试数据集中的剩余域名的域名类别进行判定,并与剩余域名的实际类别进行比较,计算所述域名类别判定模型的预测性能指标;S<sub>4</sub>、对应用所述域名类别判定模型判定的域名类别进行校正;S<sub>5</sub>、基于校正后的域名类别,生成单个域名的统计结果。
地址 200335 上海市长宁区福泉路99号携程网络技术大楼