发明名称 基于随机森林的DGA域名检测方法
摘要 本发明公开了一种基于随机森林的DGA域名检测方法,步骤一,构建知识库,包括构建黑白名单样本库和单词词典;步骤二,设定域名特征模板,将黑白名单中的域名作为训练集,过滤掉噪音,训练并离线保存随机森林算法模型;步骤三,获取待检测域名,加载最优随机森林算法模型,将待检测域名作为输入,得到预测结果。本发明不依赖在线获取DNS数据,不仅可以单独、快速完成DGA域名检测,也可以为其他恶意域名检测方法提供预测;此外,该方法基于随机森林算法,在噪音干扰上具有明显的优势,使用资源少,运行效率高,泛化性能好。
申请公布号 CN105577660A 申请公布日期 2016.05.11
申请号 CN201510971299.X 申请日期 2015.12.22
申请人 国家电网公司;国网浙江省电力公司信息通信分公司;南京南瑞集团公司;南京南瑞信息通信科技有限公司 发明人 王红凯;张旭东;杨维永;马志程;廖鹏;黄益彬;于晓文;张丹;夏威;宋文杰
分类号 H04L29/06(2006.01)I;H04L29/12(2006.01)I 主分类号 H04L29/06(2006.01)I
代理机构 南京纵横知识产权代理有限公司 32224 代理人 董建林
主权项 基于随机森林的DGA域名检测方法,其特征在于:包括以下步骤,步骤一,构建知识库,包括构建黑白名单样本库和单词词典;步骤二,设定域名特征模板,将黑白名单中的域名作为训练集,过滤掉噪音,训练并离线保存随机森林算法模型;所述域名特征模板可根据训练反馈进行修改;步骤三,获取待检测域名,加载最优随机森林算法模型,将待检测域名作为输入,得到预测结果。
地址 100031 北京市西城区西长安街86号