发明名称 正则表达式匹配系统及匹配方法
摘要 本发明公开了一种正则表达式匹配系统及匹配方法,涉及网络安全技术领域,所述方法包括:预处理单元、匹配单元和转发单元,所述预处理单元对正则表达式规则集合中的规则进行拆分,根据拆分结果构造正则表达式匹配引擎并发送给所述匹配单元,所述匹配单元通过正则表达式匹配引擎对输入网包进行正则表达式匹配处理,输出匹配结果给转发单元,由转发单元实现网包的存储转发。本发明匹配速度快,可以和DFA相比拟;本发明占用内存很小,可以和NFA相比拟,且与正则表达式规则集合的规模成线性关系,可扩展性强;本发明构造速度快,预处理时间接近甚至优于不拆分规则时的NFA构造速度,能够满足实际处理中在规则更新时间上的需求。
申请公布号 CN102523219B 申请公布日期 2015.01.14
申请号 CN201110424853.4 申请日期 2011.12.16
申请人 清华大学 发明人 王凯;亓亚烜;李军
分类号 H04L29/06(2006.01)I;G06F17/30(2006.01)I 主分类号 H04L29/06(2006.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 王莹
主权项 一种正则表达式匹配系统,其特征在于,包括:预处理单元、匹配单元和转发单元,所述预处理单元对正则表达式规则集合中的规则进行拆分,根据拆分结果构造正则表达式匹配引擎并发送给所述匹配单元,所述匹配单元通过正则表达式匹配引擎对输入网包进行正则表达式匹配处理,输出匹配结果给转发单元,由转发单元实现网包的存储转发; 其中,所述预处理单元包括第一预处理模块,用于对正则表达式规则进行拆分; 其中,所述第一预处理模块包括:用于对输入的正则表达式规则集合进行规范化处理的规范化处理模块,用于对规范化的正则表达式规则集合进行规则标记的规则标记模块,以及用于对标记好的正则表达式规则集合进行规则拆分的规则拆分模块; 其中,所述预处理单元包括第二预处理模块,用于构造正则表达式匹配引擎并发送给所述匹配单元; 其中,所述第二预处理模块包括:用于为拆分生成的正则表达式子规则集合构造数据结构的子规则数据结构模块,用于为拆分生成的正则表达式子规则索引文件构造数据结构的索引文件数据结构模块,以及用于根据两数据结构模块构造正则表达式匹配引擎的匹配引擎构造模块; 其中,所述匹配单元包括向匹配单元输入网包的输入模块,通过正则表达式匹配引擎对输入网包数据按字符进行匹配的正则表达式匹配模块,以及输出正则表达式匹配结果给转发单元的输出模块。 
地址 100084 北京市海淀区清华园100084-82信箱