发明名称 一种复合规则集匹配方法和系统
摘要 本发明公开了一种复合规则集匹配方法和系统,包括:采用多模匹配算法处理从网络信息流中获得的原始文本,获得原始文本中的特征字符串。将特征字符串采用预构的特征字符串规则集中的身份标识号码ID代替,并将代替特征字符串的ID采用十六进制表示。将十六进制形式的ID按顺序输入由预构的正则表达式集合预先构造的自动机中。根据自动机的跳转获得该ID与自动机的匹配结果。其中,预构的特征字符串规则集根据预定的复合规则集构造获得;预构的正则表达式集合根据预构的特征字符串规则集构造获得。通过本发明的方案,能够削弱规则之间的独立性,缩减文本信息的重复读取次数,提高实际匹配速度。
申请公布号 CN105045808A 申请公布日期 2015.11.11
申请号 CN201510309559.7 申请日期 2015.06.08
申请人 北京天元特通科技有限公司 发明人 王凯峰
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京安信方达知识产权代理有限公司 11262 代理人 李红爽;栗若木
主权项 一种复合规则集匹配方法,其特征在于,所述方法包括:采用多模匹配算法处理从网络信息流中获得的原始文本,获得所述原始文本中的特征字符串;将所述特征字符串采用预构的特征字符串规则集中的身份标识ID代替,并将代替所述特征字符串的所述ID采用十六进制表示;将十六进制形式的所述ID按顺序输入由预构的正则表达式集合预先构造的自动机中;根据所述自动机的跳转获得所述ID与所述自动机的匹配结果;其中,所述预构的特征字符串规则集根据预定的所述复合规则集构造获得;所述预构的正则表达式集合根据所述预构的特征字符串规则集构造获得。
地址 100029 北京市朝阳区渔阳置业大厦B座508
您可能感兴趣的专利