发明名称 |
基于URL的正则表达式的生成方法和装置 |
摘要 |
一种基于URL的正则表达式的生成方法,将输入的URL列表按照预定的划分规则划分成多个URL子集;将划分好的多个URL子集按照预定的聚类规则聚合成多个URL类;从聚合成的多个URL类中生成具有一定特征的正则表达式。该方法能够按照不同的划分规则划分URL,以及通过预定的聚类规则生成的正则表达式,因此能够实现准确地生成正则表达式。本发明还提供一种基于URL的正则表达式的生成装置。 |
申请公布号 |
CN101727447A |
申请公布日期 |
2010.06.09 |
申请号 |
CN200810167485.8 |
申请日期 |
2008.10.10 |
申请人 |
浙江搜富网络技术有限公司 |
发明人 |
徐和平;郑小林 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
逯长明 |
主权项 |
一种基于URL的正则表达式的生成方法,其特征在于包括:将输入的URL列表按照预定的划分规则划分成多个URL子集;将所述URL子集按照预定的聚类规则聚合成多个URL类;抽取所述聚合成的URL类,生成正则表达式。 |
地址 |
321017 浙江省金华市丹溪路1456号中讯基地3楼 |