发明名称 基于URL的正则表达式的生成方法和装置
摘要 一种基于URL的正则表达式的生成方法,将输入的URL列表按照预定的划分规则划分成多个URL子集;将划分好的多个URL子集按照预定的聚类规则聚合成多个URL类;从聚合成的多个URL类中生成具有一定特征的正则表达式。该方法能够按照不同的划分规则划分URL,以及通过预定的聚类规则生成的正则表达式,因此能够实现准确地生成正则表达式。本发明还提供一种基于URL的正则表达式的生成装置。
申请公布号 CN101727447A 申请公布日期 2010.06.09
申请号 CN200810167485.8 申请日期 2008.10.10
申请人 浙江搜富网络技术有限公司 发明人 徐和平;郑小林
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 逯长明
主权项 一种基于URL的正则表达式的生成方法,其特征在于包括:将输入的URL列表按照预定的划分规则划分成多个URL子集;将所述URL子集按照预定的聚类规则聚合成多个URL类;抽取所述聚合成的URL类,生成正则表达式。
地址 321017 浙江省金华市丹溪路1456号中讯基地3楼