发明名称 IP地理定位数据的挖掘方法及装置
摘要 本发明实施例公开了一种IP地理定位数据的挖掘方法及装置,涉及数据挖掘技术领域,方法包括:获取IP地理定位数据库历史数据集以及金融系统归档日志数据集;分别进行加权处理,合并为一第一临时数据集;根据一数据权值衰落时间窗口算法对第一临时数据集进行处理,对第一临时数据集中的权值进行修正,生成一第二临时数据集;将第二临时数据集中的数据条目以IP段进行合并,形成第三临时数据集;确定第三临时数据集中各IP段对应的综合可信度,并生成第四临时数据集;根据一预先设置的可信度阈值与综合可信度,对第四临时数据集中的数据条目进行筛选,生成IP地理定位数据的可信数据。本发明能够解决当前的IP地理定位数据库可靠性差,难以更新的问题。
申请公布号 CN104598580A 申请公布日期 2015.05.06
申请号 CN201510018295.X 申请日期 2015.01.14
申请人 中国工商银行股份有限公司 发明人 蒋家棠;张爽;敦宏程;关靖远;王贵智
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京三友知识产权代理有限公司 11127 代理人 王涛
主权项 一种IP地理定位数据的挖掘方法,其特征在于,包括:获取IP地理定位数据库历史数据集以及金融系统归档日志数据集;将所述IP地理定位数据库历史数据集以及金融系统归档日志数据集分别进行加权处理,并合并为一第一临时数据集;根据一数据权值衰落时间窗口算法对所述第一临时数据集进行处理,对第一临时数据集中的权值进行修正,生成一第二临时数据集;所述第二临时数据集包括各单个IP地址;根据所述各单个IP地址,将第二临时数据集中的数据条目以IP段进行合并,形成第三临时数据集;确定所述第三临时数据集中各IP段对应的综合可信度,并根据所述第三临时数据集和所述综合可信度生成第四临时数据集;根据一预先设置的可信度阈值与所述综合可信度,对第四临时数据集中的数据条目进行筛选,生成IP地理定位数据的可信数据。
地址 100140 北京市西城区复兴门内大街55号