发明名称 |
数据筛选的方法、装置以及证券化贷款的筛选方法、装置 |
摘要 |
一种数据筛选的方法,应用于至少包含有第一数据项、第二数据项和第三数据项的数据库中的数据记录的筛选,包括:执行预筛选,剔除不满足筛选要求的数据记录,形成预选库;由所述预选库中筛选出满足筛选条件的数据记录,形成备选库;提取用于随机分布控制的第一数据项的内容和用于集中度控制的第二数据项的内容;根据第一数据项内容执行随机分布控制,随机筛选数据记录,然后根据第二数据项内容对该数据记录进行集中度控制;若该记录满足集中度要求,判断该数据记录的第三数据项内容是否满足匹配条件,若是,将该数据记录移入目标数据库。本发明还提供一种数据筛选装置以及证券化贷款的筛选方法、装置。本发明进行数据筛选时用时较少且效率较高。 |
申请公布号 |
CN101221578B |
申请公布日期 |
2010.12.22 |
申请号 |
CN200810006074.0 |
申请日期 |
2008.02.01 |
申请人 |
中国建设银行股份有限公司 |
发明人 |
梁东;邱昆;王步锋;郭红军;黄辉;霍成;孙延凡;李金波;黄耀奇;张佩 |
分类号 |
G06F17/30(2006.01)I;G06Q40/00(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
逯长明 |
主权项 |
一种数据筛选的方法,应用于至少包含有第一数据项、第二数据项和第三数据项的数据库中的数据记录的筛选,其特征在于,包括:A1执行预筛选,从待选数据库中剔除不满足筛选要求的数据记录,满足要求的数据记录形成预选库;A2根据筛选条件生成数据库查询语句,利用所述查询语句由所述预选库中筛选出满足筛选条件的数据记录,形成备选库;A3在所述备选库中提取用于随机分布控制的第一数据项的内容和用于集中度控制的第二数据项的内容;A4根据第一数据项内容执行随机分布控制,随机访问所述备选库中的数据记录,以保证第一数据项的内容有相同的几率被筛选到;对于随机访问的每一条数据记录,根据第二数据项内容对该数据记录进行集中度控制,以控制该数据记录的第三数据项内容在目标数据库中的比例,若所述第三数据项内容达到比例要求,则舍弃该数据记录;否则,执行步骤A5;A5判断该数据记录的第三数据项内容是否满足匹配条件,若是,将该数据记录移入目标数据库,否则,返回至步骤A4。 |
地址 |
100032 北京市西城区金融大街25号 |