发明名称 |
数据选择方法及装置 |
摘要 |
本发明公开了一种数据选择方法,包括步骤:A.从待处理数据中选择M+N个数据作为待处理数据组;B.对所述待处理数据组中的每一个数据与其他各个数据的相关度求和得到各个数据的总相关度;C.从所述待处理数据组中确定N个数据,所确定的N个数据的总相关度均大于所述待处理数据组中,除所确定的N个数据之外的其他数据的总相关度;D.从所述待处理数据中选择除已被选择的数据之外的N个数据替换所确定的N个数据作为新的待处理数据组;E.继续执行步骤B、C和D,直至所有数据被选择完毕;F.删除最后一次确定的N个数据,得到目标数据,所述目标数据的个数为M。本发明还公开一种数据选择装置。本发明实现提高数据选择的效率和准确性。 |
申请公布号 |
CN105468603A |
申请公布日期 |
2016.04.06 |
申请号 |
CN201410419106.5 |
申请日期 |
2014.08.22 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
李岩;牛志伟 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市世纪恒程知识产权代理事务所 44287 |
代理人 |
胡海国 |
主权项 |
一种数据选择方法,其特征在于,所述数据选择方法包括步骤:A、按照预设规则从待处理数据中选择M+N个数据作为待处理数据组;B、对所述待处理数据组中的每一个数据与其他各个数据的相关度求和得到各个数据的总相关度;C、从所述待处理数据组中确定N个数据,所确定的N个数据的总相关度均大于所述待处理数据组中,除所确定的N个数据之外的其他数据的总相关度;D、从所述待处理数据中选择除已被选择的数据之外的N个数据替换所确定的N个数据作为新的待处理数据组;E、继续执行步骤B、C和D,直至所述待处理数据中的所有数据被选择完毕;F、从所述待处理数据组中删除最后一次确定的N个数据,得到目标数据,所述目标数据的个数为M。 |
地址 |
518000 广东省深圳市福田区振兴路赛格科技园2栋东403室 |