发明名称 样本抽取方法和装置
摘要 本发明公开了一种样本抽取方法和装置。其中,样本抽取方法包括:对样本总量进行排序,得到包括n个样本组的样本序列;保存样本组A<sub>i</sub>的样本数量len(A<sub>i</sub>)和样本a<sub>i1</sub>在样本序列中的位置D(a<sub>i1</sub>);根据该随机样本在样本序列中的位置反算出真正需要保存至目标样本集中的样本所处的位置。通过本发明,解决了现有技术中样本抽取方式容易耗时较长的问题,进而达到了在降低所抽取的样本的重复率的基础上,减少耗时时间的技术效果。
申请公布号 CN105589683A 申请公布日期 2016.05.18
申请号 CN201410568782.9 申请日期 2014.10.22
申请人 腾讯科技(深圳)有限公司 发明人 张壮
分类号 G06F9/44(2006.01)I 主分类号 G06F9/44(2006.01)I
代理机构 北京康信知识产权代理有限责任公司 11240 代理人 吴贵明;张永明
主权项 一种样本抽取方法,其特征在于,包括:对样本总量进行排序,得到包括n个样本组的样本序列,其中,所述n个样本组依次为样本组A<sub>1</sub>至样本组A<sub>n</sub>,样本组A<sub>i</sub>内的样本为相同样本,i依次取1至n,n为2以上的自然数;保存所述样本组A<sub>i</sub>的样本数量len(A<sub>i</sub>)和样本a<sub>i1</sub>在所述样本序列中的位置D(a<sub>i1</sub>),其中,所述样本a<sub>i1</sub>为所述样本组A<sub>i</sub>中的起始样本;重复执行如下步骤,直至保存至目标样本集中的目标样本的数量达到预设数量:随机抽取所述n个样本组中的任一样本,得到随机样本;获取所述随机样本在所述样本序列中的位置D(a<sub>xy</sub>);根据所述位置D(a<sub>xy</sub>)判断是否保存所述位置D(a<sub>xy</sub>)处的样本至所述目标样本集;在判断出不保存所述位置D(a<sub>xy</sub>)处的样本至所述目标样本集的情况下,根据目标数组所保存的位置D(a<sub>x′1</sub>)更改所述位置D(a<sub>xy</sub>),并将更改后的所述位置D(a<sub>xy</sub>)处的样本a<sub>xy</sub>保存至所述目标样本集,其中,所述目标数组用于保存起始样本a<sub>x′1</sub>在所述样本序列中的位置D(a<sub>x′1</sub>),所述起始样本a<sub>x′1</sub>为目标样本a<sub>x′y′</sub>所属样本组A<sub>x′</sub>中的起始样本,所述目标样本a<sub>x′y′</sub>为在抽取所述随机样本之前所抽取并被保存至所述目标样本集中的样本,x′∈[1,2,…,n];以及在判断出保存所述位置D(a<sub>xy</sub>)处的样本至所述目标样本集的情况下,保存所述位置D(a<sub>xy</sub>)处的样本a<sub>xy</sub>至所述目标样本集。
地址 518000 广东省深圳市福田区振兴路赛格科技园2栋东403室
您可能感兴趣的专利