发明名称 高维分层抽样
摘要 在一个方面中,信息处理系统的处理装置用于执行数据库的高维分层抽样,所述数据库包括多条布置在交叠子组中的记录。对于给定记录,处理装置确定给定记录与哪个子组相关联,对于与给定记录相关联的每个子组,检查子组的抽样率是否小于指定抽样率。如果每个子组的抽样率都小于指定抽样率,处理装置对所述给定记录抽样,否则不对给定记录抽样。针对其他记录重复确定、检查和抽样操作,处理抽样操作获得的样本以产生表征数据库的信息。本发明的其他方面涉及通过迭代地优化目标函数来确定对哪些记录抽样,目标函数可以基于例如被抽样记录的似然函数。
申请公布号 CN102985923A 申请公布日期 2013.03.20
申请号 CN201180032445.2 申请日期 2011.06.09
申请人 阿尔卡特朗讯 发明人 陈爱友;雄明
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京汉昊知识产权代理事务所(普通合伙) 11370 代理人 罗朋;周建华
主权项 一种设备,包括:处理装置,包括具有关联存储器的处理器;其中,所述处理装置用于:对于给定记录,确定所述给定记录与多个子组中的哪个子组相关联;对于与所述给定记录相关联的每个子组,检查所述子组的抽样率是否小于指定抽样率;如果每个子组的抽样率都小于所述指定抽样率,对所述给定记录抽样,否则,不对所述给定记录抽样;以及对于多个其他记录中的每个,重复所述确定、检查和抽样操作;其中,由所述抽样操作所获得的样本被处理以产生表征包括所述子组的数据库的信息。
地址 法国巴黎市