发明名称 | 单词的用户行为数的预测方法和装置 | ||
摘要 | 本申请公开了一种单词的用户行为数的预测方法和装置,用以降低设备的运算量和运算复杂度,降低对设备的性能消耗,提升预测的准确率和可靠性。所述预测方法,包括:对单词的用户行为数的历史数据序列进行时域到频域的变换;根据变换得到的频域序列确定历史数据序列的每一个估计周期及其影响程度值;根据所述历史数据序列的每一个估计周期及其影响程度值,判断所述历史数据序列是否满足平稳序列标准;如果是,采用预测点之前若干历史数据点的用户行为数的均值作为预测点的用户行为数;否则,根据每一个估计周期及其影响程度值选择所述历史数据序列的主周期和奇异点,并基于选定的主周期和奇异点得到预测点的用户行为数。 | ||
申请公布号 | CN102346745B | 申请公布日期 | 2014.04.02 |
申请号 | CN201010244565.6 | 申请日期 | 2010.08.02 |
申请人 | 阿里巴巴集团控股有限公司 | 发明人 | 张涛;郭家清;郭宁 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京同达信恒知识产权代理有限公司 11291 | 代理人 | 郭润湘 |
主权项 | 一种单词的用户行为数的预测方法,其特征在于,包括:对单词的用户行为数的历史数据序列进行时域到频域的变换,所述单词的用户行为数为单词的流量或者点击量;根据变换得到的频域序列确定所述历史数据序列的每一个估计周期及其影响程度值;根据所述历史数据序列的每一个估计周期及其影响程度值,判断所述历史数据序列是否满足平稳序列标准;其中,所述平稳序列标准包括:所有估计周期的影响程度值均不超过设定的影响程度阈值;所述估计周期是指频域序列的周期,就是根据频率值换算得到的周期值;所述影响程度值是指估计周期在频域序列中所占的比重;如果是,采用预测点之前若干历史数据点的用户行为数的均值作为预测点的用户行为数;否则,根据配置的主周期范围,将满足所述主周期范围且影响程度值最大的估计周期作为主周期,在主周期之外的各估计周期中,将影响程度值最大的估计周期作为奇异点,并基于选定的主周期和奇异点得到预测点的用户行为数;其中,所述基于选定的主周期和奇异点得到预测点的用户行为数包括:选取所述历史数据序列中奇异点之后的各历史数据点组成训练数据序列,利用时间序列模型对所述训练数据序列进行建模求解,得到预测点的用户行为数。 | ||
地址 | 英属开曼群岛大开曼岛资本大厦一座四层847号邮箱 |