发明名称 一种基于历史走势权重的网站访问量预测方法
摘要 本发明涉及网站数据统计分析技术领域,具体公开了一种基于历史走势权重的网站访问量预测方法;数据预处理,将访问量取对数,计算历史走势各时间点的方差,计算第i个历史走势对当前走势的回归系数,计算用第i个历史走势估计当前值相关系数的方差,用优化最小化方法估计偏差求解权重,根据权重预测当前走势之后的值,预测结果处理,将预测结果进行指数变换。本发明用已知的当前走势与历史走势进行对比,计算相关系数,再根据每个历史走势去估计当前走势的偏差,用最优化方法选择每个历史走势的权重,把各日期的估计按权重叠加,叠加的结果可以对当前、后续走势进行预测,使综合历史走势估计当前走势的偏差最小,得到比较可靠的预测。
申请公布号 CN104217091B 申请公布日期 2016.12.28
申请号 CN201310220456.4 申请日期 2013.06.05
申请人 北京齐尔布莱特科技有限公司 发明人 胡勇
分类号 G06Q10/04(2012.01)I;G06F17/30(2006.01)I 主分类号 G06Q10/04(2012.01)I
代理机构 北京市盛峰律师事务所 11337 代理人 赵建刚
主权项 一种基于历史走势权重的网站访问量预测方法,其特征在于,包括:S1.a:将当前时间点一段时间的所述访问量进行数据预处理,所述当前时间点一段时间的所述访问量数据预处理结果用符号y<sub>j</sub>表示,j=1、2、……、K,所述K为自然数,所述y<sub>j</sub>中所述j为时间段序号;S1.b:将历史同时间段的所述访问量进行数据预处理,所述历史同时间段的所述访问量数据预处理结果用符号X<sub>ij</sub>表示,所述i=1、2、……、N,所述N为自然数,每个i为一个周期;所述X<sub>ij</sub>中所述j=1、2、……、K、K+1、……、M,当所述X<sub>ij</sub>中所述j取值小于等于K时,所述X<sub>ij</sub>中所述j与当前走势的所述y<sub>j</sub>中所述j的取值相同,所述K+1、……、所述M为有历史值且当前尚无实际值需要预测值的时间段序号;所述S1.a步骤和所述S1.b步骤顺序不分先后;S2:计算当前时间点之后的走势预测访问量,所述当前时间点之后的所述走势预测访问量未进行预测结果处理的数据用z<sub>j</sub>符号表示,所述z<sub>j</sub>中所述j=K+1、……、M;S2.1:数据预处理,对网站浏览量的实际访问量做以a为底数的对数变换,所述网站浏览量的实际访问量包括所述当前时间点一段时间的访问量走势和所述历史同时间段的访问量走势;S2.2:计算网站浏览量的实际访问量的对数的方差;<img file="FDA0001130394240000011.GIF" wi="533" he="135" />其中所述<img file="FDA0001130394240000012.GIF" wi="318" he="126" />所述j=1、2、……、K;S2.3:根据所述当前时间点一段时间的访问量的对数计算第i个所述历史同时间段的访问量的对数的回归系数;<img file="FDA0001130394240000021.GIF" wi="250" he="271" />其中所述i=1、2、……、N;S2.4:根据网站浏览量的实际访问量的对数的方差及第i个所述历史同时间段的访问量的对数的回归系数计算第i个所述历史同时间段估计当前访问量的对数的偏差;<img file="FDA0001130394240000022.GIF" wi="957" he="133" />其中所述i=1、2、……、N;S2.5:根据第i个所述历史同时间段估计当前访问量的对数的偏差用优化最小化方法求解第i个所述历史同时间段估计权重;<maths num="0001"><math><![CDATA[<mrow><mi>m</mi><mi>i</mi><mi>n</mi><mfrac><mn>1</mn><mi>K</mi></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msup><mrow><mo>(</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>w</mi><mi>i</mi></msub><mo>*</mo><msub><mi>X</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>-</mo><msub><mi>y</mi><mi>j</mi></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>w</mi><mi>i</mi><mn>2</mn></msubsup><mo>*</mo><msubsup><mi>s</mi><mi>i</mi><mn>2</mn></msubsup></mrow>]]></math><img file="FDA0001130394240000023.GIF" wi="1246" he="142" /></maths><maths num="0002"><math><![CDATA[<mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>w</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn></mrow></mtd></mtr><mtr><mtd><mrow><mo>-</mo><mn>1</mn><mo>&le;</mo><msub><mi>w</mi><mi>i</mi></msub><mo>&le;</mo><mn>1</mn><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mn>...</mn><mo>,</mo><mi>N</mi></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001130394240000024.GIF" wi="837" he="211" /></maths>S2.6:根据权重预测当前时间点之后走势的访问量的对数;<img file="FDA0001130394240000025.GIF" wi="353" he="118" />其中所述j=K+1、K+2、……、M;S2.7:预测结果处理,以a为底数对z<sub>j</sub>做指数变换,即实际预测结果访问量为<img file="FDA0001130394240000026.GIF" wi="102" he="62" />
地址 100080 北京市海淀区丹棱街3号B座10层1010室