发明名称 一种游戏数据的智能化分析方法
摘要 本发明公开了一种游戏数据的智能化分析方法,步骤如下:实时接收客户端回馈的数据,并将数据缓存在Redis先进先出队列中;从Redis先进先出队列中提取数据;对提取的数据进行合法性验证;根据预设的统计目标,对数据进行去重;将数据中每个用户个体统计为一个向量,对所有用户个体的信息进行差异统计处理;提取用户行为特征及差异检测,使用互信息熵进行计算;计算两个事件的联合熵;计算互信息MI;将行为差值与MI做商,取得新的差值;计算出第i个及第i‑1个行为的熵HIi,并求这两个联合分布率,求出MIi的值,以得到差值Di;11)对差值Di进行解析,并将解析结果计入统计结果数据库中。本发明能够对数据进行快速分析处理,实用性强。
申请公布号 CN105956873A 申请公布日期 2016.09.21
申请号 CN201610247380.8 申请日期 2016.04.08
申请人 杭州碧游信息技术有限公司 发明人 刘颖
分类号 G06Q30/02(2012.01)I 主分类号 G06Q30/02(2012.01)I
代理机构 代理人
主权项 一种游戏数据的智能化分析方法,其特征在于,步骤如下:1)实时接收客户端回馈的数据,并将数据缓存在Redis先进先出队列中,其中客户端回馈的数据已经预先定义了数据格式;2)从Redis先进先出队列中提取数据;3)对提取的数据进行合法性验证,若验证合法,则进行步骤4),否则,丢弃该数据,返回步骤2);4)根据预设的统计目标,对数据进行去重;5)将数据中每个用户个体统计为一个向量,对所有用户个体的信息进行差异统计处理:<maths num="0001"><math><![CDATA[<mrow><mi>F</mi><mi>d</mi><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>x</mi><mo>=</mo><mn>1</mn></mrow><mi>H</mi></munderover><munderover><mo>&Sigma;</mo><mrow><mi>y</mi><mo>=</mo><mn>1</mn></mrow><mi>W</mi></munderover><mo>|</mo><msub><mi>f</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>f</mi><mn>2</mn></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>|</mo><mo>/</mo><mi>H</mi><mi>W</mi></mrow>]]></math><img file="FSA0000129016630000011.GIF" wi="1218" he="206" /></maths>其中H为游戏行为数量,W为用户样本数量,f(x,y)为用户每日行为向量,以此,计算出用户两日行为的平均差异数值,同理对个体用户进行单独统计,计算出用户在游戏过程中的游戏行为波动情况,以建立起用户行为波动曲线;6)提取用户行为特征及差异检测,使用互信息熵进行计算:<maths num="0002"><math><![CDATA[<mrow><mi>H</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mo>-</mo><munder><mo>&Sigma;</mo><mrow><mi>x</mi><mo>&Element;</mo><mi>A</mi><mrow><mo>(</mo><mi>X</mi><mo>)</mo></mrow></mrow></munder><msub><mi>P</mi><mi>X</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><msub><mi>logP</mi><mi>X</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow>]]></math><img file="FSA0000129016630000012.GIF" wi="1002" he="146" /></maths>其中,此时熵的单位为行为数;7)计算两个事件的联合熵:<maths num="0003"><math><![CDATA[<mrow><mi>H</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mo>-</mo><munder><mo>&Sigma;</mo><mrow><mi>x</mi><mo>&Element;</mo><mi>A</mi><mrow><mo>(</mo><mi>X</mi><mo>)</mo></mrow><mo>,</mo><mi>y</mi><mo>&Element;</mo><mi>A</mi><mrow><mo>(</mo><mi>y</mi><mo>)</mo></mrow></mrow></munder><msub><mi>P</mi><mrow><mi>x</mi><mi>y</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><msub><mi>logP</mi><mrow><mi>x</mi><mi>y</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FSA0000129016630000013.GIF" wi="1177" he="158" /></maths>8)计算互信息MI:MI(x,y)=H(x)+H(y)‑H(x,y);9)将行为差值与MI做商,取得新的差值为:<maths num="0004"><math><![CDATA[<mrow><msub><mi>D</mi><mi>i</mi></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><mrow><mo>(</mo><msub><mi>H</mi><mi>i</mi></msub><mo>(</mo><mi>j</mi><mo>)</mo><mo>-</mo><msub><mi>H</mi><mi>i</mi></msub><mo>-</mo><mo>(</mo><mrow><mi>j</mi><mo>-</mo><mn>1</mn></mrow><mo>)</mo><mo>)</mo></mrow><mo>/</mo><mi>M</mi><mi>I</mi></mrow>]]></math><img file="FSA0000129016630000021.GIF" wi="1082" he="183" /></maths>其中,N为划分的时间区间的个数,Hi(j)为第i个行为发生第j日里的概率;10)计算出第i个行为的熵HIi为:<maths num="0005"><math><![CDATA[<mrow><msub><mi>HI</mi><mi>i</mi></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mo>-</mo><msub><mi>H</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><msub><mi>logH</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mrow>]]></math><img file="FSA0000129016630000022.GIF" wi="820" he="175" /></maths>同理,计算出第i‑1个行为的熵,并求这两个联合分布率,求出MIi的值,以得到差值Di;11)对差值Di进行解析,并将解析结果计入统计结果数据库中。
地址 310000 浙江省杭州市滨江区建业路511号华业大厦9楼918室