发明名称 一种利用社交网络中的学与网络效应来预测移动用户离网倾向和概率的方法
摘要 本发明包括三个步骤:首先,利用雪球式抽样法确定用户样本数据,并将该样本中用户之间的联系记录代入邻接矩阵,以绘制出t-1期和t期的个人逐月网络信息;然后通过使用用户个人信息和自学效应、向他人学效应及网络效应,建立“用户离网行为动态学模型”,该模型包括:用户在网概率公式和用户离网概率公式,利用t-1期个人逐月网络信息数据并采用两阶段嵌套定点估计方法对模型结构参数进行估值;最后利用条件概率,将步骤二中的参数以及样本中t期的个人逐月网络信息数据,代入用户在网概率公式和用户离网概率公式,得出用户行为的预测结果。本发明首次把社交网络概念融入用户离网预测模型,采用动态模型建模,真实地模拟了用户决策行为。
申请公布号 CN104598987A 申请公布日期 2015.05.06
申请号 CN201410779356.X 申请日期 2014.12.16
申请人 南京华苏科技股份有限公司 发明人 胡漫恬;欧阳晔;程艳云;闫兴秀
分类号 G06Q10/04(2012.01)I;G06Q50/00(2012.01)I 主分类号 G06Q10/04(2012.01)I
代理机构 南京知识律师事务所 32207 代理人 汪旭东
主权项 一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法,其特征在于,包括以下步骤:步骤一:样本数据采集所采集的数据包括用户个人信息和用户网络信息;利用雪球式抽样方法,首先选取一定数量的手机用户称为种子,在一段时间内即以月为单位的时间段,该时间分为两段:t‑1期和t期分别都以为月为单位,将与种子发生联系人的人员纳入样本,在同一段时间内再将与这些种子的联系人发生联系的人员纳入样本;如此进行n轮取值,归入总样本;然后将所有样本的个人信息逐月进行采集,同时针对种子及至前n‑1轮样本,将他们所有与各自联系人的联系记录逐月代入邻接矩阵,从而绘制出个人逐月的网络信息。步骤二:建立用户离网行为动态学习模型与参数估计本模型以用户离网行为的动态理论分析为基础,除了使用用户个人信息,还着重模拟了向自己学习效应、向别人学习效应以及网络效应四个因素对用户离网行为的影响。模型建立后将样本中t‑1期的用户个人逐月信息及其网络信息,分别带入用户在网概率公式和用户离网概率公式,并采用两阶段嵌套定点估计方式对用户离网行为动态学习模型的结构参数进行估值。用户在网概率公式:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>Prob</mi><mrow><mo>(</mo><msub><mi>d</mi><mi>it</mi></msub><mo>=</mo><mn>1</mn><mo>|</mo><msub><mi>I</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>exp</mi><mrow><mo>(</mo><msub><mi>V</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>I</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><mi>exp</mi><mrow><mo>(</mo><msub><mi>V</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>I</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>+</mo><mi>exp</mi><mrow><mo>(</mo><msub><mi>V</mi><mn>0</mn></msub><mrow><mo>(</mo><msub><mi>I</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6.3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000634410150000011.GIF" wi="1492" he="153" /></maths>用户离网概率公式:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>Prob</mi><mrow><mo>(</mo><msub><mi>d</mi><mi>it</mi></msub><mo>=</mo><mn>0</mn><mo>|</mo><msub><mi>I</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>exp</mi><mrow><mo>(</mo><msub><mi>V</mi><mn>0</mn></msub><mrow><mo>(</mo><msub><mi>I</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><mi>exp</mi><mrow><mo>(</mo><msub><mi>V</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>I</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>+</mo><mi>exp</mi><mrow><mo>(</mo><msub><mi>V</mi><mn>0</mn></msub><mrow><mo>(</mo><msub><mi>I</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>.</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000634410150000021.GIF" wi="1492" he="146" /></maths>其中:在网用户i的效用函数V<sub>1</sub>(I<sub>t</sub>)为:<img file="FDA0000634410150000022.GIF" wi="1870" he="302" />其中:U<sub>i1t</sub>表示:在时间周期t,在网用户i对当前网络运营商的抽象效用函数;S<sub>ict</sub>表示:在时间周期t,用户i接收到的当前网络新的信息;Net<sub>it</sub>代表在每个周期开始时用户i的网络大小;θX<sub>t</sub>是关于个人计划和用户特征的线性函数;ε<sub>it</sub>(d<sub>it</sub>)是每个用户选择偏好的误差项;VC(.)是延续函数,这是对下一个周期的效用函数的期望函数:<img file="FDA0000634410150000023.GIF" wi="2025" he="206" />β∈(0,1)是折现因子。同样的离网用户i的效用函数V<sub>0</sub>(I<sub>t</sub>)为:<img file="FDA0000634410150000024.GIF" wi="1864" he="327" />VX(.)是使用其它无线运营商的预期效用,它代表了机会成本:<img file="FDA0000634410150000031.GIF" wi="1752" he="74" />步骤三:利用条件概率理论,将步骤二中提取的参数以及样本中t期的用户个人逐月信息及其网络信息,代入用户在网概率公式和用户离网概率公式,进行计算,得出每位用户当月在网概率和离网概率,两者比较,较大的作为当月行为的预测结果。
地址 211399 江苏省南京市高淳县淳溪镇龙井路6号