发明名称 IPTV视频业务中用户满意度的智能化预测方法
摘要 本发明提出了IPTV视频业务中用户满意度的智能化预测方法,用于解决现有用户满意度预测方法中需要通过主观打分来度量用户满意度以及用户满意度与其影响因素之间内在关联性建模不够准确合理等缺陷。本发明的实施流程为:首先确定影响用户满意度的因素,而后用用户使用业务时长来客观度量用户满意度,接着通过训练建立CART树模型,并用其将待预测数据划分到相关区域,在该区域内用KNN搜索,并最终用距离加权平均值作为预测结果。采用本发明的方法,可以有效地降低预测过程中的运算量,并且使得预测精度得到较大的提升。
申请公布号 CN106534976A 申请公布日期 2017.03.22
申请号 CN201610890494.4 申请日期 2016.10.12
申请人 南京邮电大学 发明人 魏昕;高赟;黄若尘;周亮
分类号 H04N21/442(2011.01)I;H04N21/45(2011.01)I;H04N21/466(2011.01)I;H04N21/61(2011.01)I 主分类号 H04N21/442(2011.01)I
代理机构 南京知识律师事务所 32207 代理人 李湘群
主权项 IPTV视频业务中用户满意度的智能化预测方法,其特征在于,所述方法包括如下步骤:步骤1:确定影响用户满意度的因素:从IPTV机顶盒收集的视频业务的关键性能指标KPI原始记录中,挑选固定时间长度的KPI数据,每条KPI数据中包含6个属性:设备传输时延df、设备传输抖动jit、设备丢包率lp、平均传输比特率br、业务开始时间、业务结束时间;该时间长度内各个用户的所有KPI数据的前4个属性{df,jit,lp,br}的平均值作为影响用户满意度的因素<img file="FDA0001129002360000011.GIF" wi="243" he="62" />其中x<sub>n</sub>=(x<sub>n,df</sub>,x<sub>n,jit</sub>,x<sub>n,lp</sub>,x<sub>n,br</sub>);步骤2:确定用户满意度的客观度量:将每个用户固定时间长度内的每个KPI数据中的结束时间减去开始时间,并将其累加,得到用户在该固定时间长度内使用业务的时长,即,<img file="FDA0001129002360000012.GIF" wi="251" he="63" />步骤3:建立分类回归CART树模型及训练:(3‑1)将(X,Y)作为训练数据,对于X中的某个属性j(j∈{df,jit,lp,br}),用其作为切分变量;对于该切分变量j,选择切分点s,将X划分成两个区域:R<sub>1</sub>(j,s)={x<sub>n</sub>|x<sub>n,j</sub>≤s}和R<sub>2</sub>(j,s)={x<sub>n</sub>|x<sub>n,j</sub>>s}(3‑2)分别求两个区域中的x<sub>n</sub>对应的y<sub>n</sub>的均值c<sub>1</sub>和c<sub>2</sub>,即<img file="FDA0001129002360000013.GIF" wi="413" he="135" /><img file="FDA0001129002360000014.GIF" wi="420" he="135" />其中N<sub>1</sub>和N<sub>2</sub>分别为两个区域中的数据数目;(3‑3)计算平方误差:<img file="FDA0001129002360000015.GIF" wi="1062" he="111" />(3‑4)遍历所有的j和s,选择使得平方误差最小的最优值j*和s*作为分类回归树第一层切分变量和切分点,即,(j*,s*)=argminError(j,s);用最终选定的(j*,s*)划分出子区域R<sub>1</sub>(j*,s*),R<sub>2</sub>(j*,s*),保存落在每个子区域中的训练数据D<sub>1</sub>,D<sub>2</sub>,如下:R<sub>1</sub>(j*,s*)={x<sub>n</sub>|x<sub>n,j*</sub>≤s*},R<sub>2</sub>(j*,s*)={x<sub>n</sub>|x<sub>n,j*</sub>>s*}D<sub>1</sub>={(x<sub>n</sub>,y<sub>n</sub>)|x<sub>n</sub>∈R<sub>1</sub>(j*,s*)},D<sub>2</sub>={(x<sub>n</sub>,y<sub>n</sub>)|x<sub>n</sub>∈R<sub>2</sub>(j*,s*)}(3‑5)对已划分好的两个子区域,考虑剩余的属性,调用(3‑1)~(3‑4)的步骤,继续对每个子区域进行进一步划分,并对划分好的二级、三级子区域中的训练数据进行存储,直至满足停止条件;这里的停止条件为所有的4个属性已经全部被遍历或者在子区域生成过程中计算出的Error(j,s)的最小值低于阈值ε;通过本步骤,最终生成CART树;步骤4:预测用户满意度:(4‑1)对于待预测用户满意度的数据x',按照所生成的CART树的结构,自上而下,将其分配到相应的叶节点所在的区域,设该区域为D';(4‑2)对于x',在D'中做KNN搜索,基于欧氏距离找到其中的K个近邻数据<img file="FDA0001129002360000021.GIF" wi="163" he="70" />计算距离加权平均值,用该均值作为最终的预测值输出y',即:<img file="FDA0001129002360000022.GIF" wi="333" he="175" />其中<img file="FDA0001129002360000023.GIF" wi="360" he="124" />上式中d(x',x<sub>k</sub>)为x'与其邻居节点x<sub>k</sub>的欧氏距离。
地址 210003 江苏省南京市鼓楼区新模范马路66号