发明名称 一种基于智能电视下用户观影行为分类方法
摘要 本发明公开了一种基于智能电视下用户观影行为分类方法,通过获取epg信息里面的channel_name,program_name,tags,start_time,end_time等字段;实现用户观看频次,观看时长等定义;在分类的基础之上,为用户打上标签,标识这个用户的观影行为。本发明在epg信息的获取,用户观影行为分类算法实现,用户观影行为标签系统实现三个方面实现了技术突破,解决了智能电视收视率体系下用户观影行为分类方法的问题。
申请公布号 CN105578259A 申请公布日期 2016.05.11
申请号 CN201510926101.6 申请日期 2015.12.14
申请人 四川长虹电器股份有限公司 发明人 孙永强;周清峰;唐军;蒲文龙;文艺霖
分类号 H04N21/433(2011.01)I;H04N21/45(2011.01)I;H04N21/466(2011.01)I 主分类号 H04N21/433(2011.01)I
代理机构 四川省成都市天策商标专利事务所 51213 代理人 秦华云
主权项 一种基于智能电视下用户观影行为分类方法,其特征在于:A、用户观影行为分类过程如下:A1、查询日期,A2、更新天数:对以前日期计算的结果重新计算,A3、数据的输入路径,该数据包括EPG信息中的频道名、节目名、标签、节目开始时间,节目结束时间;A4、获取数据的存储目录;B、Mapper函数处理:遍历每一条数据,并对其进行Mapper函数处理,将相应数据传输并进行Reducer函数处理;B1、Mapper启动时,获取步骤A中的数据,以及获取要查询日期的EPG信息;B2、将Mapper数据中频道ID与EPG中的频道ID进行匹配,如果匹配成功,则将该条数据中channel的名称替换成channel_name的名称,将该条数据中的program的名称替换成program_name的名称,并获得该条数据的播放开始时间和结束时间;如果匹配失败,则丢弃该条数据;B3、按照<key value>格式输出数据,所述<key value>格式为字符串存储格式;C、Reducer函数处理:对获得的同一个电视用户的所有观影行为进行处理,并将相应结果输出到HDFS上;C1、获取步骤B中的相应数据;C2、将该电视用户的观影数据放入List列表中;C3、对List列表按照时间戳字段进行从小到大排序;C4、遍历List列表;C4‑1、每次遍历获得第i与第i‑1数据,C4‑2、计算第i条数据在不同时段中的观影时间,C4‑3、分别按照<key value>格式输出全国和各个省份的观影时间以及全国频道收视分钟数;D、AddMR进行求和处理,即在同一时段,且在全国或省份中观看同一频道的分钟数进行累加求和;E、将上述的得到的数据运用社交网络分析算法建立用户观影行为标签系统;F、分类方法实现后可以对用户观看频次,观看时长做出定义,为用户打上标签,标识这个用户的观影行为。
地址 621000 四川省绵阳市高新区绵兴东路35号