发明名称 一种基于LDA模型的电视用户家庭成员分析方法
摘要 本发明公开了一种基于LDA模型的电视用户家庭成员分析方法,步骤如下:提取数据库中影片的信息,对影片信息进行分词;将分词后的词语作为LDA模型输入;通过LDA模型的计算得到影片所涉及的各个主题、分词后的词语在各个主题上的分布概率和影片在各个主题上的分布概率;一天24小时均匀划分为若干时间段,根据用户在的不同时间段内观看的影片历史记录,得到用户特征向量;根据用户在各个主题上的概率分布,推断用户的成员组成,然后结合用户特征向量分析家庭中每名用户活跃的时间段;当电视再次被打开时,根据打开的时间所归属的时间段找到对应的用户特征向量,根据用户特征向量找出用户偏爱的影片主题,推断出的家庭成员类别,并进行节目推荐。
申请公布号 CN105516810A 申请公布日期 2016.04.20
申请号 CN201510890345.3 申请日期 2015.12.04
申请人 山东大学 发明人 曹叶文;雷鹏
分类号 H04N21/45(2011.01)I;H04N21/466(2011.01)I 主分类号 H04N21/45(2011.01)I
代理机构 济南圣达知识产权代理有限公司 37221 代理人 张勇
主权项 一种基于LDA模型的电视用户家庭成员分析方法,其特征是,包括如下步骤:步骤(1):提取数据库中影片的信息,对影片信息进行分词,所述影片是电影或电视节目;所述影片信息包括标题、标签和简介;步骤(2):将步骤(1)的分词后的词语作为LDA模型输入向量;通过LDA模型的计算得到影片所涉及的各个主题、分词后的词语在各个主题上的分布概率和影片在各个主题上的分布概率;一个主题代表一种类型的影片;步骤(3):一天24小时均匀划分为若干时间段,根据用户在的不同时间段内观看的影片历史记录,对用户进行建模,得到用户特征向量;步骤(4):分析步骤(3)的用户的特征向量,根据用户在各个主题上的概率分布,推断用户的成员组成,然后结合用户特征向量分析家庭中每名用户活跃的时间段;步骤(5):当电视再次被打开时,根据打开的时间所归属的时间段找到对应的用户特征向量,根据用户特征向量找出用户偏爱的影片主题,推断出的家庭成员类别,并进行节目推荐。
地址 250061 山东省济南市历城区山大南路27号