主权项 |
一种基于家庭收视纪录的家庭分析及节目推荐方法,其特征在于所述方法包括以下步骤:1)收视纪录收集模块:获取家庭的收视纪录,包括家庭唯一标识、节目名称、收看时刻;2)时间‑兴趣耦合主题算法模块:根据收视纪录收集模块获取的所有家庭的收视纪录,通过时间‑兴趣耦合主题模型,将节目按兴趣分类,将收视时刻按时段分类,并计算每个家庭在不同时段看节目类型的分布;3)聚类及推荐模块:根据时间‑兴趣耦合主题算法模块得到的每个家庭在不同时段看节目类型的分布,对家庭收视习惯做聚类,向家庭推荐节目;所述的时间‑兴趣耦合主题算法模块,是一个概率生成模型,它分为节目分类模块、时刻分类模块和家庭分析模块,其中:所述的节目分类模块,是通过时间‑兴趣耦合主题模型,仅有家庭收视纪录的数据的情况下,自动将节目按兴趣分类,对于每一个节目类别k,计算类别生成节目概率的向量φk=[(φkw):i=1,2,...,Vw],其中Vw为电视节目数,φkw为类别k生成节目w的概率;对于每个类别,概率最大的10个节目反映这个类别的兴趣构成;一共有K类节目;所述的时刻分类模块,是通过时间‑兴趣耦合主题模型,仅有家庭收视纪录的数据的情况下,自动将时刻按收视时段分类,对于每一个时段分类l,计算类别生成时刻概率的向量ψl=[(ψlt):t=1,2,...,Vt],其中Vt为收看时刻数,Vt=168,ψlt为时段l生成时刻t的概率;对于每个时段,概率最大的10个时刻反映这个时段的构成;一共有L个时段;所述的家庭分析模块,是通过时间‑兴趣耦合主题模型,对家庭m生成时段——节目分布的矩阵Θm=[(Θmij):i=1,2,...,K;j=1,2,...,L],其中Θmij表示家庭m在时段j上观看i类节目的概率;其中,时间‑兴趣耦合主题模型,是指定节目分类数K,时段数L及平滑参数后,通过Gibbs采样,计算出类别分布φ,时段分布ψ以及家庭收视习惯分布Θ;所述的聚类模块,是通过对家庭收视习惯分布Θm聚类后,对家庭进行分类,对各 个类别的家庭做分析 |