发明名称 一种基于VideoBag特征的精准广告投放系统及方法
摘要 本发明属于互联网技术领域,特别涉及一种广告投放系统及方法。其技术方案是:一种基于VideoBag特征的精准广告投放系统,包括以下模块:用户数据采集模块(1),视频节目鉴别能力计算和排序模块(2),VideoBag打包模块(3),权重计算模块(4),用户特征表生成模块(5),用户性别分类模型训练模块(6),用户年龄段分类模型训练模块(7),用户性别与年龄段预测模块(8),广告投放模块(9),它根据某广告投放的目标人群,向具有适合性别、年龄段标签的用户投放该广告。本发明直接利用用户的观看行为对目标受众进行高精度的性别、年龄的分类,在较大程度上提升了广告到达目标受众的精确度,从而有效地提升了广告效果。
申请公布号 CN102708497B 申请公布日期 2015.08.05
申请号 CN201210009483.2 申请日期 2012.01.13
申请人 合一网络技术(北京)有限公司 发明人 王晓龙;姚键;尹玉宗;卢学裕;严金龙;潘柏宇;卢述奇
分类号 G06F17/00(2006.01)I;G06Q30/02(2012.01)I 主分类号 G06F17/00(2006.01)I
代理机构 代理人
主权项 一种基于VideoBag特征的精准广告投放系统,其特征是:它包括:用户数据采集模块(1),视频节目鉴别能力计算和排序模块(2),VideoBag打包模块(3),权重计算模块(4),用户特征表生成模块(5),用户性别分类模型训练模块(6),用户年龄段分类模型训练模块(7),用户性别与年龄段预测模块(8),广告投放模块(9);所述用户数据采集模块(1)获取用户视频节目观看日志,并通过网上投递的调查问卷,收集用户性别、年龄信息;所述视频节目鉴别能力计算和排序模块(2)利用所述用户数据采集模块(1)收集的用户性别、年龄信息,计算各视频节目的性别鉴别能力I<sub>1</sub>和年龄鉴别能力I<sub>2</sub>:I<sub>1</sub>=(man_view‑woman_view)/(man_view+woman_view)I<sub>2</sub>=(in_group_view‑not_in_group_view)/(in_group_view+not_in_group_view)式中:man_view为该视频节目被男性观看的次数,woman_view为被女性观看的数次;in_group_view为该视频节目被属于年龄段[min_age,max_age]用户的观看次数,not_in_group_view为不属于年龄段[min_age,max_age]用户的观看次数;将所有视频节目分别按I<sub>1</sub>、I<sub>2</sub>值大小进行两个排序,分别称为I<sub>1</sub>排序和I<sub>2</sub>排序;在每个排序中为每个视频节目赋予相应ID编号;所述VideoBag打包模块(3)将所述视频节目鉴别能力计算和排序模块(2)给出的I<sub>1</sub>排序和I<sub>2</sub>排序,分别依序每m个视频节目打包在一起得到一个VideoBag,最后一个VideoBag中视频节目不足m个则按实际数量;从1开始,为每个VideoBag赋予一个编号,从而得到分别对应I<sub>1</sub>排序和I<sub>2</sub>排序的两个VideoBag序列;所述权重计算模块(4)计算各个VideoBag中所有视频节目的I<sub>1</sub>或I<sub>2</sub>绝对值的平均值;并令其为本VideoBag的权重Weight;所述用户特征表生成模块(5)从所述用户数据采集模块(1)获取的用户视频节目观看日志,将每个用户在一段时间内观看的所有视频节目列表,将该表中的每一视频节目在I<sub>1</sub>排序和I<sub>2</sub>排序中的ID编号转换成所在VideoBag的编号和权重Weight,得到每个用户的特征列表;由于观看次数过少的样本数据噪声较大,故剔除观看视频节目次数少于k次的用户样本;设得到UserNum个已知性别、所属年龄段的用户特征列表;将这UserNum个用户特征列表分为两部分,一部分用于训练,另一部分用于用户测试;所述用户性别分类模型训练模块(6)使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成模块(5)提供的一部分用户特征列表,将其中男性用户作为正样本、女性用户作为反样本进行训练,并以所述用户特征表生成模块(5)提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为性别模型;所述用户年龄段分类模型训练模块(7)使用支持向量机作为分类器,按照机器学习分类算法的常规方式进行训练,训练数据来源为所述用户特征表生成模块(5)提供的一部分用户特征列表,将其中年龄属于要求年龄段[min_age,max_age]的用户作为正样本、其他年龄段的用户作为反样本进行训练,并以所述用户特征表生成模块(5)提供的另一部分用户特征列表为测试数据进行测试,训练结果为支持向量机分类模型,选择测试结果最优的训练结果,命名该模型为年龄段模型;所述用户性别与年龄段预测模块(8)对所述用户数据采集模块(1)获取的性别、年龄段未知的用户,依据其视频节目观看日志,使用所述性别模型预测其性别,使用所述年龄段模型预测其年龄段,得到对该用户性别与年龄段的预测结果;基于预测结果,对该用户赋予性别、年龄段标签;所述广告投放模块(9)根据所述用户性别与年龄段预测模块(8)给出的用户性别、年龄段标签,按照某广告投放的目标人群,向具有适合性别、年龄段的用户投放该广告。
地址 100080 北京市海淀区海淀大街8号中钢国际广场A座5层A、C区