发明名称 名人视频搜索结果个性化排序的方法
摘要 本发明提供了一种名人视频搜索结果个性化排序的方法。本方法同时考虑了用户和待搜索名人特点,在不同数据集上分析用户的兴趣分布和待搜索名人的流行分布,有效地表达了用户的兴趣主题和待搜索名人的流行主题,并对用户兴趣主题和名人流行主题进行有效关联,从而提高了个性化排序的准确性。
申请公布号 CN102880728B 申请公布日期 2015.10.28
申请号 CN201210427389.9 申请日期 2012.10.31
申请人 中国科学院自动化研究所 发明人 徐常胜;邓拯宇
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 曹玲柱
主权项 一种名人视频搜索结果个性化排序的方法,其特征在于,包括:为多个预设待搜索名人分别建立文档,利用该文档由主题模型建立统一的流行主题空间,并分析各待搜索名人在该流行主题空间的分布向量;利用用户与互联网的在线交互记录建立用户文档,由多个用户文档利用主题模型建立统一的兴趣主题空间,并得到多个用户分别在该兴趣主题空间的分布向量;将流行主题空间和兴趣主题空间中各潜在主题的语义词汇进行整合,利用词网得到整合后各语义词汇之间的相似度,建立状态转移矩阵;根据所述状态转移矩阵,利用随机游走迭代过程更新流行主题空间和兴趣主题空间中各潜在主题在整合后各语义词汇上的概率分布,用相对熵连接兴趣主题空间与流行主题空间中的潜在主题;分别利用每个待搜索名人视频的语义词汇和类别为每个待搜索名人视频建立文档,然后将其分别映射至上述兴趣主题空间,得到每个待搜索名人视频在兴趣主题空间的分布向量;以及利用用户,待搜索名人以及待搜索名人视频在兴趣主题空间分布向量的内积对视频序列重排序;其中,所述为多个预设待搜索名人分别建立文档的步骤包括:收集整理多个待搜索名人分别的词条信息;利用词网过滤上述多个待搜索名人词条信息中的噪声,滤除所述多个待搜索名人词条信息除名词成分之外的其他成分;对于多个待搜索名人中的每一个,利用其对应的词条信息的名词成分建立待搜索名人文档;其中,所述利用用户与互联网的在线交互记录建立用户文档的步骤包括:收集多个用户分别上传或收藏的互联网资源的语义词汇和类别;利用词网过滤上述语义词汇和类别中的噪声,滤除所述语义词汇和类别中除名词成分之外的其他成分;对于多个用户中的每一个,利用所述语义词汇和类别中的名词成分建立用户文档。
地址 100190 北京市海淀区中关村东路95号