主权项 |
一种名人视频搜索结果个性化排序的方法,其特征在于,包括:为多个预设待搜索名人分别建立文档,利用该文档由主题模型建立统一的流行主题空间,并分析各待搜索名人在该流行主题空间的分布向量;利用用户与互联网的在线交互记录建立用户文档,由多个用户文档利用主题模型建立统一的兴趣主题空间,并得到多个用户分别在该兴趣主题空间的分布向量;将流行主题空间和兴趣主题空间中各潜在主题的语义词汇进行整合,利用词网得到整合后各语义词汇之间的相似度,建立状态转移矩阵;根据所述状态转移矩阵,利用随机游走迭代过程更新流行主题空间和兴趣主题空间中各潜在主题在整合后各语义词汇上的概率分布,用相对熵连接兴趣主题空间与流行主题空间中的潜在主题;分别利用每个待搜索名人视频的语义词汇和类别为每个待搜索名人视频建立文档,然后将其分别映射至上述兴趣主题空间,得到每个待搜索名人视频在兴趣主题空间的分布向量;以及利用用户,待搜索名人以及待搜索名人视频在兴趣主题空间分布向量的内积对视频序列重排序;其中,所述为多个预设待搜索名人分别建立文档的步骤包括:收集整理多个待搜索名人分别的词条信息;利用词网过滤上述多个待搜索名人词条信息中的噪声,滤除所述多个待搜索名人词条信息除名词成分之外的其他成分;对于多个待搜索名人中的每一个,利用其对应的词条信息的名词成分建立待搜索名人文档;其中,所述利用用户与互联网的在线交互记录建立用户文档的步骤包括:收集多个用户分别上传或收藏的互联网资源的语义词汇和类别;利用词网过滤上述语义词汇和类别中的噪声,滤除所述语义词汇和类别中除名词成分之外的其他成分;对于多个用户中的每一个,利用所述语义词汇和类别中的名词成分建立用户文档。 |