发明名称 基于检索词歧义性和用户偏好的视频搜索方法
摘要 本发明公开了一种基于检索词的歧义性和用户偏好的视频搜索方法,包括:获取视频,抽取视频的相关文本信息,为相关文本信息建立文本索引,抽取视频分类信息,并建立视频分类模型,输入检索词,查找文本索引,以得到相关文本信息与检索词对应的视频有序集合,根据检索词对应的点击记录生成检索词对应的歧义性描述信息,生成本次搜索会话中用户的短期偏好描述信息及长期偏好描述信息,并将短期偏好描述信息及长期偏好描述信息拟合成用户偏好描述信息,根据用户选定的视频更新用户的短期偏好描述信息和长期偏好描述信息。本发明能针对具有不同偏好的用户重排、优化视频搜索结果,具有效率高、可用性强、对用户的感知侵扰小等特点。
申请公布号 CN102521321B 申请公布日期 2013.07.31
申请号 CN201110396519.2 申请日期 2011.12.02
申请人 华中科技大学 发明人 金海;廖小飞;陆枫;贾旺喜
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 华中科技大学专利中心 42201 代理人 朱仁玲
主权项 1.一种基于检索词歧义性和用户偏好的视频搜索方法,包括以下步骤:获取视频,抽取所述视频的相关文本信息,为所述相关文本信息建立文本索引,抽取视频分类信息,并建立视频分类模型;包括:抽取所述视频的分类字段文本,将所述分类字段文本归类到维度为n的视频分类空间之中的某一个分类i中,以建立所述视频的分类向量D={d<sub>0</sub>,d<sub>1</sub>,...,d<sub>j</sub>,...,d<sub>n-1</sub>},其中<maths num="0001"><![CDATA[<math><mrow><msub><mi>d</mi><mi>j</mi></msub><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mn>1</mn><mo>,</mo><mi>j</mi><mo>=</mo><mi>i</mi></mtd></mtr><mtr><mtd><mn>0</mn><mo>,</mo><mi>j</mi><mo>&NotEqual;</mo><mi>i</mi></mtd></mtr></mtable></mfenced><mo>;</mo></mrow></math>]]></maths>将所述视频的分类向量D存入所述视频分类模型;如果还有未被分类的视频则重复以上步骤;输入检索词,查找所述文本索引,以得到所述相关文本信息与所述检索词对应的视频有序集合;根据所述检索词对应的点击记录生成所述检索词对应的歧义性描述信息,是采用以下公式:<maths num="0002"><![CDATA[<math><mrow><mi>ClickEntropy</mi><mrow><mo>(</mo><mi>q</mi><mo>)</mo></mrow><mo>=</mo><munder><mi>&Sigma;</mi><mrow><mi>p</mi><mo>&Element;</mo><mi>W</mi><mrow><mo>(</mo><mi>q</mi><mo>)</mo></mrow></mrow></munder><mo>-</mo><mi>W</mi><mrow><mo>(</mo><mi>p</mi><mo>|</mo><mi>q</mi><mo>)</mo></mrow><msub><mi>log</mi><mn>2</mn></msub><mi>W</mi><mrow><mo>(</mo><mi>p</mi><mo>|</mo><mi>q</mi><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths>其中,ClickEntroy(q)是所述检索词q对应的歧义性描述信息,W(q)是根据所述检索词q选中的所有视频集合,W(p|q)是根据所述检索词q选中的所有记录中所选视频属于第p类视频的记录所占的百分比;生成本次搜索会话中用户的短期偏好描述信息及长期偏好描述信息,并将所述短期偏好描述信息及所述长期偏好描述信息拟合成用户偏好描述信息;包括:计算所述视频分类模型所在的所述视频分类空间的维数n;生成默认的维数为所述维数n的偏好向量<img file="FDA00002842616600021.GIF" wi="599" he="129" />P<sub>0</sub>代表用户在每个分类下的偏好权值都为<img file="FDA00002842616600022.GIF" wi="157" he="130" />获取用户识别号,根据用户识别号从所述用户偏好描述信息中判断是否存在所述用户长期偏好描述信息,如果存在所述用户长期偏好描述信息则读出所述用户长期偏好描述信息并生成归一化向量P<sub>L</sub>={l<sub>0</sub>,l<sub>1</sub>,l<sub>2</sub>,l<sub>3</sub>,...,l<sub>n-1</sub>},其中l<sub>i</sub>代表用户在分类i上的长期偏好权值,如果不存在则赋予P<sub>L</sub>为所述默认的偏好向量P<sub>0</sub>,再将P<sub>L</sub>存入所述用户偏好描述信息中;获取搜索会话识别号,根据搜索会话识别号从所述用户偏好描述信息中判断是否存在所述用户短期偏好描述信息,如果存在所述用户短期偏好描述信息则读出所述用户短期偏好描述信息并生成归一化向量P<sub>S</sub>={s<sub>0</sub>,s<sub>1</sub>,s<sub>2</sub>,s<sub>3</sub>,...,s<sub>n-1</sub>},其中s<sub>i</sub>代表用户在分类i上的短期偏好权值,如果不存在则赋予P<sub>S</sub>为所述默认的偏好向量P<sub>0</sub>,再将P<sub>S</sub>存入所述用户偏好描述信息中;通过线性拟合的方法生成用户最终偏好向量P=α*P<sub>L</sub>+(1-α)*P<sub>S</sub>,其中α是长期偏好影响因子,且α=0.5;根据所述歧义性描述信息及所述用户偏好描述信息对所述视频有序集合中的视频重新排序,并输出排序后的视频有序集合;包括:利用公式<maths num="0003"><![CDATA[<math><mrow><mi>Sim</mi><mrow><mo>(</mo><mi>P</mi><mo>,</mo><mi>D</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>i</mi><mo>=</mo><mi>n</mi><mo>-</mo><mn>1</mn></mrow></munderover><mrow><mo>(</mo><msub><mi>d</mi><mi>i</mi></msub><mo>*</mo><msub><mi>p</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>/</mo><mrow><mo>(</mo><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>i</mi><mo>=</mo><mi>n</mi><mo>-</mo><mn>1</mn></mrow></munderover><msubsup><mi>d</mi><mi>i</mi><mn>2</mn></msubsup></msqrt><mo>*</mo><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>i</mi><mo>=</mo><mi>n</mi><mo>-</mo><mn>1</mn></mrow></munderover><msubsup><mi>p</mi><mi>i</mi><mn>2</mn></msubsup></msqrt><mo>)</mo></mrow></mrow></math>]]></maths>计算出所述用户最终偏好向量P和所述视频的分类向量D的相似度;在所述视频有序集合中取出视频的相关文本与所述检索词的文本相关性大小,记为原始得分S<sub>0</sub>;获取检索词q的歧义性大小描述值ClickEntropy(q);计算出每个视频的最终得分<maths num="0004"><![CDATA[<math><mrow><mfenced open='' close=''><mtable><mtr><mtd><mi>S</mi><mo>=</mo><msub><mi>&beta;S</mi><mn>0</mn></msub><mo>+</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mi>&beta;</mi><mo>)</mo></mrow><mo>*</mo><mi>Sim</mi><mrow><mo>(</mo><mi>P</mi><mo>,</mo><mi>D</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mo>*</mo><mi>exp</mi><mrow><mo>(</mo><mi>ClickEntropy</mi><mrow><mo>(</mo><mi>q</mi><mo>)</mo></mrow><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow></math>]]></maths>其中β是原始得分影响因子,且β=0.3;根据所述视频的最终得分对所述视频有序集合进行重新排序,并输出结果;在用户从所述视频有序集合中选定视频后,更新所述检索词对应的点击记录,将用户识别号、所述检索词、本次搜索会话的识别号、选定的视频及其视频分类信息存入数据库;根据所述用户选定的视频更新所述用户的短期偏好描述信息和所述长期偏好描述信息,包括:对于所述用户的所述长期偏好向量,取偏好向量权值递增因子γ<sub>1</sub>=0.1,将所述P<sub>L</sub>更新为P<sub>L</sub>=P<sub>L</sub>+γ<sub>1</sub>D/|P<sub>L</sub>+γ<sub>1</sub>D|并存入所述用户偏好描述信息中;对于所述用户的所述短期偏好向量,取偏好向量权值递增因子γ<sub>2</sub>=0.3,将所述P<sub>s</sub>更新为P<sub>s</sub>=P<sub>s</sub>+γ<sub>2</sub>D/|P<sub>s</sub>+γ<sub>2</sub>D|并存入所述用户偏好描述信息中。
地址 430074 湖北省武汉市洪山区珞喻路1037号