发明名称 一种综合视频元信息的混合切词标注方法及其系统
摘要 一种综合视频元信息的混合切词标注方法及系统,所述方法包括如下步骤:视频元信息收集步骤,多维度地收集视频自身相关的视频元信息,所述视频元信息包括视频自身属性和/或网站业务属性;视频元信息标签生成步骤,分析所述视频元信息与用户查询的关键词之间的语义关系,根据所述视频元信息生成视频元信息标签词;融合视频元信息标签的混合切词标注步骤,包括,切分与视频有关的基本文字信息,得到的切词输出为输出序列;对多组所述视频元信息标签分别进行切词,并标记输出为不同的输出序列。本发明将视频元信息翻译成文字标签,赋予较低的权值并添加到搜索引擎,以反向命中的方式改进了用户的搜索体验,且避免了主次颠倒的问题。
申请公布号 CN103559317A 申请公布日期 2014.02.05
申请号 CN201310591037.1 申请日期 2013.11.22
申请人 合一网络技术(北京)有限公司 发明人 刘伟;姚键;潘柏宇;卢述奇
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种综合视频元信息的混合切词标注方法,包括如下步骤:视频元信息收集步骤S110,多维度地收集视频自身相关的视频元信息,所述视频元信息包括视频自身属性和/或网站业务属性;视频元信息标签生成步骤S120,分析所述视频元信息与用户查询的关键词之间的语义关系,根据所述视频元信息生成视频元信息标签词;融合视频元信息标签的混合切词标注步骤S130,包括S131,切分与视频有关的基本文字信息,得到的切词输出为输出序列;S132,对多组所述视频元信息标签分别进行切词,并标记输出为不同的输出序列。 
地址 100080 北京市海淀区海淀大街8号中钢国际广场A座5层A、C区