发明名称 |
一种综合视频元信息的混合切词标注方法及其系统 |
摘要 |
一种综合视频元信息的混合切词标注方法及系统,所述方法包括如下步骤:视频元信息收集步骤,多维度地收集视频自身相关的视频元信息,所述视频元信息包括视频自身属性和/或网站业务属性;视频元信息标签生成步骤,分析所述视频元信息与用户查询的关键词之间的语义关系,根据所述视频元信息生成视频元信息标签词;融合视频元信息标签的混合切词标注步骤,包括,切分与视频有关的基本文字信息,得到的切词输出为输出序列;对多组所述视频元信息标签分别进行切词,并标记输出为不同的输出序列。本发明将视频元信息翻译成文字标签,赋予较低的权值并添加到搜索引擎,以反向命中的方式改进了用户的搜索体验,且避免了主次颠倒的问题。 |
申请公布号 |
CN103559317A |
申请公布日期 |
2014.02.05 |
申请号 |
CN201310591037.1 |
申请日期 |
2013.11.22 |
申请人 |
合一网络技术(北京)有限公司 |
发明人 |
刘伟;姚键;潘柏宇;卢述奇 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种综合视频元信息的混合切词标注方法,包括如下步骤:视频元信息收集步骤S110,多维度地收集视频自身相关的视频元信息,所述视频元信息包括视频自身属性和/或网站业务属性;视频元信息标签生成步骤S120,分析所述视频元信息与用户查询的关键词之间的语义关系,根据所述视频元信息生成视频元信息标签词;融合视频元信息标签的混合切词标注步骤S130,包括S131,切分与视频有关的基本文字信息,得到的切词输出为输出序列;S132,对多组所述视频元信息标签分别进行切词,并标记输出为不同的输出序列。 |
地址 |
100080 北京市海淀区海淀大街8号中钢国际广场A座5层A、C区 |