发明名称 搜索引擎的质量评估方法和装置
摘要 本发明公开了一种搜索引擎的质量评估方法和装置,该搜索引擎用于搜索多媒体资源,该质量评估方法包括:从用户日志获取单一查询词的用户深度停留数据;根据单一查询词的用户深度停留数据,获得全量查询词的用户深度停留数据;以及根据全量查询词的用户深度停留数据和原始评估指标,对搜索引擎的质量进行原始评估,其中,原始评估指标包括独立被点击多媒体资源的个数、每个查询词的被点击多媒体资源的平均个数、低于多媒体资源个数阈值的查询词的个数、多媒体资源播放完成比总体平均值、低于多媒体资源播放完成比阈值的查询词的个数中的至少一个。本发明能够无需进行人工标注、客观及时地对搜索引擎的质量进行评估。
申请公布号 CN105573887A 申请公布日期 2016.05.11
申请号 CN201510927675.5 申请日期 2015.12.14
申请人 合一网络技术(北京)有限公司 发明人 魏博;齐志兵;李力行;邹敏;唐广宇;顾思斌;潘柏宇;王冀
分类号 G06F11/30(2006.01)I;G06F11/36(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F11/30(2006.01)I
代理机构 北京林达刘知识产权代理事务所(普通合伙) 11277 代理人 刘新宇
主权项 一种搜索引擎的质量评估方法,所述搜索引擎用于搜索多媒体资源,其特征在于,所述质量评估方法包括:从用户日志获取单一查询词的用户深度停留数据,其中,所述单一查询词的用户深度停留数据包括:查询词、被点击多媒体资源集合、多媒体资源播放完成比集合、以及所述被点击多媒体资源集合到所述多媒体资源播放完成比集合的映射函数;根据所述单一查询词的用户深度停留数据,获得全量查询词的用户深度停留数据,其中,所述全量查询词的用户深度停留数据包括:全量查询词、当前查询词下的被点击多媒体资源、当前查询词下的被点击多媒体资源的被点击次数、以及当前查询词下的被点击多媒体资源的综合播放完成比;以及根据所述全量查询词的用户深度停留数据和原始评估指标,对所述搜索引擎的质量进行原始评估,其中,所述原始评估指标包括独立被点击多媒体资源的个数、每个查询词的被点击多媒体资源的平均个数、低于多媒体资源个数阈值的查询词的个数、多媒体资源播放完成比总体平均值、低于多媒体资源播放完成比阈值的查询词的个数中的至少一个。
地址 100080 北京市海淀区海淀大街8号中钢国际广场A座5层A、C区