发明名称 一种基于微博数据的多维度检索排序优化算法和工具
摘要 一种基于微博数据的多维检索排序优化算法和工具,该算法从数据特征、用户特征和应用特征三个维度对Lucene原始检索排序结果进行优化,使优化后的排序结果在体现数据特征、符合用户查询意图和契合应用主题等方面得到提升。多维度检索排序优化工具,完成基于金融微博数据的实现,分为三个模块,每个模块完成一个维度的优化。数据特征的排序优化模块实现维度一数据特征优化;用户特征的排序优化模块实现维度二用户特征优化,其包括两个子模块——检索标签和检索日志的优化子模块;应用特征的排序优化模块实现维度三应用特征优化。该工具适合优化所有Lucene的基本检索结果,可在某系统检索模块中实现Lucene原始检索结果的优化排序,给予用户更好的检索体验。
申请公布号 CN103823906A 申请公布日期 2014.05.28
申请号 CN201410101816.3 申请日期 2014.03.19
申请人 北京邮电大学 发明人 闫丹凤;张丽莹;徐佳
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于微博数据的多维检索排序优化算法,其特征在于:结合微博数据特点,从检索数据特征、检索用户特征和系统应用特征三个维度,对Lucene原始检索排序结果进行综合多维度的优化调整,使优化后的排序结果更加体现数据特征、更加符合用户的真实查询意图、更加契合应用的主题。多维度检索排序优化工具定义了以下三个维度,使用多维检索排序优化算法,对基于金融微博数据Web应用进行检索排序优化的实现,最后对基于金融微博数据实现的工具进行数据测试,证明了此工具的有效性:维度一是检索数据特征,在此维度上全面考虑数据的特点,尤其是微博数据不同于传统数据的显著区别,基于此区别对排序结果进行优化;维度二是检索用户特征,主要探究用户的真实检索意图,使更符合用户检索意图的检索结果优先返回;维度三是系统应用特征,针对某一应用的特定主题,对检索结果进行优化,使更契合主题的检索结果优先返回。
地址 100876 北京市海淀区西土城路10号