发明名称 一种社区问答搜索中的查询补全方法
摘要 本发明涉及一种社区问答搜索中的查询补全方法,属于信息检索技术领域;包括以下步骤:一、构建cQA数据库;二、构建实体词典和词组词典;三、对于用户输入的查询语句,判断最后一个单词是否完整,若不完整,进行末尾单词补全;四、对查询语句通过采用排序函数对数据库中的问题进行排序得到初始候选问题列表;五、对列表根据发散性、大小适度、局部保序性和保真性要求进行筛选;六、按照候选问题的重要性和质量进行再排序;七、输出再排序后的前N条候选问题供用户选择。与现有技术相比,本发明可以在缺少用户搜索日志时进行查询补全,克服了现有方法中推荐相似问题、尺寸不符、相对顺序不变、失真的问题,用户体验上优于现有搜索引擎的使用效果。
申请公布号 CN105447080A 申请公布日期 2016.03.30
申请号 CN201510745059.8 申请日期 2015.11.05
申请人 华建宇通科技(北京)有限责任公司 发明人 黄河燕;毛先领;梅莉莉;黄静
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种社区问答搜索中的查询补全方法,其特征在于:步骤一、基于问答语料构建由问答对组成的cQA数据库;步骤二、基于现有百科知识资源和词典资源构建实体词典和词组词典;步骤三、对于用户输入的查询语句,判断查询语句的最后一个单词是否完整,若末尾单词不完整,转步骤四;否则,转步骤五;步骤四、对输入的查询语句进行末尾单词补全得到完整的查询语句;步骤五、对查询语句通过采用排序函数对数据库中的问题进行排序得到初始的供用户选择的候选问题列表;步骤六、对步骤四得到的初始候选问题列表根据发散性、大小适度、局部保序性和保真性的要求进行筛选;步骤七、对筛选后的候选问题列表按照候选问题的重要性和质量从高到低的顺序进行再排序;步骤八、输出再排序后的前N条候选问题供用户选择。
地址 100083 北京市海淀区学院路30号科群大厦(西楼203房间)