发明名称 一种检索排序方法及系统
摘要 本发明公开了一种检索排序方法,包括:接收查询短语并检索;返回检索结果;提取文档库中所有文档的低维特征;获取检索结果中多个文档的相关度反馈信息;生成相关度判断模型;计算检索结果中所有文档的相关度得分;返回按相关度得分高低排序的再次检索结果;本发明还公开了一种检索排序系统,包括:检索模块、特征提取模块、相关度反馈模块、排序模块、存储模块;本发明所提出的一种检索排序方法及系统,其能提供高效准确的检索结果。
申请公布号 CN102890711B 申请公布日期 2015.08.12
申请号 CN201210337904.4 申请日期 2012.09.13
申请人 中国人民解放军国防科学技术大学 发明人 陈洪辉;蔡飞;舒振;马建威
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京风雅颂专利代理有限公司 11403 代理人 李弘
主权项 一种检索排序方法,其特征在于,包括:在离线状态下提取文档库中各个文档的多维特征;接收查询短语并检索;返回检索结果;提取文档库中所有文档的低维特征;获取检索结果中多个文档的相关度反馈信息;生成相关度判断模型;计算检索结果中所有文档的相关度得分;返回按相关度得分高低排序的再次检索结果;其中,所述相关度判断模型的生成方法为:利用检索结果中多个文档的相关度反馈信息及其低维特征进行逻辑回归,具体包括:步骤501:将用户反馈的相关度值进行二值化,即;用户反馈值大于0时,y=1;用户反馈值等于0时,y=0,进而计算相关文档的概率PI和log((1‑PI)/PI)值;步骤502:设定文档用低维特征表示;步骤503:将步骤501和502结果作为逻辑回归函数的输入,进行统计分析,生成相关度判断模型,即为一组特征权重系数(a<sub>1</sub>,a<sub>2</sub>,…,a<sub>n</sub>);a<sub>1</sub>、a<sub>2</sub>、…、a<sub>n</sub>分别对应文档第一、二、……、n维特征对相关度的贡献权重;相关度得分=a<sub>1</sub>×F<sub>1</sub>+a<sub>2</sub>×F<sub>2</sub>+…+a<sub>n</sub>×F<sub>n</sub>,其中,F<sub>n</sub>为文档的低维特征,a<sub>n</sub>为该特征对应的系数。
地址 410073 湖南省长沙市开福区国防科技大学信息系统与管理学院重点实验室