发明名称 信息检索方法和系统
摘要 本发明提供了信息检索方法和系统,根据用户输入的查询请求从大量信息构成的信息集合中搜索所希望的信息,其中,确定影响用户对网页与查询请求相关性判断的多个因素,作为个性化特征;对于各个个性化特征设定相关的权重,且分别基于各个所述个性化特征建立反映用户的查询请求与信息集合中的信息之间的相关性的检索模型,通过所述的权重将所述检索模型组合成用户兴趣模型;接受用户的查询请求,分别通过各个所述的检索模型对所述信息集合中的信息进行检索,分别生成一个有序网页列表;通过所述的用户兴趣模型,计算每个所述检索模型得到的有序信息列表中的每一条信息与所述查询请求的相关度;根据所述用户兴趣模型输出的相关度,输出最终的检索结果。
申请公布号 CN101520785B 申请公布日期 2012.09.05
申请号 CN200810081556.2 申请日期 2008.02.29
申请人 富士通株式会社 发明人 于浩;夏迎炬;骆卫华;刘群
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京三友知识产权代理有限公司 11127 代理人 黄纶伟
主权项 一种信息检索方法,根据用户输入的查询请求从大量信息构成的信息集合中搜索所希望的信息,该方法包括以下步骤:确定影响用户对信息与查询请求间的相关性判断的多个因素,作为个性化特征;对于各个个性化特征设定相关的权重,且分别基于各个所述个性化特征建立反映用户的查询请求与信息集合中的信息之间的相关性的多个检索模型,通过所述的权重将所述多个检索模型组合成用户兴趣模型;接受用户的查询请求,分别通过各个所述的检索模型对所述信息集合进行检索,分别生成一个有序信息列表;通过所述的用户兴趣模型,计算每个所述检索模型得到的有序信息列表中的每一条信息与所述查询请求的相关度;根据所述用户兴趣模型输出的相关度,输出最终检索结果,其中,分别通过各个所述的检索模型对所述信息集合进行检索包括:第一检索模型基于查询语句和网页的纯文本特征进行检索;第二检索模型在纯文本的基础上考虑时间因素进行检索;第三检索模型利用命名实体识别获得的信息,利用向量空间模型进行查询,以对原始网页序列中每个网页的次序进行调整;以及第四检索模型对用户输入的查询语句进行扩展,把扩展结果和用户输入的原始查询合并组成新的查询语句,然后进行检索。
地址 日本神奈川县川崎市