发明名称 检索确认句的方法和系统
摘要 提供一种从句子数据库中检索确认句以响应查询的方法及系统。搜索引擎从句子数据库中检索确认句以响应查询。在检索确认句时,搜索引擎基于该查询定义索引单元,索引单元包括来自该查询的词条及和与该查询关联的扩展索引单元。然后搜索引擎使用已定义的索引单元作为搜索参数从句子数据库中检索到多个句子。多个检索到的句子中的每一个句子之间的相似性由搜索引擎确定,所述每个相似性作为查询中的一项的语言学权重的函数来确定。然后搜索引擎基于已确定的相似性排列多个检索到的句子。
申请公布号 CN100507903C 申请公布日期 2009.07.01
申请号 CN03124989.2 申请日期 2003.09.19
申请人 微软公司 发明人 周明;吴华;张跃;高剑峰;黄昌宁
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海专利商标事务所有限公司 代理人 陈 斌
主权项 1. 一种向用户提供来自句子数据库的句子以响应查询的方法,其特征在于,该方法包括:接收查询;基于查询定义索引单元,该索引单元包括来自查询的词条和与查询关联的扩展索引单元,其中所述扩展索引单元包括有词性的词条、短语动词及相关性三元组中的至少一个;使用已定义的索引单元作为搜索参数,检索来自句子数据库的多个句子;确定多个检索到的句子中的每一个句子和所述查询之间的相似性,每一个相似性Sim(Di,Qj)是按照下式确定的:其中,Di为所述多个检索到的句子中第i个句子的向量权重表示,即Di->(di1,di2,...,dik),Qj为所述查询的向量权重表示,即Qj->(qj1,qj2,...,qjk),Li为Di的句子长度,f(Li)为Li的句子长度因子,Wjk为查询中的项qjk的语言学权重,dik是查询中的项qjk的向量权重;及基于已确定的相似性排列多个检索到的句子。
地址 美国华盛顿州