发明名称 用于搜索电子内容的方法、计算系统和计算机可读介质
摘要 本发明提供一种用于搜索电子内容的方法、计算装置和计算机可读介质。该方法包括:至少部分地基于从搜索-查询日志挖掘的信息,从多个检索的电子文档提取搜索聚焦的信息;将提取的搜索聚焦的信息表示为关键n元组和/或短语;以及至少部分地基于所提取的搜索聚焦的信息的特征或特性中的至少一个,对搜索结果中的检索的电子文档排序。本发明能够改进电子文档的相关度排序。
申请公布号 CN103064956B 申请公布日期 2016.08.24
申请号 CN201210587281.6 申请日期 2012.12.28
申请人 微软技术许可有限责任公司 发明人 胡云华;李航
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王萍;李春晖
主权项 一种搜索电子内容的方法,所述方法包括:至少部分地基于从搜索‑查询日志挖掘的信息,从多个检索的电子文档提取(608)搜索聚焦的信息;将所提取的搜索聚焦的信息表示为(610)关键n元组和/或短语;以及至少部分地基于所提取的搜索聚焦的信息的特征或特性中的至少之一,对搜索结果中的检索的电子文档排序(614),其中从多个检索的电子文档提取搜索聚焦的信息包括:在检索的电子文档中识别候选n元组和/或短语;识别所述候选n元组和/或短语的特征和/或特性,识别的特征包括频率特征或外观特征中的至少之一;至少部分地基于所述候选n元组和/或短语的对应特征和/或特性,并且至少部分地基于搜索聚焦的信息的特征和/或特性,对所述候选n元组和/或短语进行加权;以及至少部分地基于所述候选n元组和/或短语的对应权重,从所述候选n元组和/或短语中选择关键n元组和/或短语。
地址 美国华盛顿州
您可能感兴趣的专利