发明名称 |
在搜索引擎结果页面上聚集WEB页面 |
摘要 |
提供了用于通过在经聚集的文档的“新鲜的”寿命外维持相应聚集的文档的标识(ID)号来递送针对新近的和非新近的事件的经聚集的搜索结果的方法、系统以及媒体。当群集根据相似内容被形成时,ID号和相关联的属性被分配给所述群集中的每一个。这提供了用来跟踪并且检索相应群集以用于搜索结果的后续递送的机制。即使在所述文档不再被认为是“新鲜的”之后,所述群集的相应ID号也被维持。这些相似内容的群集根据发表日期被进一步细分。这为以不同的时间跨度发生的相似内容的事件提供了单独的细分的群集,其在SERP中连同单独的非聚集的搜索结果一起被递送。 |
申请公布号 |
CN106250552A |
申请公布日期 |
2016.12.21 |
申请号 |
CN201610668619.9 |
申请日期 |
2012.07.31 |
申请人 |
微软技术许可有限责任公司 |
发明人 |
S·K·帕塔萨拉蒂;J·艾哈迈德;Y·萨拉夫;W·孙 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
永新专利商标代理有限公司 72002 |
代理人 |
张扬;王英 |
主权项 |
一种聚集文档的方法,所述方法包括:访问包括多个存储的文档的数据库;基于内容相似性和发表日期将所述存储的文档中的一些文档聚集成一个或多个群集;以及将标识符分配给所述存储的文档的群集中的每一个群集,其中,所述群集中的每一个群集的标识符贯穿经聚集的存储的文档中的每一个文档的寿命保持持久性。 |
地址 |
美国华盛顿州 |