发明名称 |
通过对信息新颖性和动态学的分析来个性化新闻馈送的原理和方法 |
摘要 |
提供了一种系统和方法,用于根据信息新颖性的统计测量来过滤诸如新闻报道等时间性信息流。各种不同的技术可以被应用来基于一个用户已经评审过的信息因人而异地定制新闻馈送或者其他类型的信息。提供了分析信息新颖性的方法和通过标识在他们已经评审过的报道的上下文环境中各报道的新颖性为用户个性化并过滤信息的系统。该系统采用了把稿件表示成大量字词和命名实体的新颖性分析算法。这个算法通过考虑信息如何从一篇稿件到另一篇稿件以及在个别稿件内部是如何随时间进展而演化的来分析文档内和文档间动态学。 |
申请公布号 |
CN101256591B |
申请公布日期 |
2011.02.23 |
申请号 |
CN200810090700.9 |
申请日期 |
2005.03.02 |
申请人 |
微软公司 |
发明人 |
E·J·霍维兹;E·加布里洛维奇;S·T·杜梅斯 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
陈炜 |
主权项 |
一种创建个性化信息的方法,其特征在于,它包括:自动分析来自不同信息源的文档;自动确定所述文档的新颖性;以及基于所述文档的新颖性创建个性化信息馈送,其中通过实施以下算法来确定所述文档的新颖性:算法RANKNEWSBYNOVELTY(dist,seed,D,n)R←seed//initializationfor i=1 to min(n,|D|)do <mrow> <mi>d</mi> <mo>←</mo> <msub> <mrow> <mi>arg</mi> <mi>max</mi> </mrow> <msub> <mi>d</mi> <mi>i</mi> </msub> </msub> <mo>∈</mo> <mi>D</mi> <mo>{</mo> <mi>dist</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>R</mi> <mo>)</mo> </mrow> <mo>}</mo> </mrow>R←R∪{d};D←D/{d}其中dist是距离度量,seed是种子报道,D是一组相关的更新,n是要选择的期望更新的数量,R是按新颖性排序的稿件列表。 |
地址 |
美国华盛顿州 |