发明名称 一种基于有权图来计算文本内容相似度的系统和方法
摘要 一种基于有权图来计算文本内容相似度的系统和方法,其中该系统包括:输入单元,用于输入需要计算其相似度的文档集合;构造单元,用于构造有权图;计算单元,用于根据在构造单元中所得到的有权图来计算图中任意两个节点之间的相似度;输出单元,用于将相似度结果返回给用户。
申请公布号 CN101576904B 申请公布日期 2012.04.11
申请号 CN200910078787.2 申请日期 2009.03.03
申请人 杜小勇 发明人 杜小勇;刘红岩;何军;李佩;李直旭
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京中创阳光知识产权代理有限责任公司 11003 代理人 尹振启
主权项 一种基于有权图来计算文本内容相似度的方法,包括步骤:A、输入需要计算其相似度的文档集合;B、构造有权图;C、根据在步骤B中所得到的有权图来计算图中任意两个节点之间的相似度;D、将文档相似度结果返回给用户;其中步骤C进一步包括:C1、构造转移矩阵;C2、基于转移矩阵,让初始相似度矩阵为单位矩阵,进行一次迭代计算以得到该次迭代的相似度;C3、对这次迭代所得到的相似度与上一次迭代得到的相似度进行比较,如果已经收敛,则迭代终止,否则返回步骤C2进行下一次迭代。
地址 100872 北京市海淀区中关村大街59号中国人民大学信息学院