发明名称 文本语句比较装置
摘要 本发明提供一种对文本语句间进行高精度的实时比较的文本语句比较装置。树表示部用图论的有根树来表示成为比较对象的文本语句;信息赋予部将单词信息赋予由树表示部所表示的树的各节点,将作为单词间的修饰限制关系信息的格信息赋予各边;树间距离定义部定义基于节点间对应关系和边间对应关系的树间的距离;树间距离取得部对作为比较对象的文本语句的树间,求出由树间距离定义部所定义的树间距离;树间距离应用部将树间距离应用于表示文本语句间的差别;文本语句间距离取得部根据树间距离应用部的结果,求出作为比较对象的文本语句间的距离。
申请公布号 CN100464326C 申请公布日期 2009.02.25
申请号 CN03159365.8 申请日期 2003.09.12
申请人 富士施乐株式会社 发明人 刘绍明
分类号 G06F17/00(2006.01);G06F17/21(2006.01) 主分类号 G06F17/00(2006.01)
代理机构 北京三友知识产权代理有限公司 代理人 李辉
主权项 1.一种文本语句比较装置,具有:输入部,其将第一文本语句和第二文本语句输入;树结构转换部,其将第一文本语句和第二文本语句分别转换为第一R树和第二R树;距离计算部,其根据两个R树的节点间的映射条件和边间的映射条件,至少基于所定义的两个R树间的距离,计算第一R树和第二R树的距离;语义内容比较部,其基于所计算的第一R树和第二R树的距离,计算第一文本语句和第二文本语句的距离,所述树结构转换部将第一文本语句中包含的单词信息分配到第一R树的节点,将第二文本语句中包含的单词信息分配到第二R树的节点,将第一文本语句中包含的格信息分配到第一R树的边,将第二文本语句中包含的格信息分配到第二R树的边。
地址 日本东京