发明名称 目录数据库中的名字判定
摘要 说明名和项目名各有第一、第二和第三字段。说明名以规范格式供给名字判定过程,确定一确切的匹配分数;建立具有与说明名第一(姓)字段匹配的第一(性)字段的所有索引项目的集合。在“姓”字段进行初始猜测并识别姓与说明姓字段最后一字相同的所有索引项目。而后选择说明名的第二字段并与项目名比较。然后通过比较所选字和项目名第三字段相同位置的字从说明名中选择第三字段。如果这些字相匹配,过程选择说明名的第三段中的下一字并回到开始。
申请公布号 CN1053852A 申请公布日期 1991.08.14
申请号 CN90106018.6 申请日期 1990.12.21
申请人 布尔·HN·信息系统有限公司 发明人 罗纳德·艾弗雷特·丹
分类号 G06F15/40 主分类号 G06F15/40
代理机构 中国国际贸易促进委员会专利代理部 代理人 杨晓光
主权项 1、在具有数据库和数据库中项目的索引的信息处理系统中用于判定说明的普通名字以便区分数据库项目与存贮在索引中的数据库项目名字的方法,其中每个说明的名字和每个项目的名字包括姓字段,代与授奖字段和个人名字段並且其中无论如何姓字段要至少包括一个字,该方法包括下列步骤: (a)在说明的名字和项目名字间决定表示确切匹配的匹配分数, (b)初始化一组计数值,其中每个计数值表示说明的名字字段和相应的项目名字字段的相似性, (c)从说明的名字中选择姓字段, (d)建立所有具有与说明的姓字段相同的姓字段的项目名字的集合,並且 (e)对于该集合中的每一个项目名字, (f)将该项目名字的姓字段与说明的名字的姓字段相比较, (g)如果说明的名字的姓字段与项目名字的姓字段不匹配,返回到第(e)步且从该集合中选择另一个项目名字, (h)如果说明的与项目名字的姓字段匹配的话,增加相应的计数值, (i)从该说明的名字中选择代与授奖字段, (j)比较说明的与项目名字的代和授奖字段,且如果在代和授奖字段中发现匹配的话,则增加相应的计数值, (k)从该说明的名字中选择个人名字段並且,对于说明的名字的个人名字段中的每个字而言, (l)将说明名字的所选择的字与该项目名字的个人名字段中的相同位置的字相比较, (m)如果在该项目名字的个人名字段中没有可比较的字存在,则转移到第(r)步, (n)如果该字匹配,则增加相应的计数值並且转移到第(r)步, (o)如果该字不匹配,则比较说明的与项目名字的个人名字段中的每个字的大写字符,並且, (p)如果一个名字的个人名字段的字是其它名字的字的简写形式,则增加相应的计数值並转移到第(r)步, (q)如果名字中的任意一个名字的个人名字段的字不是其它的缩写形式的话,则从该集合中选择另一个项目名字並返回到第(e)步, (r)决定在说明的名字和项目名字之间表示相似程度的以计算值的加权和所表示的比较分数,並且 (s)识别最相似于相应的说明的名字的该集合中的项目名字。
地址 美国明尼苏达州