主权项 |
1、在具有数据库和数据库中项目的索引的信息处理系统中用于判定说明的普通名字以便区分数据库项目与存贮在索引中的数据库项目名字的方法,其中每个说明的名字和每个项目的名字包括姓字段,代与授奖字段和个人名字段並且其中无论如何姓字段要至少包括一个字,该方法包括下列步骤: (a)在说明的名字和项目名字间决定表示确切匹配的匹配分数, (b)初始化一组计数值,其中每个计数值表示说明的名字字段和相应的项目名字字段的相似性, (c)从说明的名字中选择姓字段, (d)建立所有具有与说明的姓字段相同的姓字段的项目名字的集合,並且 (e)对于该集合中的每一个项目名字, (f)将该项目名字的姓字段与说明的名字的姓字段相比较, (g)如果说明的名字的姓字段与项目名字的姓字段不匹配,返回到第(e)步且从该集合中选择另一个项目名字, (h)如果说明的与项目名字的姓字段匹配的话,增加相应的计数值, (i)从该说明的名字中选择代与授奖字段, (j)比较说明的与项目名字的代和授奖字段,且如果在代和授奖字段中发现匹配的话,则增加相应的计数值, (k)从该说明的名字中选择个人名字段並且,对于说明的名字的个人名字段中的每个字而言, (l)将说明名字的所选择的字与该项目名字的个人名字段中的相同位置的字相比较, (m)如果在该项目名字的个人名字段中没有可比较的字存在,则转移到第(r)步, (n)如果该字匹配,则增加相应的计数值並且转移到第(r)步, (o)如果该字不匹配,则比较说明的与项目名字的个人名字段中的每个字的大写字符,並且, (p)如果一个名字的个人名字段的字是其它名字的字的简写形式,则增加相应的计数值並转移到第(r)步, (q)如果名字中的任意一个名字的个人名字段的字不是其它的缩写形式的话,则从该集合中选择另一个项目名字並返回到第(e)步, (r)决定在说明的名字和项目名字之间表示相似程度的以计算值的加权和所表示的比较分数,並且 (s)识别最相似于相应的说明的名字的该集合中的项目名字。 |