主权项 |
一种物资编目检索方法,其特征在于,包括如下步骤:步骤1,对物资编目系统库中的物资编目数据进行预处理,具体包括如下子步骤:步骤1.1,计算物资编目中各物资属性的属性权重,其中,物资属性的属性权重与其对应的信息量相关,即与该物资属性在所有物资编目数据中出现的频率成反比;步骤1.2,按照信息检索的倒排索引方式,将系统中的物资按照物资属性进行倒排索引,获得物资索引目录;步骤2,根据待检索物资Y的物资属性及属性值,分别按照步骤1.1计算待检索物资Y的各物资属性的属性权重;根据物资Y的物资属性,分别从步骤1.2获得的物资索引目录中检索出包含有该物资属性的物资,将所有检索出来的物资组成物资集;步骤3,针对待检索物资Y的物资属性ai,ai为待检索物资Y的第i个物资属性,计算待检索物资Y的物资属性ai的属性值VY<sub>ai</sub>与步骤2检索出的物资集中的每个物资X的物资属性ai的属性值VX<sub>ai</sub>之间的相似度SimAttribute(VY<sub>ai</sub>,VX<sub>ai</sub>);其中,SimAttribute(VY<sub>ai</sub>,VX<sub>ai</sub>)根据物资属性编制阶段时规定的物资属性ai的编写规则,即物资属性ai的模式代码确定;步骤4,计算待检索物资Y与物资X之间的物资相似度SimMaterial(Y,X),其中,SimMaterial(Y,X)=Σ<sub>ai∈Y</sub>(Weight(Y<sub>ai</sub>)×Weight(X<sub>ai</sub>)×SimAttribute(VY<sub>ai</sub>,VX<sub>ai</sub>))其中,Weight(Y<sub>ai</sub>)和Weight(X<sub>ai</sub>)分别是待检索物资Y和物资X的物资属性ai对应的物资属性权重;步骤5,按照步骤4依次分别计算出待检索物资Y与步骤2检索出的物资集中的所有物资的物资相似度,并按物资相似度大小,将物资集中的物资进行由高到低的排列,即为检索结果。 |