摘要 |
<p>En enhet for ekstrahering av indekstermer innbefatter: innmatingsanordninger (1) for innmating av dokumenter d som skal undersøkes, og dokumenter P som skal sammenlignes; en anordning (120) for ekstrahering av indekstermer fra dokumentet d som skal undersøkes; en anordning (142) for beregning av en første forekomsthyppighet for å beregne en funksjonsverdi IDF (P) for forekomsthyppigheten til den ekstraherte indekstermen i dokumentet P som skal sammenlignes; en anordning (160) for utvelgelse av lignende dokumenter for å velge lignende dokumenter S som ligner på dokumentet d som skal undersøkes, i dokumentene P som skal sammenlignes, i henhold til data om dokumentet d som skal sammenlignes; en anordning (171) for beregning av en andre forekomsthyppighet for å beregne funksjonsverdien IDF (S) av forekomsthyppigheten for den ekstraherte indekstermen i de lignende dokumentene S; og en utmatingsanordning (4) for å mate ut hver indeksterm og dens posisjoneringsdata i henhold til kombinasjonen av funksjonsverdiene av de respektive forekomsthyppighetene i dokumentene som skal sammenlignes og de lignende dokumentene, som er blitt beregnet. Dermed er det mulig å gripe nøyaktig egenskapen til dokumentet som skal undersøkes.</p> |