摘要 |
Die Offenbarung bezieht sich auf eine Struktur eines n-gram invertierten Indexes auf zwei Ebenen und auf Verfahren zur Erstellung desselben, zur Queryverarbeitung und Indexableitung, die die Größe des n-gram invertierten Indexes reduzieren und die Queryleistung durch Eliminierung der Redundanz der Postionsinformationen, die im n-gram invertierten Index besteht, verbessern. DOLLAR A Der invertierte Index der vorliegenden Erfindung umfasst einen Back-End invertierten Index, der von Dokumenten als Begriff extrahierte Unterfolgen verwendet und einen Front-End invertierten Index, der von Unterfolgen als Begriff extrahierte n-grams verwendet. Der Back-End invertierte Index verwendet die von Dokumenten als Begriff extrahierten Unterfolgen von bestimmter Länge, die miteinander durch n-1 (n: die Länge des n-grams) überlappt werden sollen, und speichert Positionsinformationen der in den Dokumenten auftretenden Unterfolgen in einer Posting-Liste für die jeweiligen Unterfolgen. Der Front-End invertierte Index verwendet die n-grams einer bestimmten Länge, die von den Unterfolgen mit Hilfe der 1-sliding Technik als Begriff extrahiert wurden, und speichert die Positionsinformationen der in den Unterfolgen auftretenden n-grams in einer Posting-Liste für die jeweiligen n-grams.
|