发明名称 n-GRAM Indexstruktur mit zwei Ebenen und Verfahren zur Indexerstellung, Queryverarbeitung und Indexableitung
摘要 Die Offenbarung bezieht sich auf eine Struktur eines n-gram invertierten Indexes auf zwei Ebenen und auf Verfahren zur Erstellung desselben, zur Queryverarbeitung und Indexableitung, die die Größe des n-gram invertierten Indexes reduzieren und die Queryleistung durch Eliminierung der Redundanz der Postionsinformationen, die im n-gram invertierten Index besteht, verbessern. DOLLAR A Der invertierte Index der vorliegenden Erfindung umfasst einen Back-End invertierten Index, der von Dokumenten als Begriff extrahierte Unterfolgen verwendet und einen Front-End invertierten Index, der von Unterfolgen als Begriff extrahierte n-grams verwendet. Der Back-End invertierte Index verwendet die von Dokumenten als Begriff extrahierten Unterfolgen von bestimmter Länge, die miteinander durch n-1 (n: die Länge des n-grams) überlappt werden sollen, und speichert Positionsinformationen der in den Dokumenten auftretenden Unterfolgen in einer Posting-Liste für die jeweiligen Unterfolgen. Der Front-End invertierte Index verwendet die n-grams einer bestimmten Länge, die von den Unterfolgen mit Hilfe der 1-sliding Technik als Begriff extrahiert wurden, und speichert die Positionsinformationen der in den Unterfolgen auftretenden n-grams in einer Posting-Liste für die jeweiligen n-grams.
申请公布号 DE102006039484(A1) 申请公布日期 2007.05.24
申请号 DE200610039484 申请日期 2006.08.23
申请人 KOREA ADVANCED INSTITUTE OF SCIENCE & TECHNOLOGY 发明人 WHANG, KYO-YOUNG;KIM, MIN-SOO;LEE, JAE-GIL;LEE, MIN-JAE
分类号 G06F17/30;G06F17/10 主分类号 G06F17/30
代理机构 代理人
主权项
地址