发明名称 PROCEDIMIENTO Y SISTEMA PORTATIL DE INDEXACION DE DOCUMENTOS UTILIZANDO LA DESCOMPOSICION DE PALABRAS EN N-GRAMS.
摘要 EL SISTEMA Y EL METODO SUMINISTRA UNA INDEXACION Y RECUPERACION DE DOCUMENTOS ALMACENADOS UTILIZANDO UNA DESCOMPOSICION DE PALABRAS EN LOS DOCUMENTOS EN SUBUNIDADES DE N-GRAMS O DE PALABRAS LINEALES. LOS DOCUMENTOS SE INDEXAN COMO PAGINAS EN UN NUMERO DE BANCOS. PARA CADA BANCO HAY UN INDICE DE BANCO. LOS NGRAMS INDIVIDUALES SE IDENTIFICAN PARA CADA PAGINA Y SE ALMACENAN EN EL INDICE DEL BANCO. CADA INDICE DE BANCO CONTIENE ADEMAS UN MAPA DE ENTRADAS QUE INDICA CUANDO UN N-GRAM DADO ESTA PRESENTE EN CUALQUIERA DE LAS PAGINAS DEL BANCO, Y ENTONCES SUMINISTRA UN INDICE A UN MAPA DE PAGINAS QUE INDICA ADEMAS QUE PAGINA EN EL BANCO CONTIENE EL N-GRAM. CUANDO SE INTRODUCE UNA INTERROGACION DE BUSQUEDA, LAS PALABRAS DE INTERROGACION SE DESCOMPONEN EN SU N-GRAMS. LOS N-GRAMS DE LAS PALABRAS DE INTERROGACION SE COMPARAN PRIMERO CON MAPAS DE ENTRADA PARA DETERMINAR SI LOS N-GRAMS DE LAS PALABRAS DE INTERROGACION APARECEN SOBRE CUALQUIER PAGINA EN EL BANCO. SI ES ASI, EL MAPA DE PAGINAS ASOCIADO SE RECORRE PARA DETERMINAR QUE PAGINA EN EL BANCO CONTIENE LOS N-GRAMS DE LAS PALABRAS DE INTERROGACION. LOS N-GRAMS EN LA PAGINA SE COMPARA CON LOS N-GRAMS DE LAS PALABRAS DE INTERROGACION PARA DETERMINAR LA PRESENCIA DE UNA CONCORDANCIA ENTRE AMBOS. LAS PAGINAS CONCORDANTES SON MARCADAS. CUANDO TODAS LAS PAGINAS EN TODOS LOS BANCOS HAN SIDO PROCESADAS, LAS PAGINAS SE CONSOLIDAN CON RESPECTO A LOS DOCUMENTOS A LOS CUALES PERTENECEN, DANDO COMO RESULTADO UNA LISTA DE DOCUMENTOS QUE CONCUERDAN CON LA INTERROGACION DE BUSQUEDA. LOS RESULTADOS SON MOSTRADOS AL USUARIO.
申请公布号 ES2214535(T3) 申请公布日期 2004.09.16
申请号 ES19960911690T 申请日期 1996.04.10
申请人 REBUS TECHNOLOGY, INC. 发明人 RANGARAJAN, VIJAYAKUMAR;RAVICHANDRAN, NATARAJAN
分类号 G06F17/21;G06F17/30;(IPC1-7):G06F17/30;G06F17/27 主分类号 G06F17/21
代理机构 代理人
主权项
地址
您可能感兴趣的专利