发明名称 Dispositivo de registro de palabras relacionadas, dispositivo de procesamiento de información, método de registro de palabras relacionadas, programa para dispositivo de registro de palabras relacionadas, y medio de almacenamiento
摘要 Un dispositivo de registro de palabras relacionadas (10) que comprende: un medio de generación de grupos candidatos de palabras relacionadas configurado para generar un grupo candidato de palabras relacionadas mediante la extracción de candidatos de una palabra relacionada si una serie de resultados de búsqueda de un registro (12a) de consulta de búsqueda en el que los registros relativos a una consulta de búsqueda se almacenan es uno o más, en el que el registro (12a) de consulta de búsqueda almacena consultas de búsqueda en asociación con el número de resultados de búsqueda; un medio de recepción configurado para recibir una consulta de búsqueda de una palabra de búsqueda introducida por el usuario; un medio de generación de cadenas de caracteres parciales configurado para generar una cadena de caracteres parcial a partir de una cadena de caracteres de la palabra de búsqueda; un medio de extracción de cadenas de caracteres candidatas configurado para extraer cadenas de caracteres candidatas del grupo candidato de palabras relacionadas en base a la cadena de caracteres parcial generada; un medio de cálculo de puntuación configurado para calcular una puntuación de idoneidad de cada cadena de caracteres candidata en base a la similitud entre la cadena de caracteres candidata y la palabra de búsqueda, el número de veces de uso de la cadena de caracteres candidata, y el número de resultados de búsqueda de la búsqueda de la cadena de caracteres candidata; un medio de clasificación configurado para clasificar las cadenas de caracteres candidatas en el orden de las puntuaciones; un medio de generación de criterio configurado para generar una línea de referencia de una puntuación de idoneidad para la clasificación como criterio para determinar si una cadena de caracteres candidata determinada ha de registrarse como una palabra relacionada o no en base a su puntuación de idoneidad y clasificación; un medio de extracción de cadenas de caracteres de registro configurado para extraer, como una cadena de caracteres de registro que se va a registrar como una palabra relacionada, una cadena de caracteres candidata cuya puntuación de idoneidad está por encima de la línea de referencia por un umbral preestablecido o mayor; y un medio de registro de palabras relacionadas configurado para registrar la cadena de caracteres de registro extraída y la palabra de búsqueda como palabras relacionadas en una base (12c) de datos de palabras relacionadas, en el que el medio de generación de cadenas de caracteres parciales está configurado para establecer al menos una de entre la longitud de la cadena de caracteres parcial y la anchura de desplazamiento del número de caracteres de una palabra de búsqueda en el momento de la generación de la cadena de caracteres parcial en base al número de caracteres de la palabra de búsqueda, y generar una cadena de caracteres parcial que tiene al menos una de entre la longitud ajustada y la anchura de desplazamiento ajustada, y en el que el medio de generación de criterio está configurado para obtener la línea de referencia mediante una función aproximada que aproxima la relación entre la clasificación y la puntuación de idoneidad, obteniéndose la línea de referencia a partir de los datos de la clasificación en un intervalo predeterminado.
申请公布号 ES2577938(T3) 申请公布日期 2016.07.19
申请号 ES20110839828T 申请日期 2011.11.07
申请人 Rakuten, Inc. 发明人
分类号 G06F17/30;G06F17/27 主分类号 G06F17/30
代理机构 代理人
主权项
地址