摘要 |
Procedimiento para seleccionar un conjunto de datos de entrenamiento a partir de un conjunto S de muestras de un sistema de monitorización de estados de máquina, siendo el conjunto seleccionado de datos de entrenamiento para su uso en el entrenamiento de un modelo estadístico para evaluar mediciones en el sistema de monitorización de estados de máquina, comprendiendo el procedimiento las etapas de: realizar las siguientes etapas para cada muestra p del conjunto S: calcular una distancia desde la muestra p hasta un nodo de un árbol kd, en la que cada nodo del árbol kd está vacío o representa otra muestra retirada del conjunto S; si la distancia calculada es mayor que un umbral de distancia rmax, y el nodo del árbol kd tiene hijos, calcular una distancia desde la muestra p hasta un hijo del nodo seleccionado según una clasificación de p en el árbol kd; repetir la etapa anterior hasta que o bien la distancia calculada está por debajo del umbral de distancia rmax, o bien el nodo del árbol kd no tiene hijos; y si ninguna distancia calculada está por debajo del umbral de distancia rmax, entoncesllenar una hoja siguiente en el árbol kd con p; y usar los nodos del árbol kd como el conjunto de datos de entrenamiento.
|