Metodología de Visualización de Datos Utilizando Métodos Espectrales y Basados en Divergencias para la Reducción Interactiva de la Dimensión

Andrés Javier Anaya Isaza, Universidad Tecnologica de Pereira, Pereira - Risaralda Colombia.

En términos de reducción de dimensión, este trabajo presenta un nuevo enfoque interactivo de visualización de datos basado en la mezcla de resultados mediante las representaciones de dimensión menor mediante los métodos de (DR). De acuerdo a los enfoques de visualización usando reducción de la dimensión e interactividad del estado del arte, se afirma que la codificación visual, apoya directamente procesos que aumentan las capacidades analíticas humanas, en beneficio de establecer aquellas morfologías visuales que tengan un alto grado de correspondencia en métricas de efectividad y expresividad en cuanto a Canales (Color, Movimiento, Forma, Región Espacial.) y Marcas (Primitivas Geométricas). Tal componente se desarrolló en el modelo de esta tesis de maestría, aquí expuesto. De esta manera se complementa el estado del arte mediante una nueva propuesta que integra los enfoques mas expresivos y efectivos, de una manera intuitiva, sin necesidad de utilizar procesos de sistemas superiores que obligatoriamente, necesitan de un experto, en temáticas tan especializadas como Reducción de la Dimensión. Como último componente se introduce en esta investigación, el análisis exploratorio para el descubrimiento científico, permitiendo refinar, depurar o ampliar el modelo matemático aquí expuesto (Modelo de Ecualizador), para tener un entendimiento del fenómeno, que estudia la manera en que se afectan las salidas determinísticas de tales modelos a través de los eventos de interacción humana, mediante el paso de parámetros.

Estructura Esferica Artificial 3D

La base de este enfoque, consiste en trazar líneas (aristas) entre los puntos de datos que presentan el valor más alto utilizando una matriz de similitud, que mide el grado de afinidad o similitud entre cada par de puntos de datos que capturan la estructura de los datos de entrada.

Modelo DataVisSim

El modelo (DataVisSim "Data-Visualization-Similarity"), introduce un nuevo enfoque de visualización utilizando una mezcla interactiva de representaciones de datos resultantes de los métodos RD. Después de aplicar los métodos RD en los datos de entrada, se obtiene un conjunto de espacios de representación de menor dimensión. Particularmente, la mezcla se hace a través de una suma ponderada. Para proporcionar a los usuarios un sentido de la estructura de datos, además se implementó una visualización basada en datos, además del gráfico de dispersión convencional. Esta visualización captura la estructura de los datos de entrada, utilizando una matriz de similitud (también, matriz de afinidad de la teoría de grafos), que capta el grado de similitud o afinidad entre cada par de puntos de datos.

Modelo de Interactividad

Uno de los objetivos fundamentales de esta investigación, fue lograr el factor de interactivo. Esto permite al usuario, tener las herramientas de exploración necesarias para apoyar al aumento de las capacidades analíticas, en la correcta selección de la configuración ideal, para apoyar el proceso de mezcla interactiva de reducción de la dimensión.

Mezcla de Reducción de la Dimensión Interactiva

El enfoque de visualización propuesto, aquí llamado DataVisSim, involucra tres etapas principales: mezcla de resultados de RD, interacción y visualización, como se muestra en el diagrama de bloques de la figura aquí en mención. Una de las contribuciones más importantes de este trabajo es, la información sobre la estructura del espacio de alta dimensión de entrada, que se suma a la representación visual final, utilizando un esquema basado en la similitud por pareja.

Video Tutorial del Funcionamiento de la Interfaz

Producción Intelectual

Información Personal

Andrés Javier Anaya Isaza

Ingeniero de Sistemas

Msc Computer Engineering

Msc Ciencias de la Computación

ingandresanaya@gmail.com

andres.anaya@usco.edu.co