PROYECTO DE INVESTIGACIÓN

METODOLOGÍA DE VISUALIZACIÓN INTERACTIVA Y ANÁLISIS DE INFORMACIÓN EN BIG DATA.

2016 - 2017

FACULTAD DE INGENIERÍA EN CIENCIAS APLICADAS

CARRERA DE INGENIERÍA EN ELECTRÓNICA Y REDES DE COMUNICACIÓN

Descripción general del proyecto:

El termino Big Data es un nuevo concepto que emerge en respuesta al gran volumen de datos que ha alcanzado dimensiones inmanejables, es decir, que supera la capacidad del software habitual para capturar, gestionar y procesar datos en un tiempo razonable, además de las limitaciones de la infraestructura pre-existente. Por lo tanto, Big Data es cualquier atributo que represente un reto a las limitantes de capacidad de los sistemas o las necesidades del estado, la empresa, la educación, la economía, la optimización del tráfico en telecomunicaciones, la salud, el tráfico vehicular urbano, o cualquier otro campo susceptible de generar grandes cantidades de información y, por tanto, conocimiento. Big Data no sólo se refiere al tamaño de los datos, también se refiere al acelerado ritmo al que se generan datos y la velocidad con que se crean las diversas fuentes que los producen, la cuales pueden ser independientes y tienen la capacidad potencial de interactuar entre sí, propiciando composiciones inconsistentes e impredecibles. En otras palabras, la combinación de pequeñas bases de datos, con algún tipo de relación, puede generar una gigante base de datos.

Sin embargo la capacidad de interpretar, analizar, sintetizar y gestionar dichos volúmenes de datos aumenta a pasos mucho más lentos, las herramientas tradicionales como hojas de cálculo, estadística descriptiva convencional, diagramas o gráficos planos, estáticos y convencionales ya no son suficientes, y es justamente en este punto donde las herramientas deben evolucionar de forma paralela al crecimiento de los datos y estar acordes con los requerimientos de los expertos, por ello se hacen necesarias técnicas emergentes que utilicen las potencialidades de los recursos computacionales y los integre de forma sinérgica a las cualidades de análisis e interpretación humana. Dicha integración, se puede interpretar como una integración de la inteligencia artificial y la inteligencia natural como un equipo idóneo para descubrir conocimiento. Lo anterior es posible aplicando áreas de análisis robusto de datos y extracción eficaz de información tales como la minería de datos y la visualización inteligente de la información.

No obstante, el uso de métodos de minería de datos y técnicas de visualización por separado conlleva a la necesidad de expertos para la interpretación de resultados, siendo esto algo negativo porque involucra un incremento en tiempo, costos y trabajo para llegar a la etapa última del procesamiento de datos, es decir, determinar la información útil y el conocimiento inmersos en los datos analizados. La integración de los métodos de minería y las técnicas de visualización es una necesidad latente; aunque recientemente se ha desarrollado algunos métodos y herramientas de integración, el diseño de un sistema de análisis visual que se adapte adecuadamente a las necesidades y requerimientos de un usuario particular es aún un problema abierto. Una de las formas de hacer una visualización inteligible de grandes volúmenes de datos es reducir la dimensión de los mismos de tal forma que se obtengan representaciones fácilmente interpretables por el ser humano. Sin embargo, el potencial de los métodos de reducción de dimensión ha sido relegado a tareas pre-procesado, descartando la posibilidad de realizar la integración con una reducción interactiva junto con elementos de la analítica visual.

Con el desarrollo de este proyecto, se planea diseñar una metodología de análisis visual de información en Big Data usando principios de visualización e interactividad en conjunto con técnicas de reducción de dimensión. La premisa de esta investigación es la posibilidad de realizar la interacción con el usuario a partir de la inclusión del mismo en la selección y combinación de métodos de reducción de dimensión. Lo anterior supone diseñar no sólo el modelo y la interfaz de interacción, sino la formulación de un método generalizado de reducción de dimensión que permita realizar intuitivamente la selección y combinación de métodos. Un aspecto transversal de todas las etapas del diseño de la metodología de análisis visual es el costo computacional que obstaculiza la meta de que la metodología sea realmente interactiva, es decir, en tiempo real. Dicho esto, en este proyecto, será determinante realizar todos los diseños e implementaciones de prueba en entornos de bajo costo computacional.

El proyecto se presenta en modalidad de investigación básico, ya que corresponde a la etapa del diseño metodológica de la implementación de una herramienta de análisis y visualización de datos. Dicho diseño servirá de insumo para realizar futuras investigaciones aplicadas y de desarrollo tecnológico en donde se divulgue el uso de la herramienta. Además, se espera que esta iniciativa permita la conformación de una red de investigadores en el área emergente y de alto interés actual de Big Data.