Minería de Datos


La busqueda del conocimiento dentro de tus datos

 

La minería de datos es un conjunto de técnicas para la inducción de conocimiento e información estructurada. Tiene una incidencia de diferentes disciplinas como la estadística, inteligencia artificial, reconocimiento de patrones, etc., y se basa en diferentes tipos de técnicas como redes neuronales artificiales, árboles de decisión, algoritmos genéticos, método del vecino más cercano, Reglas de inducción, entre otras.

La minería de datos (data mining) es utilizada actualmente para deducir y encontral perfiles de comportamiento de clientes, proveedores o ambientes, de acuerdo a los parámetros emitidos en los modelos matemáticos que se extraen en el análisis hecho para la implementación de esta tecnología.

Por ejemplo los supermercados utilizan esta metodología para estimar los hábitos de compra de sus clientes, empresas de servicios la utilizan para encontrar el perfil de sus clientes que se retiran para pasarse tal vez a la competencia o no recibir más ese servicio, el interés consiste en detectarlos antes de que tomen la desición para persuadir su decisión

El objetivo general de la minería de datos es ayudar a comprender el contenido de una base de datos.

Desde los años 60's ya se hablaba de data fishing o data archeology con la idea de encontrar correlaciones en las bases de datos. En los años 80 empezaron a consolidar el tema de Data Mining y Knowledge Discovery

ETAPAS DE UN PROYECTO DE DATA MINING

Podemos decir que "en data mining cada caso es un caso". Sin embargo, en términos generales, el proceso se compone de cuatro etapas principales:

1. Determinación de los objetivos. Trata de la delimitación de los objetivos que el cliente desea.

2. Preprocesamiento de los datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Es la etapa que consume más de la mitad del tiempo del proyecto.

 3. Determinación del modelo. Se comienza realizando unos análisis estadísticos de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial.

4. Análisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.



Mi eShop

MachuKita Tiendita

La tienda de relojes preferida por todos

OTROS TEMAS

JDBC