Es definida en la comunidad académica como el proceso de exploración y análisis de grandes cantidades de datos con el objetivo de descubrir padrones y reglas significativas.
En pleno desenvolvimiento de la llamada industria 4.0, la minería de datos juega un papel importante en la extracción de información relevante de la base de datos de las empresas, estas informaciones permiten al empresario tomar decisiones que optimicen la administración apropiada de sus recursos para tener ingresos mayores.
Importante enfatizar que la minería de datos involucra el uso de herramientas estadísticos, matemáticos, banco de datos y técnicas especialistas en reconocimiento de padrones, con ellos se formula un conjunto de algoritmos utilizando métodos aproximados para extraer conocimientos de interés.
No todos los datos encontrados en una base de datos tienen información relevante, en consecuencia, se tiene efectuar la depuración de los mismos con el objetivo de consolidar un algoritmo eficaz, para tiempo computacional mínima y con datos apropiados.
Es el paso donde se pretende caracterizar los datos existentes, para superar las limitaciones en el momento de ejecutar la secuencialidad de un algoritmo:
Entre las transformaciones más comunes se tiene:
a) Transformación de atributo cualitativo-cuantitativo
b) Discretización de atributos cuantitativos
c) Normalización
Aplicación de algoritmo:
Los algoritmos en minería de datos son un conjunto de operaciones matemáticos sistemáticamente estructurados y repetitivos en ajuste de un objetivo en particular, estas herramientas dentro de la #insdustria4.0 son llamadas de técnicas de Inteligencia Artificial (IA).
Estas técnicas son agrupadas generalmente en herramientas de clasificación, regresión, reconocimiento de patrones, fusificación y optimización.