Es el conjunto de datos muy grandes, complejos y en constante crecimiento que no pueden ser gestionados, procesados ni analizados de manera eficiente con métodos tradicionales como hojas de cálculo.
El objetivo del Big Data es transformar grandes volúmenes de datos en información útil y conocimiento para apoyar la toma de decisiones.
Volumen → Se manejan terabytes o petabytes de información.
Velocidad → Los datos se generan y procesan en tiempo real (ej. redes sociales, sensores IoT).
Variedad → Incluye datos estructurados (tablas), semiestructurados (XML, JSON) y no estructurados (texto, imágenes, videos).
Veracidad → Se debe garantizar la calidad y confiabilidad de los datos.
Valor → La utilidad está en extraer información valiosa que genere ventajas competitivas.
Aplicaciones del Big Data
Análisis de clientes, segmentación, publicidad personalizada.
Análisis de datos médicos para diagnósticos y tratamientos personalizados.
Ciudades inteligentes, detección de fraudes.
Prevención de lavado de dinero, evaluación de riesgos.
Optimización de cadenas de suministro y mantenimiento predictivo.
Análisis de sentimientos y tendencias.
Hadoop y Spark → Procesamiento distribuido de grandes volúmenes.
NoSQL → Bases de datos flexibles para datos no estructurados.
Lenguajes: Python, R, SQL avanzado.
Machine Learning / IA → Para extraer patrones predictivos.
Herramientas de visualización: Tableau, Power BI.