El primer paso de esta aventura fue el Análisis Exploratorio de Datos (EDA). Imaginé el dataset como un mapa antiguo, lleno de promesas pero también de enigmas. Mi tarea fue limpiar el polvo, descifrar los símbolos y entender el terreno. Esto implicó desde la carga inicial y la comprensión de la estructura, hasta la meticulosa gestión de valores faltantes – especialmente esos CustomerID que representaban a nuestros clientes en puntos físicos, no directamente en el e-commerce. Cada línea de código era una herramienta para refinar este mapa.
La verdadera magia comenzó al transformar los datos crudos en métricas significativas. Construí perfiles de comportamiento de cliente con variables RFM extendidas (Recencia, Frecuencia, Valor, Cantidad y Variedad de Productos), y cuantifiqué el impacto real de ventas y devoluciones. Era como dar voz a los números, permitiéndoles contar historias sobre nuestros "clientes VIP", aquellos que compraban con frecuencia y alto valor, y también sobre los "clientes dormidos", que necesitaban un incentivo para regresar.
El viaje culminó con la creación de visualizaciones impactantes y la preparación de datasets limpios. Cada gráfico, desde histogramas de distribución hasta los Top 5 de clientes o productos, se convirtió en una ventana a la realidad del negocio, revelando patrones y oportunidades que antes permanecían ocultas. Este EDA no fue solo un ejercicio técnico; fue la base para futuras estrategias de segmentación, venta cruzada y predicción de demanda.
Este proyecto de EDA representa mi compromiso con la excelencia en el análisis de datos, mi capacidad para traducir necesidades de negocio en soluciones técnicas, y mi visión para transformar la información en una ventaja competitiva tangible. Es el cimiento sobre el cual construiremos la próxima generación de decisiones inteligentes para nuestro e-commerce.
Sprint 1: Análisis Exploratorio de Datos
Sprint 1: Análisis Exploratorio de Datos
Sprint 1: Análisis Exploratorio de Datos
Sprint 1: Análisis Exploratorio de Datos
Repositorio en Github
Eda Para los Cuatro Proyectos Concatenados
Para este caso de negocio se asume que los nulos son clientes poco recurrentes o esporádicos atendidos en caja. en sedes físicas del negocio que al migrar a una plataforma centralizada de e-comercie presenta esta carencia de ID
Matriz de Correlacion
Frecuencia de Compra
Recencia