Descubriendo Las Combinaciones de Oro
Análisis de Asociación de Productos para la Optimización de la Experiencia del Cliente
Contexto del Proyecto:
Tras la implementación de una estrategia de segmentación de clientes, la empresa buscaba profundizar en el comportamiento de compra de sus clientes de alto valor. Se identificó la oportunidad de analizar las relaciones entre los productos adquiridos conjuntamente para optimizar la experiencia del usuario, impulsar las ventas cruzadas y mejorar la eficiencia operativa.
Mi Rol como BA y BI Leader:
En este proyecto, desempeñé un rol de liderazgo dual, actuando como Business Analyst (BA) y BI Leader. Mis responsabilidades incluyeron:
Análisis de Negocio: Lideré el proceso de elicitación de requisitos con los stakeholders clave para comprender los objetivos del negocio y definir el alcance del proyecto. Esto incluyó la realización de entrevistas, talleres y análisis de datos transaccionales.
Planificación y Gestión del Proyecto: Desarrollé el plan del proyecto, establecí el alcance, los entregables, los recursos y el cronograma. Utilicé metodologías ágiles (Kanban y Scrum) para gestionar el equipo, optimizar el flujo de trabajo y asegurar la entrega oportuna de resultados.
Diseño de la Solución de BI: Diseñé la arquitectura de la solución de Business Intelligence, incluyendo la selección de algoritmos de minería de datos y la estrategia de visualización de resultados.
Liderazgo del Equipo de BI: Dirigí y coordiné al equipo de analistas de BI en la preparación de datos, la aplicación del algoritmo Apriori y la generación de insights accionables.
Comunicación con Stakeholders: Actué como enlace principal entre el equipo técnico y los stakeholders del negocio, presentando los hallazgos y recomendaciones.
Manejo de Datos y Confidencialidad
Este proyecto se inspira en casos de negocio reales que he encontrado a lo largo de mi carrera profesional. Para proteger la confidencialidad de la información sensible, se han realizado modificaciones al contexto, la industria y otros detalles específicos. Además, se emplea un dataset público para fines demostrativos. Este enfoque refleja mi compromiso con la ética profesional y la responsabilidad en el manejo de información confidencial y conocimiento de negocio.
Solución Del Problema
Para descubrir las relaciones entre los productos, se implementó un análisis de asociación utilizando el algoritmo Apriori. El proyecto se desarrolló siguiendo la metodología CRISP-DM, que proporcionó un marco estructurado para el proceso de análisis.
Las principales etapas del proyecto fueron:
Comprensión del Negocio: Se definieron los objetivos del proyecto: optimizar la experiencia del usuario, impulsar las ventas cruzadas y mejorar la eficiencia operativa.
Comprensión de los Datos: Se analizaron los datos de transacciones del e-commerce para identificar los productos adquiridos por los clientes.
Preparación de los Datos: Se utilizó Python y la biblioteca Pandas para extraer, transformar y cargar los datos. Esto incluyó la limpieza de datos, la creación de una base de datos de transacciones y la preparación de los datos para el algoritmo Apriori.
Modelado: Se aplicó el algoritmo Apriori (utilizando la biblioteca mlxtend) para descubrir reglas de asociación entre los productos. Se utilizó Google Colab para ejecutar el algoritmo en la nube.
Evaluación: Se evaluaron las reglas de asociación generadas, seleccionando aquellas con un lift superior a 2, lo que indica una fuerte asociación positiva entre los productos.
Despliegue: Se generaron visualizaciones de las reglas de asociación utilizando Matplotlib y Networkx, y se integraron en un informe de Looker Studio para facilitar la comunicación de los hallazgos a los stakeholders.
Resultados Obtenidos
El análisis reveló más de 40 agrupaciones de productos con un lift superior a 2. Estos hallazgos permitieron generar las siguientes recomendaciones:
Estrategias de Venta Cruzada: Implementar ofertas y promociones para incentivar la compra conjunta de productos asociados.
Optimización de Inventario: Ajustar los niveles de stock para asegurar la disponibilidad de productos que se compran juntos.
Diseño de Campañas de Marketing: Crear campañas dirigidas a segmentos específicos, promocionando agrupaciones de productos relevantes.
Desarrollo de un Modelo de Predicción de Consumo: Se propuso una fase futura para predecir la demanda de productos asociados, basado en el crecimiento de la base de clientes.
Herramientas y Metodologías Empleadas
Lenguaje de Programación:
Python: Se utilizó como lenguaje principal para la preparación y el análisis de datos. Su versatilidad y la disponibilidad de bibliotecas especializadas en análisis de datos lo convirtieron en una opción ideal para esta etapa del proyecto.
Bibliotecas de Python:
Pandas: Se utilizó para la manipulación y limpieza de datos, permitiendo realizar operaciones de transformación, filtrado y agregación de manera eficiente.
mlxtend: Se utilizó para la implementación del algoritmo Apriori, que permitió descubrir reglas de asociación entre los productos.
Matplotlib: Se utilizó para la creación de visualizaciones de datos, lo que facilitó la comunicación de los hallazgos a los stakeholders.
Networkx: Se utilizó para el análisis de redes y la visualización de las relaciones entre productos.
Plataforma de Desarrollo:
Google Colab: Se utilizó como plataforma para la ejecución del código de Python y el procesamiento de datos en la nube.
Metodologías de Desarrollo:
CRISP-DM: Se utilizó como metodología de referencia para estructurar el proceso de minería de datos. Sus seis fases (Comprensión del Negocio, Comprensión de los Datos, Preparación de los Datos, Modelado, Evaluación y Despliegue) proporcionaron un marco de trabajo sólido para el proyecto.
Design Thinking: Se aplicó un enfoque de Design Thinking para comprender en profundidad las necesidades de los usuarios y definir soluciones que optimicen su experiencia. Esto incluyó las fases de empatía, definición, ideación, prototipado y prueba.
Kanban y Scrum: Se implementaron metodologías ágiles para la gestión del proyecto. Kanban se utilizó para visualizar el flujo de trabajo y optimizar la entrega continua de valor, mientras que Scrum se empleó para organizar el trabajo del equipo en sprints iterativos.
Documentación del Proyecto
Plan del Proyecto
Documento de Requisitos del Negocio
Epica Principal
Adaptado al proyecto
MACHINE LEARNING
Grafico de las 30 reglas de Asociación Principales (aquellas con mayor lift)
Modelo Semantico
Informe MVP