Proyectos
Proyectos
Resultados: En esta fase final, el proyecto migró a un entorno de Data Warehouse profesional. Se implementó una instancia de AWS RDS (PostgreSQL) para centralizar el almacenamiento y se diseñó una arquitectura de Modelo Estrella (Star Schema), optimizando la velocidad de consulta para analítica avanzada. Un punto clave fue la seguridad: se desarrolló un sistema de gestión de credenciales desacoplado para proteger el acceso a la infraestructura cloud. Esta versión integra el procesamiento masivo de la v2.0 con una base de datos de alto rendimiento, permitiendo que las visualizaciones en Power BI se conecten directamente a una "única fuente de verdad" en la nube.
Herramientas: SQL, Python, SQLAlchemy, Psycopg2, Star Schema Design.
Fuente de datos: Pipeline automatizado (Datos procesados de la v2.0).
Plataformas: AWS (RDS), PostgreSQL, DBeaver, GitHub.
Ver más
Resultados: Esta fase transformó el análisis exploratorio en un entorno de ingeniería profesional. Se desarrolló un motor ETL (Extract, Transform, Load) modular en Python diseñado para procesar eficientemente un dataset de 2.4 GB. El enfoque principal fue la escalabilidad y la calidad, implementando una arquitectura de código desacoplado que separa la extracción de la transformación lógica. El sistema integra capas de validación automática que garantizan la integridad de los datos, eliminando procesos manuales y estandarizando la salida para su futura migración a la nube. Estos avances permiten un procesamiento masivo de datos con un consumo optimizado de memoria.
Herramientas: Python, Pandas, Numpy, Logging, Modular Programming.
Fuente de datos: Dataset CSV con +12M de registros
Plataformas: Visual Studio Code, Git, GitHub.
Ver más
Resultados: El análisis identificó a Perú y México como mercados prioritarios para la expansión farmacéutica debido a importantes desafíos en el acceso a la salud, agravados por limitaciones económicas que restringen la disponibilidad de atención privada. Chile y Argentina mostraron mejores condiciones socioeconómicas e infraestructura sanitaria. El estudio normalizó los datos considerando las diferencias poblacionales para asegurar comparaciones equitativas, evitando que países con mayor población distorsionaran los resultados. Estos hallazgos constituyen una base sólida para inversiones focalizadas que aborden las desigualdades en salud en la región.
Herramientas: Python, Pandas, Numpy, Matplotlib, Seaborn
Fuente de datos: Dataset CSV con +12M de registros
Plataformas: Visual Studio Code, Jupyter Notebook, Power BI Desktop
Ver más
Resultados: Este proyecto analizó el desempeño y engagement en redes sociales en varias plataformas, revelando que Instagram y TikTok lideran en compromiso emocional, mientras que LinkedIn es la más efectiva para conversiones. Al identificar los mejores horarios de publicación por región y relacionar el tono emocional con la interacción del usuario, el estudio entregó insights prácticos para optimizar la estrategia de contenidos y potenciar el impacto de las campañas.
Herramientas: Azure SQL DB, Power BI, Power Query, Python
Fuente de Datos: Kaggle – Social Media Engagement Dataset
Plataformas: Visual Studio Code, Jupyter Notebook, Power BI Desktop, Azure Cloud SQL DB
Ver más
Resultados: Se identificaron riesgos de sobre stock en productos clave (especialmente en el mercado del Reino Unido) y líneas de productos no rentables. Se propusieron criterios de priorización para decisiones de reposición y financieras basados en visualizaciones e insights de los datos.
Herramientas: Power BI, SQL, Prophet, Excel, Power Query
Fuente de Datos: Kaggle – Inventory Case Study Dataset
Plataformas: Visual Studio Code, Jupyter Notebook, Power BI Desktop, Google Cloud SQL (MySQL)
Ver más
Resultados: El análisis financiero de ventas (2011-2013) destacó un cambio clave: las bicicletas de montaña, con mayor rentabilidad, superaron en ventas a las de carretera, mejorando los márgenes. Estados Unidos y Australia lideraron las ventas, con patrones estacionales claros. La categoría accesorios mostró alto potencial no explotado debido a su elevado margen. Se evidenció crecimiento en la cantidad de productos por cliente, indicando mayor fidelización. El estudio identifica oportunidades para optimizar costos, precios y estrategias de cross-selling, consolidando un reposicionamiento exitoso hacia un mercado más accesible y diversificado.
Herramientas: Power BI, DAX, Power Query
Base de datos: AdventureWorksDW2019.bak (modelo relacional) y archivo .xlsx
Plataforma: Power BI Desktop
Ver más
Resultados:
Se identificaron debilidades clave en la oferta de productos (falta de bebidas y opciones inclusivas) y baja adopción de canales digitales. Se propusieron mejoras estratégicas en el menú, la experiencia de usuario y la logística de entregas. El análisis, basado en consultas SQL sobre una base relacional optimizada, permitió generar insights accionables para aumentar el ticket promedio y la eficiencia operativa.
Proyecto de análisis de datos comerciales sobre un dataset de ventas internacionales, utilizando Google Sheets / Excel, con foco en limpieza de datos, métricas clave y visualización para la toma de decisiones.
Alcance del trabajo:
Limpieza y depuración del dataset (eliminación de datos vacíos e inconsistentes).
Estandarización de formatos (fechas, texto y moneda USD).
Creación de métricas clave: Costo Total y Ventas Totales
Integración de tablas relacionadas de productos para análisis por frecuencia y volumen.
Desarrollo de tablas dinámicas y gráficos para analizar ventas por categoría, región, mercado, segmento, año y método de envío.
Identificación de insights regionales y de desempeño comercia