Diego López Herrera
Soy Ingeniero de Telecomunicación por la UGR y cuento con las certificaciones Professional Scrum Master (PSM I) e ISO 31000 Risk Manager, entre otras. Dispongo de más de 11 años de experiencia en consultoría de negocio enfocada a la analítica de datos. Actualmente me encuentro en la posición de Data & Analytics Manager en Deloitte, liderando un equipo de ingenieros de datos y analistas dedicados al diseño, implementación y puesta en marcha de productos con componentes de Information Management, Data Visualization & Reporting y Advanced Analytics & Big Data. He estado involucrado en multitud de iniciativas y proyectos en gran variedad de industrias y dominios de negocio: Internal Audit, Tax, Compliance, Revenue / Cost Assurance, Crisis Management, Cybersecurity, Software Asset Management y Corporate Social Responsibility, entre otras. He estado tutorizando TFMs a alumnos desde septiembre de 2021 en la UOC de forma ininterrumpida.
Me encantaría poder acompañarte en esta etapa tan relevante de tu formación en la que podrás explorar en profundidad una materia que te suscite gran interés y te abrirá muchas puertas a nivel profesional y académico.
Contacto: dlopezherr@uoc.edu
Perfil de LinkedIn: https://www.linkedin.com/in/diego-l%C3%B3pez-herrera-3846343a/
Líneas de interés
[Líneas relacionadas con datos reales de empresas]
Línea E1: Pharma Products Sales Analytics
Haciendo uso de datos reales de laboratorio farmacéutico en pleno proceso de expansión, se proponen las siguientes líneas de trabajo:
Evaluación de los principales procesos de la empresa y cómo están soportados por datos (AS IS), identificando potenciales mejoras para una mejor explotación de la informacón y toma de decisiones basadas en datos (TO BE).
Ciclo de vida y rentabilidad de productos farmacéuticos comercializados: trazabilidad de costes asociados, precios de venta, descuentos, rentabilidad, condiciones con distintos proveedores, identificación de estacionalidad de demanda, etc.
Control de pedidos y stock: valoración de stock actual, gestión de entregas a almacén, análisis de potenciales roturas de stock, estudio de tiempos entre las diferentes etapas del proceso logístico, análisis de salidas de almacén, etapas de los pedidos en función del proveedor de producto, etc.
[Líneas relacionadas con datos de ciudades]
Línea 1A: Road Traffic Insights
En 2030, se estima que el 60% de la población vivirá en ciudades. En línea con el objetivo 11 (“Make cities inclusive, safe, resilient and sustainable”) de desarrollo sostenible propuesto por la ONU para la Agenda 2030, la buena gestión del tráfico urbano se trata de una cuestión de gran relevancia. El trabajo propuesto consiste en el diseño e implementación de un entorno de Business Intelligence que permita integrar y analizar información sobre el tráfico urbano de una o varias ciudades del mundo. De forma opcional, se valorará la integración de datos adicionales de posible interés como: información meteorológica, tipos de día (festivo, laborable, fin de semana), existencia de eventos relevantes (ferias, conciertos, etc.), medidas adoptadas por las administraciones (por ejemplo, cortes de tráfico en algunas vías principales), etc. Entre otras, se pretende dar respuesta a las siguientes cuestiones analísticas:
¿Qué tipos de condiciones meteorológicas presentan correlación elevada con un alto nivel de tráfico?
¿Qué días de la semana se tiene más tráfico? ¿Tiene influencia relevante el tipo de día (festivo, laborable, fin de semana)?
¿En qué momentos temporales a lo largo del día hay más nivel de tráfico?
¿Influye la existencia de eventos relevantes (ferias, conciertos, etc.) en el nivel de tráfico? ¿Y las medidas adoptadas por las administraciones (por ejemplo, cortes de tráfico en algunas vías principales)?
¿En qué zonas y momentos temporales se tiene mayor y menor tránsito de forma recurrente?
¿Cómo se pueden clusterizar (agrupar) las zonas en función del comportamiento del tráfico a lo largo del día? ¿Y respecto a tendencias a medio/largo plazo?
¿Cómo evoluciona el tráfico a lo largo del día de forma general?
¿Se identifican tendencias en determinadas zonas a lo largo del tiempo desde una perspectiva de medio-largo plazo?
¿Se puede estimar de forma precisa cuándo va a haber situaciones de tráfico denso en base a ciertas variables? ¿Qué variables tienen más influencia?
Adicionalmente, se plantean los siguientes aspectos opcionales del trabajo: a) diseño e implementación de un sistema que detecte en tiempo real situaciones de tráfico denso en determinados puntos para generar recomendaciones al instante; b) diseño e implementación de un modelo predictivo de tráfico urbano entrenado con datos históricos, identifcando las variables de mayor influencia (se podrá evaluar su capacidad de predicción contrastando predicciones respecto a datos de tráfico en tiempo real).
En función de la complejidad de las fuentes de datos y el diseño de la solución, se acordará con la/el estudiante los objetivos a cubrir para una adecuada temporización.
A continuación, se listan ejemplos de fuentes de datos a utilizar, aunque la/el estudiante podrá sugerir los que considere más convenientes por su calidad y granularidad:
Datos del tráfico en tiempo real en Madrid: https://datos.madrid.es/portal/site/egob/menuitem.c05c1f754a33a9fbe4b2e4b284f1a5a0/?vgnextoid=02f2c23866b93410VgnVCM1000000b205a0aRCRD&vgnextchannel=374512b9ace9f310VgnVCM100000171f5a0aRCRD
Histórico de datos del tráfico desde 2013 en Madrid: https://datos.madrid.es/portal/site/egob/menuitem.c05c1f754a33a9fbe4b2e4b284f1a5a0/?vgnextoid=33cb30c367e78410VgnVCM1000000b205a0aRCRD&vgnextchannel=374512b9ace9f310VgnVCM100000171f5a0aRCRD&vgnextfmt=default
Información del estado del tránsito en los tramos de la ciudad de Barcelona: https://opendata-ajuntament.barcelona.cat/data/es/dataset/trams
Enlace con información detallada: P1-Road_Traffic_Insights
Tematica/s: Business Intelligence, Data Science
Línea 1B: Business intelligence environment for air quality analysis in Spanish cities
En línea con el objetivo 11 (“Make cities inclusive, safe, resilient and sustainable”) de desarrollo sostenible propuesto por la ONU para la Agenda 2030, la calidad del aire en las ciudades es un aspecto sobre el que hay un gran foco por el impacto directo en la salud de la ciudadanía. Muchas ciudades españolas cuentan con medidores en distintas áreas que recogen la información sobre la calidad del aire con una alta frecuencia y la ponen a disposición del ciudadano a través de distintos portales de datos abiertos.
El trabajo consiste en diseñar e implementar un entorno de Business Intelligence que permita integrar información sobre la calidad del aire en distintos puntos de las principales ciudades de España, añadiendo datos adicionales de interés para evaluar potenciales relaciones como: datos meteorológicos, desplazamientos en vehículo privado, incendios, emisiones industriales, etc.
Los potenciales objetivos del trabajo incluyen:
Identificación de fuentes de datos relevantes y fiables.
Diseño de la factoría de información corporativa y sus componentes.
Evaluación del estado del arte y justificación de la selección del software para la implementación y arquitectura de la solución en base a las necesidades.
Diseño y definición de la/s base/s de datos.
Diseño e implementación de los procesos de extracción, transformación y carga (ETL/ELT).
Diseño e implementación de capa OLAP.
Diseño e implementación de modelos de minería de datos / machine learning / estadísticos que permitan obtener conocimiento avanzado sobre la información.
Diseño e implementación de visualización de datos para el análisis exploratorio.
Identificación y exposición de los principales hallazgos y conocimiento adquirido mediante el análisis de los datos.
Identificación de las principales líneas de futuro del trabajo (enriquecimiento de datos, reflexión sobre modelos de analítica avanzada aplicados para su refinamiento, etc.).
En función de la complejidad de las fuentes de datos y el diseño de la solución, se acordará con la/el estudiante los objetivos a cubrir para una adecuada temporización.
A continuación, se listan ejemplos de fuentes de datos a utilizar, aunque la/el estudiante podrá sugerir los que considere más convenientes por su calidad y granularidad:
Datos del Sistema Integral de la Calidad del Aire del Ayuntamiento de Madrid: https://datos.madrid.es/portal/site/egob/menuitem.c05c1f754a33a9fbe4b2e4b284f1a5a0/?vgnextoid=aecb88a7e2b73410VgnVCM2000000c205a0aRCRD&vgnextchannel=374512b9ace9f310VgnVCM100000171f5a0aRCRD
Datos de los contaminantes medidos en las estaciones de la ciudad de Barcelona: https://opendata-ajuntament.barcelona.cat/data/es/dataset/qualitat-aire-detall-bcn
Portal AEMET Open Data: https://opendata.aemet.es/centrodedescargas/inicio
Línea 1C: Weather intelligence for entertainment in Spanish cities and towns
En el sector empresarial, múltiples compañías hacen uso de los datos meteorológicos para diversos análisis: gestión de inventario, generación de promociones, convocatoria de eventos, inclusión de anuncios, etc.
El trabajo propuesto se basa en crear un entorno con datos bien organizados y capacidad de interacción por parte del usuario que contenga información meteorológica obsevada histórica y predicciones de los municipios de España. El sistema permitirá categorizar (mediante técnicas de clustering de minería de datos) los municipios en función de las condiciones climáticas que presentan a lo largo del año. Además, permitirá al usuario identificar dinámicamente tipos de actividades de ocio realizables en los próximos días basándose en las predicciones meteorólogicas que se obtienen en tiempo cuasi-real.
Como bloque opcional del trabajo, se podrán utilizar datos de redes sociales (geolocalizados y adecuadamente definidos temporalmente) para identificar actividades usuales en base a las condiciones climáticas.
La fuente de datos propuesta para la obtención de información meteorológica es el portal AEMET Open Data, aunque la/el estudiante podrá proponer y validar con el profesor colaborador cualquier otra que considere más conveniente.
[Líneas relacionadas otros datos]
Línea 2: Corporate tax haven analytics
En las últimas décadas han aumentado notablemente los entramados corporativos relacionados con la denominada “ingeniería fiscal” y, con ello, los movimientos asociados a cuentas en paraísos fiscales (tax havens). Las autoridades fiscales persiguen las operaciones sospechosas mediante mecanismos analíticos complejos que permiten identificar patrones inusuales, además de establecer regulación exhaustiva para evitar los fllujos financieros ilícitos.
El trabajo propuesto consiste en diseñar e implementar un entorno de Business Intelligence que permita integrar información sobre la exposición, vulnerabilidad e intensidad de los flujos financieros ilícitos de diferentes áreas (importaciones, exportaciones, transferencias bancarias, etc.) en cada país/jurisdicción. Se evaluarán las tendencias a lo largo de los años y, además, se nutrirá el análisis con información relativa a indicadores financieros, económicos, regulatorios, etc. que permitan identificar patrones de comportamiento habituales en países considerados paraísos fiscales. El objetivo principal es adquirir conocimiento sobre las regiones/países que están más expuestas a este tipo de riesgo, cuáles son las tendencias actuales y la identificación de agrupaciones dentro de los paraísos fiscales.
En función de la complejidad de las fuentes de datos y el diseño de la solución, se acordará con la/el estudiante los objetivos a cubrir para una adecuada temporización.
A continuación, se listan ejemplos de fuentes de datos a utilizar, aunque la/el estudiante podrá sugerir los que considere más convenientes por su calidad y granularidad:
Base de datos “Corporate Tax Haven Index” de Tax Justice Network: https://cthi.taxjustice.net/en/
Índices y métricas proporcionadas por Tax Justice Network: https://taxjustice.net/indexes-tools/
Base de datos de la OECD (Organisation for Economic Co-operation and Development): https://stats.oecd.org/
Línea 3: Propuestas por parte de la/el estudiante
El profesor colaborador valorará propuestas de trabajos por parte de la/el estudiante dentro de las siguientes áreas:
Modelos de aprendizaje automático.
Diseño y testeo de soluciones de negocio.
Diseño y desarrollo de cuadros de mando para la toma de decisiones.
Clasificación de usuarios /clientes / consumidores.
Análisis de un conjunto de datos en un área de negocio concreta.
Sistemas de recomendación.
Otras consideraciones
El profesor colaborador puede atender a estudiantes en castellano e inglés.
Restricciones
No hay restricciones