José Luis González García
Soy Ingeniero Informático (especialidad sistemas de información) licenciado en la Universidad Politécnica de Valencia. Además dispongo de la especialización de Big Data y Sistemas NoSQL en la Universitat Oberta de Catalunya. También poseo varias certificaciones técnicas relacionadas con BI, Big Data y entornos cloud (Microsoft Azure y Google Cloud Platform), así como certificaciones de gestión de proyectos (SCRUM).
A nivel profesional, soy experto en consultoría de Business Intelligence con más de 11 años de experiencia en varios sectores, destacando el sector público de sanidad. Durante estos años he pasado por distintos roles lo cual me aporta una visión completa del BI: desarrollador, arquitecto, analista, jefe de equipo… hasta llegar al rol actual que desempeño de jefe de proyecto en NTT Data, gestionando proyectos internacionales tecnológicamente complejos de data & analytics.
Por último, me gustaría ayudar a los estudiantes de la UOC a, una vez han finalizado sus estudios y su TFM o incluso compaginándolo, ofrecerles oportunidades laborales dentro de NTT Data en proyectos internacionales innovadores y de gran impacto relacionados con data & analytics.
Contacto: josegonz@uoc.edu
LinkedIn: https://www.linkedin.com/in/jos%C3%A9-luis-gonz%C3%A1lez-garc%C3%ADa-67711450/
Restricciones
No hay restricciones
Líneas
A nivel técnico, doy libertad al alumno en la elección de las herramientas a utilizar acorde a su experiencia/conocimiento. Mi consejo es utilizar siempre alguna plataforma cloud (Microsoft Azure, AWS o GCP) debido a la tendencia actual y la alta demanda de las empresas por este tipo de plataformas. Será de gran utilidad al estudiante para estar preparado al salto profesional. Todas estas plataformas disponen de cuentas gratuitas limitadas y muy básicas pero con capacidad suficiente para el desarrollo del TFM.
Línea 1: Análisis de la mortalidad y expansión del coronavirus
Crear un entorno Business Intelligence que posibilite el análisis de la mortalidad y expansión del coronavirus. Se generará un Data Warehouse que integre los datos de los contagios y mortalidad con el máximo nivel de detalle para que el posterior análisis sea lo más eficaz posible. Esta información se cargará del Data Warehouse a un cubo OLAP para mejorar el análisis y la extracción de conclusiones. El resultado final es la implementación de un sistema Business Intelligence que facilite la adquisición, almacenamiento y explotación de datos asociados a pacientes diagnosticados con el coronavirus. El sistema permitirá a los usuarios comprobar la expansión y mortalidad filtrando por zonas geográficas, rangos de edades y sexo entre otros.
Esta solución se puede enriquecer incorporando fuentes de datos de otra tipología para analizar la posible relación e impacto, doy total libertad al alumno a proponer aquello que más le interese. Algunos ejemplos podrían ser:
Análisis de la mortalidad y expansión del coronavirus y su impacto en la economía: se incorporarán fuentes de datos con indicadores macro-económicos (PIB, indicadores bursátiles, IPC, etc)
Análisis de la mortalidad y expansión del coronavirus y su impacto en el mercado inmobiliario (número de transacciones, valor, etc)
Análisis de la mortalidad y expansión del coronavirus y su impacto en el sistema público de salud (número de personal sanitario en activo, número de personal sanitario contagiado, bajas, número de camas libres, ocupación UCI, etc)
Análisis de la mortalidad y expansión del coronavirus en función de las medidas adoptadas (estado de alarma, confinamientos, fases, cierre ocio nocturno, etc)
Análisis de la mortalidad y expansión del coronavirus y su impacto en la educación (medidas adoptadas en la educación, metodología de aprendizaje, número de brotes/contagios en clases, número de clases confinadas, etc)
Análisis de la mortalidad y expansión del coronavirus y sus brotes (origen, causas, medidas adoptadas, etc)
Análisis de la mortalidad y expansión del coronavirus y su impacto en el empleo (trabajadores en ERTE, tasa de desempleo, altas/bajas seguridad social, etc)
Análisis de la mortalidad y expansión del coronavirus y evolución de las distintas vacunas
El análisis de calidad del dato de las fuentes a tratar previo al inicio del trabajo será de vital importancia para el éxito del mismo.
A modo de ejemplo, el estudiante podrá utilizar alguno de los siguientes datasets:
Casos diarios COVID: https://www.ecdc.europa.eu/sites/default/files/documents/COVID-19-geographic-disbtribution-worldwide.xlsx
Medidas tomadas: https://data.humdata.org/dataset/acaps-covid19-government-measures-dataset
Gasto público en sanidad: http://apps.who.int/gho/athena/api/GHO/GHED_GGHE-DGDP_SHA2011?format=csv
Camas clínicas: http://apps.who.int/gho/athena/api/GHO/WHS6_102?format=csv
Personal médico: http://apps.who.int/gho/athena/api/GHO/HWF_0002?format=csv
Personal enfermería: http://apps.who.int/gho/athena/api/GHO/HWF_0008?format=csv
Densidad poblacional: https://ourworldindata.org/world-population-growth
Línea 2: Análisis de las energías renovables y su relación con el cambio climático
Crear un entorno Business Intelligence que posibilite el análisis de las energías renovables y su relación con el cambio climático. Se generará un Data Warehouse que integre los datos de utilización de energías renovables con datos de reflejen el estado actual del cambio climático. En cuanto a los datos de las energías renovables, se comparará su uso respecto a las energías no renovables y deben reflejar las emisiones de CO2 y emisiones de gases de efecto invernadero que se producen. Sobre los datos que reflejen el cambio climático, se tendrán en cuenta la temperatura, las olas de calor, el nivel del mar, los desastres climáticos, el deshielo en el ártico, la concentración de CO2 en la atmósfera, etc. Esta información se cargará del Data Warehouse a un cubo OLAP para mejorar el análisis y la extracción de conclusiones. El resultado final es la implementación de un sistema Business Intelligence que facilite la adquisición, almacenamiento y explotación de este tipo de datos. El sistema permitirá a los usuarios comprobar la relación existente entre el uso de las energías renovables y el cambio climático.
A modo de ejemplo, el estudiante podrá utilizar alguno de los siguientes datasets:
Cambio climático: https://www.kaggle.com/datasets/berkeleyearth/climate-change-earth-surface-temperature-data
Cambio climático: https://data.world/data-society/global-climate-change-data
CO2: https://www.kaggle.com/datasets/prashant808/co2-emissions
Energías renovables: https://www.kaggle.com/datasets/belayethossainds/renewable-energy-world-wide-19652022
Consumo de energías: https://www.kaggle.com/datasets/pralabhpoudel/world-energy-consumption
Línea 3: Big Data del fútbol
Crear un entorno Big Data que posibilite el análisis de los principales campeonatos de fútbol. Se generará un Datalake que integre datos de los distintos campeonatos, incluyendo cada uno de los partidos, jugadores de cada equipo, sustituciones, asistencias, goles... Toda la información se cargará inicialmente en un datalake "raw" para su posterior tratamiento y modelado en un datalake "curated". Finalmente se construirán los dashboards necesarios para explotar la información y realizar análisis.
A modo de ejemplo, el estudiante podrá utilizar alguno de los siguientes datasets:
https://openfootball.github.io/
https://www.kaggle.com/datasets/davidcariboo/player-scores
Línea 4: Desarrollo de una herramienta para la gestión de cuadros de mando integrales
Implementación de una herramienta que permita gestionar cuadros de mando integrales (balanced scorecard). En primer lugar, se explicará el origen y la evolución de los cuadros de mando, centrándonos en el uso y la importancia que tiene actualmente en cualquier organización. Se creará la estructura física necesaria para la gestión tanto de los distintos KPIs como objetivos dentro de cada perspectiva. El CMI se dividirá en cuatro perspectivas: financiera, clientes, procesos internos y aprendizaje y crecimiento. A través de procesos de carga ETL se cargará, por un lado, los elementos que componen el cuadro de mando (KPIs, perspectivas y objetivos con sus relaciones entre sí) y, por otro lado, los valores mensuales de cada KPI definido. Mediante el uso de una herramienta de Business Intelligence como Tableau se presentará el CMI resultante. Se estudiará cuál es la mejor herramienta para representar el mapa estratégico.
Línea 5: Análisis del mercado de valores con datos de Twitter
Crear un entorno Business Intelligence que posibilite el análisis de datos bursátiles del mercado de valores conjuntamente con un análisis de sentimiento con datos de Twitter. Se generará un Data Warehouse que integre datos del mercado de valores como información de la empresa, cuenta de resultados, balance, flujos de caja, ratios, cotización... con un análisis de sentimiento de cada empresa en Twitter. Esta información se cargará del Data Warehouse a un cubo OLAP para mejorar el análisis y la extracción de conclusiones. El resultado final es la implementación de un sistema Business Intelligence que facilite la adquisición, almacenamiento y explotación de este tipo de datos. El sistema permitirá analizar la dependencia y el impacto de Twitter en el mercado de valores.
Los datos de Twitter se extraerán a través de la API: https://developer.twitter.com/en/docs/twitter-api
Los datos del mercado de valores se extraerán a través de la API: https://site.financialmodelingprep.com/developer
Línea 6: Análisis del mercado de criptomonedas con datos de Twitter
Crear un entorno Business Intelligence que posibilite el análisis de datos bursátiles del mercado de criptomonedas conjuntamente con un análisis de sentimiento con datos de Twitter. Se generará un Data Warehouse que integre datos del mercado de criptomonedas como información de la criptomoneda, precio, capitalización de mercado... con un análisis de sentimiento de cada criptomoneda en Twitter. Esta información se cargará del Data Warehouse a un cubo OLAP para mejorar el análisis y la extracción de conclusiones. El resultado final es la implementación de un sistema Business Intelligence que facilite la adquisición, almacenamiento y explotación de este tipo de datos. El sistema permitirá analizar la dependencia y el impacto de Twitter en el mercado de criptomonedas.
Los datos de Twitter se extraerán a través de la API: https://developer.twitter.com/en/docs/twitter-api
Los datos del mercado de valores se extraerán a través de la API: https://site.financialmodelingprep.com/developer
Línea 7: Análisis de la efectividad de los tratamientos para dejar de fumar
Crear un entorno Business Intelligence que posibilite el análisis de la eficacia que tienen los diferentes tratamientos existentes para dejar de fumar. Se generará un Data Warehouse que integre los distintos tratamientos con sus resultados con el máximo nivel de detalle para que el posterior análisis sea lo más eficaz posible. Esta información se cargará del Data Warehouse a un cubo OLAP para mejorar el análisis y la extracción de conclusiones. El resultado final es la implementación de un sistema Business Intelligence que facilite la adquisición, almacenamiento y explotación de datos asociados a pacientes fumadores a los que se les ha aplicado algún tratamiento para dejar de fumar. El sistema permitirá a los usuarios comprobar la eficacia de los tratamientos, filtrando por zonas geográficas, rangos de edades y sexo entre otros.
A modo de ejemplo, el estudiante podrá utilizar alguno de los siguientes datasets:
Otras consideraciones
El profesor colaborador puede atender a estudiantes en catalán, castellano e inglés.