José Luis González García

Soy Ingeniero Informático (especialidad sistemas de información) licenciado en la Universidad Politécnica de Valencia. Además dispongo de la especialización de Big Data y Sistemas NoSQL en la Universitat Oberta de Catalunya. También poseo varias certificaciones técnicas relacionadas con BI, Big Data y entornos cloud (Microsoft Azure y Google Cloud Platform), así como certificaciones de gestión de proyectos (SCRUM).

A nivel profesional, soy experto en consultoría de Business Intelligence con más de 11 años de experiencia en varios sectores, destacando el sector público de sanidad. Durante estos años he pasado por distintos roles lo cual me aporta una visión completa del BI: desarrollador, arquitecto, analista, jefe de equipo… hasta llegar al rol actual que desempeño de jefe de proyecto en NTT Data, gestionando proyectos internacionales tecnológicamente complejos de data & analytics.

Por último, me gustaría ayudar a los estudiantes de la UOC a, una vez han finalizado sus estudios y su TFM o incluso compaginándolo, ofrecerles oportunidades laborales dentro de NTT Data en proyectos internacionales innovadores y de gran impacto relacionados con data & analytics.

Contacto: josegonz@uoc.edu 

LinkedIn: https://www.linkedin.com/in/jos%C3%A9-luis-gonz%C3%A1lez-garc%C3%ADa-67711450/

Restricciones

No hay restricciones

Líneas

A nivel técnico, doy libertad al alumno en la elección de las herramientas a utilizar acorde a su experiencia/conocimiento. Mi consejo es utilizar siempre alguna plataforma cloud (Microsoft Azure, AWS o GCP) debido a la tendencia actual y la alta demanda de las empresas por este tipo de plataformas. Será de gran utilidad al estudiante para estar preparado al salto profesional. Todas estas plataformas disponen de cuentas gratuitas limitadas y muy básicas pero con capacidad suficiente para el desarrollo del TFM.

Línea 1: Análisis de la mortalidad y expansión del coronavirus

Crear un entorno Business Intelligence que posibilite el análisis de la mortalidad y expansión del coronavirus. Se generará un Data Warehouse que integre los datos de los contagios y mortalidad con el máximo nivel de detalle para que el posterior análisis sea lo más eficaz posible. Esta información se cargará del Data Warehouse a un cubo OLAP para mejorar el análisis y la extracción de conclusiones. El resultado final es la implementación de un sistema Business Intelligence que facilite la adquisición, almacenamiento y explotación de datos asociados a pacientes diagnosticados con el coronavirus. El sistema permitirá a los usuarios comprobar la expansión y mortalidad filtrando por zonas geográficas, rangos de edades y sexo entre otros.

Esta solución se puede enriquecer incorporando fuentes de datos de otra tipología para analizar la posible relación e impacto, doy total libertad al alumno a proponer aquello que más le interese. Algunos ejemplos podrían ser:

El análisis de calidad del dato de las fuentes a tratar previo al inicio del trabajo será de vital importancia para el éxito del mismo.

A modo de ejemplo, el estudiante podrá utilizar alguno de los siguientes datasets:

Casos diarios COVID: https://www.ecdc.europa.eu/sites/default/files/documents/COVID-19-geographic-disbtribution-worldwide.xlsx

Medidas tomadas: https://data.humdata.org/dataset/acaps-covid19-government-measures-dataset

Gasto público en sanidad: http://apps.who.int/gho/athena/api/GHO/GHED_GGHE-DGDP_SHA2011?format=csv

Camas clínicas: http://apps.who.int/gho/athena/api/GHO/WHS6_102?format=csv

Personal médico: http://apps.who.int/gho/athena/api/GHO/HWF_0002?format=csv

Personal enfermería: http://apps.who.int/gho/athena/api/GHO/HWF_0008?format=csv

Densidad poblacional: https://ourworldindata.org/world-population-growth


Línea 2: Análisis de las energías renovables y su relación con el cambio climático

Crear un entorno Business Intelligence que posibilite el análisis de las energías renovables y su relación con el cambio climático. Se generará un Data Warehouse que integre los datos de utilización de energías renovables con datos de reflejen el estado actual del cambio climático. En cuanto a los datos de las energías renovables, se comparará su uso respecto a las energías no renovables y deben reflejar las emisiones de CO2 y emisiones de gases de efecto invernadero que se producen. Sobre los datos que reflejen el cambio climático, se tendrán en cuenta la temperatura, las olas de calor, el nivel del mar, los desastres climáticos, el deshielo en el ártico, la concentración de CO2 en la atmósfera, etc. Esta información se cargará del Data Warehouse a un cubo OLAP para mejorar el análisis y la extracción de conclusiones. El resultado final es la implementación de un sistema Business Intelligence que facilite la adquisición, almacenamiento y explotación de este tipo de datos. El sistema permitirá a los usuarios comprobar la relación existente entre el uso de las energías renovables y el cambio climático.

A modo de ejemplo, el estudiante podrá utilizar alguno de los siguientes datasets:

Cambio climático: https://www.kaggle.com/datasets/berkeleyearth/climate-change-earth-surface-temperature-data

Cambio climático: https://data.world/data-society/global-climate-change-data

CO2: https://www.kaggle.com/datasets/prashant808/co2-emissions

Energías renovables: https://www.kaggle.com/datasets/belayethossainds/renewable-energy-world-wide-19652022

Consumo de energías: https://www.kaggle.com/datasets/pralabhpoudel/world-energy-consumption


Línea 3: Big Data del fútbol

Crear un entorno Big Data que posibilite el análisis de los principales campeonatos de fútbol. Se generará un Datalake que integre datos de los distintos campeonatos, incluyendo cada uno de los partidos, jugadores de cada equipo, sustituciones, asistencias, goles... Toda la información se cargará inicialmente en un datalake "raw" para su posterior tratamiento y modelado en un datalake "curated". Finalmente se construirán los dashboards necesarios para explotar la información y realizar análisis.

A modo de ejemplo, el estudiante podrá utilizar alguno de los siguientes datasets:

https://openfootball.github.io/

https://www.kaggle.com/datasets/davidcariboo/player-scores


Línea 4: Desarrollo de una herramienta para la gestión de cuadros de mando integrales 

Implementación de una herramienta que permita gestionar cuadros de mando integrales (balanced scorecard). En primer lugar, se explicará el origen y la evolución de los cuadros de mando, centrándonos en el uso y la importancia que tiene actualmente en cualquier organización. Se creará la estructura física necesaria para la gestión tanto de los distintos KPIs como objetivos dentro de cada perspectiva. El CMI se dividirá en cuatro perspectivas: financiera, clientes, procesos internos y aprendizaje y crecimiento. A través de procesos de carga ETL se cargará, por un lado, los elementos que componen el cuadro de mando (KPIs, perspectivas y objetivos con sus relaciones entre sí) y, por otro lado, los valores mensuales de cada KPI definido. Mediante el uso de una herramienta de Business Intelligence como Tableau se presentará el CMI resultante. Se estudiará cuál es la mejor herramienta para representar el mapa estratégico.


Línea 5: Análisis del mercado de valores con datos de Twitter

Crear un entorno Business Intelligence que posibilite el análisis de datos bursátiles del mercado de valores conjuntamente con un análisis de sentimiento con datos de Twitter. Se generará un Data Warehouse que integre datos del mercado de valores como información de la empresa, cuenta de resultados, balance, flujos de caja, ratios, cotización... con un análisis de sentimiento de cada empresa en Twitter. Esta información se cargará del Data Warehouse a un cubo OLAP para mejorar el análisis y la extracción de conclusiones. El resultado final es la implementación de un sistema Business Intelligence que facilite la adquisición, almacenamiento y explotación de este tipo de datos. El sistema permitirá analizar la dependencia y el impacto de Twitter en el mercado de valores.

Los datos de Twitter se extraerán a través de la API: https://developer.twitter.com/en/docs/twitter-api

Los datos del mercado de valores se extraerán a través de la API: https://site.financialmodelingprep.com/developer


Línea 6: Análisis del mercado de criptomonedas con datos de Twitter

Crear un entorno Business Intelligence que posibilite el análisis de datos bursátiles del mercado de criptomonedas conjuntamente con un análisis de sentimiento con datos de Twitter. Se generará un Data Warehouse que integre datos del mercado de criptomonedas como información de la criptomoneda, precio, capitalización de mercado... con un análisis de sentimiento de cada criptomoneda en Twitter. Esta información se cargará del Data Warehouse a un cubo OLAP para mejorar el análisis y la extracción de conclusiones. El resultado final es la implementación de un sistema Business Intelligence que facilite la adquisición, almacenamiento y explotación de este tipo de datos. El sistema permitirá analizar la dependencia y el impacto de Twitter en el mercado de criptomonedas.

Los datos de Twitter se extraerán a través de la API: https://developer.twitter.com/en/docs/twitter-api

Los datos del mercado de valores se extraerán a través de la API: https://site.financialmodelingprep.com/developer


Línea 7: Análisis de la efectividad de los tratamientos para dejar de fumar

Crear un entorno Business Intelligence que posibilite el análisis de la eficacia que tienen los diferentes tratamientos existentes para dejar de fumar. Se generará un Data Warehouse que integre los distintos tratamientos con sus resultados con el máximo nivel de detalle para que el posterior análisis sea lo más eficaz posible. Esta información se cargará del Data Warehouse a un cubo OLAP para mejorar el análisis y la extracción de conclusiones. El resultado final es la implementación de un sistema Business Intelligence que facilite la adquisición, almacenamiento y explotación de datos asociados a pacientes fumadores a los que se les ha aplicado algún tratamiento para dejar de fumar. El sistema permitirá a los usuarios comprobar la eficacia de los tratamientos, filtrando por zonas geográficas, rangos de edades y sexo entre otros. 

A modo de ejemplo, el estudiante podrá utilizar alguno de los siguientes datasets:

https://digital.nhs.uk/data-and-information/publications/statistical/statistics-on-nhs-stop-smoking-services-in-england/statistics-on-nhs-stop-smoking-services-england-april-2011-to-september-2011-q2-quarterly-report

https://digital.nhs.uk/data-and-information/publications/statistical/statistics-on-nhs-stop-smoking-services-in-england/april-2021-to-march-2022/datasets


Otras consideraciones

El profesor colaborador puede atender a estudiantes en catalán, castellano e inglés.