David Amorós Alcaraz
Licenciado en Informática por la Universidad Politécnica de Catalunya
Experiencia profesional
Actualmente director de informática de F&W Networks, compañía dedicada a la creación de infraesctructura de fibra en en Reino Unido. Amplia experiencia en el sector BI y data analytics como la creación de sistemas para la detección precoz de tumores o la creación de un sistema predictivo de detección de averias en turbinas eólicas.
Experiencia Investigación:
Director proyecto FICHE (2014-2015) cofinanciado por la CEE para la creación de un entorno basado en FIWARE para el tratamiento de enfermedades relacionadas con los trastornos de conducta alimentaria.
Analista para el proyecto de investigación Interpret haciendo tareas de dirección del proyecto y análisis.
Creación de procesos de mantenimiento y ampliación de la base de datos Interpret sobre tumores cerebrales
Analista para el proyecto E-Tumour (LSHC-CT-2004-503094) haciendo tareas de analista y programador
Diseño e implementación de una base de datos mundial para el almacenamiento de datos clínicos sobre tumores cerebrales: MRS, MRI, HRMAS, DNA MicroArrays
Diseño e implementación de un sistema colaborativo basado en agentes inteligentes para la clasificación de tumores cerebrales: MRS, MRI, HRMAS, DNA MicroArrays
Creación de Agentes para el diagnóstico colaborativo y el tratamiento de los datos clínicos entre hospitales
Creación de un sistema basado en tecnología RFID activa para la correcta administración de medicamentos en entorno hospitalario
Utilización de técnicas de Reconocimiento de patrones para la detección precoz de tumores de próstata
Contacto: damoros@uoc.edu
Restricciones
Se pueden adaptar los temas de trabajo en función de los conocimientos iniciales del alumno así como de su interés particular.
Líneas
Para la realización de todos los trabajos se facilitará un set de datos con el que trabajar.
Propuesta 1. Sistema BI para el análisis de datos provenientes de enfermos con trastornos cognitivos (BI, BA)
El objetivo de TFM es la construcción de un almacén de datos (DWH) para albergar datos de pacientes con trastornos de adicción. Dado un set de datos de trabajo el estudiante deberá construir los procesos ETL para provisionar el Data Warehouse utilizando alguna herramienta como Pentaho Data Integration o Talend. Una vez diseñado el DWH y aprovisionado, se deberá modelar un sistema multidimensional utilizando una de las herramientas BI del mercado (Pentaho, Power BI, QlikView,...) A partir de dicho modelo, se deberá crear un cuadro de mando integral para el análisis y toma decisiones sobre la relaciones entre las distintas dimensiones.
Además se podrá enriquecer el sistema con la creación de un módulo de Machine Learning con capacidades predictivas.
Las preguntas que se quieren resolver son las siguientes:
· ¿Cuál es la relación entre las actividades realizadas y los episodios de crisis graves?
· ¿Se puede establecer algún tipo de relación entre los valores de los diferentes estados de ánimo y los episodios de crisis?
· Estas relaciones son iguales para cualquiera de las enfermedades o en cambio hay relaciones más acusadas por alguna de ellas.
· ¿Se puede establecer alguna relación en nivel geográfico, por ejemplo entorno urbano o rural?
· ¿Cuál sido la evolución de los diferentes pacientes a lo largo del tiempo?
· ¿Se puede establecer alguna relación entre los episodios de crisis y el momento del día o de la semana o del año?
· La realización de actividades físicas mejora o empeora el estado de ánimo de los pacientes.
· ¿Hay algún tipo de actividad que mejore el día a día de los pacientes?
Propuesta 2. Sistema de inteligencia de negocio para el análisis publicitario (BI, BA)
El objetivo de este trabajo se el diseño e implementación de un sistema de Business Intelligence que facilite la adquisición, el almacenamiento y la explotación de datos obtenidos de la campaña publicitaria llevada a cabo en ubicaciones diferentes. Para ello se deberá diseñar un almacén de datos (Data Warehouse) que permita almacenar la información adquirida en los diferentes orígenes. A partir de aquí se deberá implementar este almacén de datos y programar los procesos ETL (extracción, transformación y carga) que permitan alimentar el DWH a partir de los ficheros base facilitados. Utilizando alguna de las diferentes plataformas BI OS disponibles en el mercado se deberá construir un Cuadro de mando para explorar la información almacenada.
Las preguntas que se quieren resolver son las siguientes:
· ¿En general, la publicidad basada en impactos visuales, es positiva?
· ¿Hay determinadas zonas geográficas donde los impactos son más efectivos?
· ¿Según la familia de producto, existe alguna relación entre los artículos impactados y el resultado obtenido?
· ¿Son más efectivos los impactos, según el momento temporal en que se producen?
· ¿Existe algún artículo o familia que según la zona, su publicidad resulta más efectiva? ¿Y según el momento en que se realiza?
Propuesta 3. Sistema de inteligencia de negocio para el análisis de los tratamientos de reducción del colesterol (BI, BA)
El objetivo de este trabajo es el diseño e implementación de un sistema de Business Intelligence que facilite la adquisición, el almacenamiento y la explotación de datos asociados a pacientes a los que se los ha diagnosticado los niveles de colesterol (LDL). Además en base a un data set se deberá anlizar el impacto en esta enfermedad de diferentes tratamientos segun diferentes indicadores facilitados.
Las preguntas que se quieren resolver son las siguientes:
· ¿Cuál es la relación entre los diferentes tratamientos y la evolución de los pacientes?
· ¿Existen terapias más eficaces?
· ¿Ha influido en el resultado, los hábitos de los pacientes?
· ¿La evolución a lo largo del tiempo, por un mismo tratamiento , dependen de algún factor como los hábitos.
· ¿Hay diferencias en el resultado de un tratamiento según el lugar geográfico del paciente?
· ¿Hay algún periodo del año donde el tratamiento sea más o menos efectivo?
Propuesta 4. SISTEMA BI PARA EL ANÁLISIS DE DATOS ASOCIADOS A TCA (BI, BA)
Crear un entorno BI que facilite el análisis de la información generada por pacientes y terapeutas dentro del marco de las enfermedades de trastornos alimentarios.
El objetivo general es el diseño e implementación de un sistema de Business Intelligence que facilite la adquisición, el almacenamiento y la explotación de datos asociados a pacientes con este tipo de enfermedades provenientes de diferentes centros médicos.
Los objetivos específicos del trabajo son:
1. Diseñar un almacén de datos (Data Warehouse) que permita almacenar la información adquirida desde los diferentes orígenes de datos situados en cada centro médico.
2. Implementar este almacén de datos.
3. Utilizar una herramienta BI como Power BI o la suite de Pentaho en su versión Community para la realización de los siguientes trabajos:
Programar los procesos ETL (extracción, transformación y carga) que permitan alimentar el DW a partir de los ficheros base facilitados. Para ellos se podrá utilizar la herramienta Data Integration de Pentaho o crear procesos ad-hoc manualmente.
Diseño de la Arquitectura del DWH.
Creación de un cuadro de mando y un entorno OLAP.
Propuesta 5. Sistema BI para el análisis de la gestión y optimización en la producción Eólica (BI, BA, DS)
En base a los datos SCADA obtenidos en diferentes parques eólicos, se construirà u sistema multidimensional que permita analizar las diferentes mètricas facilitadas y extraer conclusiones sobre operadores, marcas, ubicaciones y variaciones estacionales. Además la aportación de información sobre alarmas producidas permitirá abordar la generación de motores predictivos válidos para el mantenimiento de aerogeneradores.
Las preguntas que se quieren resolver son las siguientes:
Existen diferencias entre los diferentes operadores a nivel de disponibilidad de los aerogeneradores.
Comprobar si los niveles de producción varían en función del parque/operador o por el contrario están más en función del fabricante/modelo del aerogenerador.
Existe relación entre los niveles de alguna variable y las alarmas producidas.
Existe correlación entre los valores de variables como temperatura y producción
¿Qué operadores/parques ofrecen unos niveles más altos de disponibilidad?
¿Qué marcas/modelos frecen unos niveles más altos de disponibilidad?
Propuesta 6. Sistema de inteligencia de negocio para el análisis de datos meteorológicos en parques offshore (BI, BA, DS)
El objetivo general es el diseño e implementación de un sistema de Business Intelligence que facilite la adquisición, el almacenamiento y la explotación de datos provenientes de diferentes parques eólicos offshore donde tenemos instaladas boyas meteorológicas. Esto permitirá poder disponer de información adicional sobre las condiciones meteorológicas y tener más capacidad de análisis.
Las preguntas que se quieren resolver son las siguientes:
Cuáles son los parques eólicos más productivos. No necesariamente las zonas con constantes de viento más altas son las mejores, a veces la colocación de los aerogeneradores o la tecnología (marca, modelo) pueden hacer variar la potencia generada en cada caso.
Hacer un análisis profundo sobre los datos meteorológicos de cada parque y la incidencia sobre la producción.
Zonas con mejor relación viento/potencia. Dado el caso que se quiera ampliar un parque o crear uno de nuevo, este dato nos puede ser muy útil para valorar la ubicación definitiva.
Análisis de alarmas. Ver si hay alguna relación entre las alarmas que se producen (que acostumbran a parar el aerogenerador) y las variaciones meteorológicas. Esto nos puede ayudar a analizar cuáles son los problemas de los parques.
Efectividad de las empresas de mantenimiento a partir del dato de disponibilidad. Es deseable que una empresa de mantenimiento minimice las alarmas y maximice la disponibilidad. Esta información es vital para la establecer los criterios contractuales o renovarlos.
Relaciones entre variables de producción y meteorológicas. La temperatura externa en un parque puede ser un indicador de futuras averías, de la misma forma que lo puede ser rachas de viento extremas muy continuadas o la altura de las olas.
Otras consideraciones
El profesor colaborador puede atender a estudiantes en catalán, castellano e inglés.