Docencia
Curso 2024-25
Grado
Asignatura: Programación 2
Grado en Ingeniería de Sistemas de Telecomunicación
Grado en Ingeniería de Tecnologías de Telecomunicación
ETSI Telecomunicación. Universidad de Málaga
Oferta de trabajos de fin de estudios (TFG/TFM) para los Grados de Ingeniería del Software, Salud e Informática (ETSII), Grados de Tecnologías de Telecomunicación y Sistemas de Telecomunicación (ETSIT) y Máster ISIA (dentro de la línea de "Inteligencia Artificial en Biomedicina" de la ETSII) y MUII (ETSII):
OFERTA DE TFG: "Procesamiento de Lenguaje Natural y Modelos Masivos de Lenguaje (LLM) en Biomedicina". Solicitar.
Objetivo del TFG: Esta línea de TFG incluye 2 trabajos dirigidos al desarrollo de soluciones basadas en Inteligencia Artificial (IA) y Procesamiento de Lenguaje Natural (PLN) para el análisis de textos y secuencias biológicas y médicas usando modelos masivos de lenguaje (LLM) e IA generativa. Los trabajos se centrarán en el entrenamiento, ajuste y evaluación de los LLM y herramientas para tareas como: 1) Desarrollo de interfaces para el reconocimiento y etiquetado automático de textos con términos biomédicos; 2) Compilación, curación y preprocesamiento automático de corpus biomédicos para entrenamiento de los LLM; 3) Aplicación de los LLM a tareas como: reconocimiento y normalización de entidades biomédicas; resumen automático de textos científicos y clínicos; extracción de relaciones entre entidades; desarrollo de sistemas de question answering en el ámbito biomédico; extracción de información de secuencias biológicas (genómicas, proteómicas, etc). Esta línea está especialmente orientada a estudiantes con interés en IA aplicada a la biomedicina, y ofrece la oportunidad de trabajar con tecnologías actuales en un área de gran impacto científico.
OFERTA DE TFG: " IA generativa para la evaluación de proyectos de Programación en las Ingenierías". Solicitar.
Objetivo del TFG:. El aprendizaje de la programación en los primeros cursos de las Ingenierías requiere metodologías activas y eficaces como el Aprendizaje Basado en Problemas (ABP). Esta metodología implica que el alumnado afronte problemas complejos a lo largo de un semestre completo, con seguimiento personalizado por parte del profesorado. Sin embargo, dada la alta matrícula habitual en estas titulaciones, es necesario contar con herramientas que automaticen parcialmente la evaluación, facilitando una supervisión más eficiente y una evaluación continua efectiva. En este contexto, la IA generativa y los grandes modelos del lenguaje (LLM), como GPT-4, Claude 3 o Llama-3, ofrecen nuevas oportunidades para desarrollar herramientas avanzadas de autocorrección y evaluación automática. En esta línea de trabajos de fin de grado se proponen dos proyectos orientados a: 1) desarrollo de herramientas prácticas que generen retroalimentación automática y personalizada para los estudiantes a partir de rúbricas establecidas; evaluación automatizada de código fuente mediante detección temprana de errores frecuentes y análisis detallado conforme a criterios específicos. Además, se tendrá especial consideración por los aspectos éticos y la privacidad de datos al implementar estas tecnologías, asegurando un enfoque responsable y consciente del impacto que estas herramientas puedan tener sobre el aprendizaje y la privacidad del alumnado.
OFERTA DE TFM: Desarrollo de una Interfaz para el Etiquetado de Documentos Médicos en Español y Normalización de Entidades Médicas a SNOMED-CT. Solicitar.
Objetivo del TFM: El procesamiento del lenguaje natural (NLP) ha demostrado ser una herramienta clave en la extracción de información médica a partir de textos no estructurados, permitiendo la identificación de conceptos clínicos relevantes para la generación de datos estructurados y procesables. Este trabajo de fin de máster tiene como objetivo el desarrollo de una interfaz gráfica intuitiva y eficiente que facilite el etiquetado manual y automático de entidades médicas en documentos clínicos en español. La herramienta permitirá a los expertos médicos y anotadores revisar, corregir y validar las entidades extraídas automáticamente por un sistema híbrido basado en modelos de aprendizaje profundo y reglas léxicas. Además, la interfaz integrará mecanismos de normalización a SNOMED-CT, asegurando la interoperabilidad de los datos médicos estructurados y mejorando su aplicabilidad en tareas clínicas como la identificación de cohortes y el análisis de historiales médicos.
Metodología: El desarrollo de este TFM seguirá un enfoque iterativo basado en metodologías ágiles. En primer lugar, se realizará un análisis de requerimientos para definir las funcionalidades esenciales de la interfaz, considerando aspectos como la usabilidad para médicos y anotadores, la integración con modelos de reconocimiento de entidades nombradas (NER) y la compatibilidad con SNOMED-CT. Posteriormente, se diseñará y desarrollará la interfaz utilizando tecnologías web modernas, asegurando su compatibilidad con el sistema de NER existente basado en modelos Transformer y reglas léxicas. Se implementarán funciones para la revisión y corrección de anotaciones automáticas, así como herramientas de visualización que faciliten el trabajo de los usuarios. Finalmente, se llevará a cabo una evaluación del sistema con profesionales médicos mediante la anotación de un conjunto de documentos de prueba, analizando métricas de eficiencia, precisión y facilidad de uso.
OFERTA DE TFM: "Inteligencia Artificial generativa y Large-Language-Models (LLM) para el reconocimiento de entidades clínicas nombradas (NER) mediante ingeniería de instrucciones (prompts)". Solicitar.
Objetivo del TFM: estudiar el potencial de los grandes modelos de lenguaje (LLM) generativos multilingües ---como ChatGPT, GPT-3, LaMDa, etc.---, haciendo especial hincapié en los LLM biomédicos de código abierto ---como BioMISTRAL , ClinicalGPT, BioGPT, MedAlpaca, PMC-LLama, ChatDoctor, etc.--- para procesar datos biomédicos complejos y extraer información significativa con un mínimo de datos de entrenamiento. Mediante el desarrollo y el perfeccionamiento de estrategias basadas en instrucciones (prompts), se pretende analizar si es posible mejorar significativamente el rendimiento de los modelos, convirtiéndolos en herramientas viables para tareas de reconocimiento de entidades biomédicas (NER) y posiblemente reduciendo la dependencia de extensos conjuntos de datos anotados.
Metodología: Para mejorar el rendimiento de los LLM, se pretende desarrollar un marco de instrucciones específicas (prompts) para tareas biomédicas que incluirá 1) prompts de referencia con descripción de la tarea y especificación del formato, 2) prompts basados en guías de anotación, 3) promtps basados en análisis de errores, 4) prompts basados en grafos de conocimiento extraídos de ontologías y 4) muestras anotadas para el aprendizaje few-shot de los modelos generativos. Evaluaremos la eficacia de cada promtp y compararemos los modelos con LLM de específicos de NER, como XLMRoBERTa, BETO, mBERT, RoBERTa-Bio-BSC, etc. Los modelos serán analizados en tareas de NER con corpus de texto clínico y entidades etiquetadas en español: CodiEsp, Cantemist, Symptemist, Distemist, MedProcNER, etc.
Dirección de Tesis Doctorales
Fernando Gallego Donoso. "Large Language Models for Biomedical Entity Recognition and Normalization in Low-Resource Languages and Settings". Universidad de Málaga. 11 de Julio 2025. Calificación: sobresaleinte, mención Cum Laude, meción Internacional.
Guillermo López-García. "Aprendizaje automático en Bioinformática: resolución de problemas complejos de naturaleza heterogénea". Universidad de Málaga. 6 de febrero de 2024. Calificación: sobresaliente, mención Cum Laude, mención internacional.
Laura Morente. "Valoración de úlceras por presión mediante tecnologías de la información y las comunicaciones". Universidad de Málaga. 2012. Calificación: sobresaliente, mención Cum Laude.