teaching

Docencia

Curso 2023-24

Grado

Postgrado


Oferta de trabajos de fin de estudios (TFG/TFM) para los Grados de Ingeniería del Software e Informática y Máster ISIA (dentro de la línea de "Inteligencia Artificial en Biomedicina" de la ETSI Informática de la UMA):

Objetivo del TFM: estudiar el potencial de los grandes modelos de lenguaje (LLM) generativos multilingües ---como ChatGPT, GPT-3, LaMDa, etc.---, haciendo especial hincapié en los LLM biomédicos de código abierto ---como BioMISTRAL , ClinicalGPT, BioGPT, MedAlpaca, PMC-LLama, ChatDoctor, etc.--- para procesar datos biomédicos complejos y extraer información significativa con un mínimo de datos de entrenamiento. Mediante el desarrollo y el perfeccionamiento de estrategias basadas en instrucciones (prompts), se pretende analizar si es posible mejorar significativamente el rendimiento de los modelos, convirtiéndolos en herramientas viables para tareas de reconocimiento de entidades biomédicas (NER) y posiblemente reduciendo la dependencia de extensos conjuntos de datos anotados.

Metodología: Para mejorar el rendimiento de los LLM, se pretende desarrollar un marco de instrucciones específicas (prompts) para tareas biomédicas que incluirá 1) prompts de referencia con descripción de la tarea y especificación del formato, 2) prompts basados en guías de anotación, 3) promtps basados en análisis de errores, 4) prompts basados en grafos de conocimiento extraídos de ontologías y 4) muestras anotadas para el aprendizaje few-shot de los modelos generativos.  Evaluaremos la eficacia de cada promtp y compararemos los modelos con LLM de específicos de NER, como XLMRoBERTa, BETO, mBERT, RoBERTa-Bio-BSC, etc. Los modelos serán analizados en tareas de NER con corpus de texto clínico y entidades etiquetadas en español: CodiEsp, Cantemist, Symptemist, Distemist, MedProcNER, etc.


Dirección de Tesis Doctorales