BIO
Javier Martín Arista es catedrático de historia de la lengua inglesa en la Universidad de La Rioja. Ha sido investigador visitante de las universidades de Sheffield, Pensilvania, Nueva York, Amsterdam, Toronto, York y Oxford, y ha dictado conferencias por invitación en varias universidades europeas y americanas. Su investigación se ha desarrollado tanto en la vertiente teórica, con trabajos sobre gramáticas funcionales y de construcciones; como en la diacrónica, centrada en la semántica, sintaxis, morfología y lexicología del inglés antiguo; y como en la aplicada, con investigación dirigida a la construcción, con técnicas de lingüística de corpus y de procesamiento de lenguaje natural, de una base de conocimiento con bases de datos léxicas relacionales. Dentro de estas líneas de investigación, es autor de más de unos ochenta capítulos de libro y artículos en revistas especializadas y ha presentado en torno a cien comunicaciones, mesas redondas, seminarios y talleres en congresos y reuniones científicas. Desde 2005, Javier Martín Arista es el investigador principal del Proyecto Nerthus (www.nerthusproject.com), que ha recibido financiación de seis convocatorias de proyectos competitivos; ha producido casi un centenar de artículos y capítulos de libro sobre análisis lingüístico del inglés antiguo con bases de datos léxicas relacionales; y ha publicado una base de conocimiento online y resultados descriptivos con los que se han elaborado quince tesis doctorales y actualmente se encuentran otras dos en fase de elaboración. El Prof. Martín Arista ha dirigido asimismo una veintena de tesis doctorales y es el responsable del Grupo de Investigación "Gramáticas Funcionales: Aplicaciones Sincrónicas y Diacrónicas a la Lengua Inglesa".
Más información:
https://investigacion.unirioja.es/investigadores/112/detalle
Generación automática de texto de lenguas históricas
El Procesamiento de Lenguaje Natural (PLN) tiene entre sus tareas la generación de textos. Los Grandes Modelos de Lenguaje (GML) como Chat GPT o Claude desempeñan esta tarea con gran eficiencia y corrección, produciendo lenguaje natural que cumple los propósitos comunicativos de entornos, por regla general, técnicos o especializados. Los GML, sin embargo, necesitan cantidades ingentes de datos de entrenamiento, por lo que las lenguas históricas o con tradición escrita escasa no son muy adecuadas para el tratamiento por medio de estos modelos computacionales. Incluso la alternativa de utilizar librerías de PLN, que son menos costosas computacionalmente, hace necesario disponer de un volumen de datos digitalizados, estructurados y anotados suficiente para obtener índices de alcance y precisión aceptables. El inglés antiguo, que es una de las lenguas germánicas antiguas mejor documentadas, sólo cuenta con tres millones de palabras. Se necesita, por lo tanto, generar datos de entrenamiento que, junto con los datos existentes, permitan realizar tareas de PLN que ahora no tienen resultados aceptables. En esta charla, se exploran los distintos procedimientos de generación de texto en inglés antiguo y las métricas para evaluar el texto generado desde el punto de vista cuantitativo y cualitativo.
Social media
Contact
linguistics.research.seminars@gmail.com
PID 070/2024-2025
PID ID2024/088