Empentón a l'aragonés en o mundo d'a IA!

Datathon d'Aragonés

13 marzo 2026, Campus Río Ebro (Zaragoza) | Online (calendatas por determinar)

Evento ta crear benchmarks d'avaluación pa los modelos de parlache en aragonés

O Reto Os grans modelos como ChatGPT no charran bien l'aragonés. Les fan falta "datasets": coleccions de textos pa poder avaluar a nuestra luenga.

A Misión Dende a Universidat de Zaragoza buscamos charradors pa poder crear estes datasets. O tuyo treballo? Revisar y correchir traduccions automaticas curtas (de 6 a 15 parolas).

Cuán y án? Organizaremos un "Datathon" (sesión de treballo) en o Campus Río Ebro (Zaragoza) lo viernes 13 de marzo, 2026, de 15:00 a 19:00.

Lo resultau: Cadiera

Conchunto de multiples datasets pa prebar la eficacia d'os LLMs (Large Language Models, como ChatGPT) a la hora de charrar aragonés
Abance en representación de luengas minoritarias en o mundo dichital
Imprescindible pa amillorar las capacidaz d'estes modelos en luenga aragonesa
Disponibles librement en HuggingFace y Github (proximament)

Per qué se diz "cadiera"? Perque l'obchectivo ye obtener “Benchmarks” (bases de datos de prebas) en aragonés (“bench” > “banco” > “cadiera”)

Trobando un puesto de privilechio pa l'aragonés

Mientres que lo castellán, lo catalán, lo gallego y l'euskera tienen un numero creixient de recursos pa avaluar modelos d'IA en estas luengas, l'aragonés nomás conta con un recurso!

Irene Baucells, Javier Aula-Blasco, Iria de-Dios-Flores, Silvia Paniagua Suárez, Naiara Perez, Anna Salles, Susana Sotelo Docio, Júlia Falcão, Jose Javier Saiz, Robiert Sepulveda Torres, Jeremy Barnes, Pablo Gamallo, Aitor Gonzalez-Agirre, German Rigau, and Marta Villegas. 2025. IberoBench: A Benchmark for LLM Evaluation in Iberian Languages. In Proceedings of the 31st International Conference on Computational Linguistics, pages 10491–10519, Abu Dhabi, UAE. Association for Computational Linguistics.

Aduya-nos a cambiar esta situación!

Si quiers, puez colaborar con nusatros:

Lo día 13 de marzo, 2026, de 15:00 a 19:00
- Edificio I+D, Campus Río Ebro, Zaragoza

Online (Calendatas por determinar)
- Si quiers apuntar-te pa colaborar online, fe-lo aquí!

Apuntar-me pa l'online!

Cuantos mas siamos, millor!

Contacta con nusatros si precisas más información!

Contacto

Organizadors:

Sistemas de Información Distribuida (SID)

Con a colaboración especial de

Page updated

Google Sites

Report abuse