Ximena Gutierrez-Vasques



 Recientemente obtuve mi grado de doctorado en el Posgrado de Ciencia e  Ingeniería de la Computación de la UNAM (2018). Mi área de interés es la  lingüística computacional, particularmente los enfoques para tratar a las lenguas  de bajos recursos digitales. Mi trabajo doctoral estuvo relacionado con la  extracción automática de léxico bilingüe para una lengua mexicana de bajos  recursos (español-náhuatl).

I recently obtained my Computational Linguistics PhD degree at UNAM, Mexico (2018). I am particularly interested in the approaches that deal with low-resource languages in order to create language technologies. I worked with automatic bilingual lexical extraction for a low-resource language pair of Mexico (Nahuatl-Spanish).

I am currently the R&D coordinator of "Comunidad Elotl". A community interested in developing language technologies for Mexican languages.

Contact: xim@unam.mx


Education
PhD Computational Linguistics. UNAM, Mexico. 2014-2018
Thesis: Extracción léxica bilingüe automática para lenguas de bajos recursos digitales [Full text]
Supervisors: Dr. Alfonso Medina-Urrea, Dr. Gerardo sierra

Msc Computational Linguistics. Charles University, Czech Republic. Free University of Bolzano, Italy. 2010-2012
Thesis: Quantifying Determiners from the Distributional Semantics View. [Full text]
Supervisors: Dr. Rafaella Bernardi, Dr. Marketa Lopatkova

Licenciatura, Ingeniería en computación. Facultad de Ingeniería, UNAM. México 2010.
Thesis: Sistema de resumen extractivo automático
Supervisor: Dr. Alfonso Medina Urrea      
     

Research interests

NLP/Machine learning, Quantitative linguistics, Low-resource languages, Machine translation, Corpus linguistics
Publications
2018
  • Comparing morphological complexity of Spanish, Otomi and Nahuatl
Ximena Gutierrez-Vasques, Victor Mijangos
Proceedings of the Workshop on Linguistic Complexity and Natural Language Processing, COLING   [paper] [slides]
*Selected as 
“Area Chair Favorites"
  • Challenges of language technologies for the indigenous languages of the Americas
Manuel Mager, Ximena Gutierrez-Vasques, Gerardo Sierra, Ivan Meza-Ruiz 
Proceedings of the 27th International Conference on Computational Linguistics (COLING)  [paper] [slides]
*Selected as 
“Area Chair Favorites"
  • Corpus paralelo español-náhuatl y su uso en las tecnologías del lenguaje humano  (Book chapter)
            Ximena Gutierrez Vasques
             In Galina Russell, Isabel; Peña Pimentel, Miriam; Priani Saisó, Ernesto; Barrón Tovar, José Francisco; Domínguez                    Herbón, David; Álvarez Sánchez,                  Adriana (Coords), Humanidades digitales: lengua, texto, patrimonio y                       datos. México, Bonilla Artigas Editores. 2018
2017
  • Low-resource bilingual lexicon extraction using graph based word embeddings
Ximena Gutierrez Vasques, Víctor Mijangos
Accepted in 
International Journal of Computational Linguistics and Applications (forthcoming) [pre-print version]
  • Exploring bilingual lexicon extraction for Spanish-Nahuatl.
Ximena Gutierrez Vasques
Workshop in Women and Underrepresenting Minorities in Natural Language Processing. ACL 2017 (forthcoming)

2016
  • Axolotl: A web accessible parallel corpus for Spanish-Nahuatl
Ximena Gutierrez-Vasques, Gerardo Sierra and Isaac Hernández
Proceedings of LREC 2016  [paper]

2015
  • Bilingual lexicon extraction for a distant language pair using a small parallel corpus
Ximena Gutierrez-Vasques
NAACL-HLT 2015 Student Research Workshop (SRW). 2015. [paper]

  • Recopilación de un corpus paralelo electrónico para una lengua minoritoria: el caso del nahuatl-español
Ximena Gutiérrez-Vasques, Elena Carolina Vilchis Vargas, Cerbón Ynclán Rocío. "Recopilación de un corpus paralelo electrónico para una lengua minoritoria: el caso del nahuatl-español". 
Primer Congreso Internacional el Patrimonio Cultural y las Nuevas Tecnologías. INAH 2015 [paper]






click tracking
Comments