2/05/2019
Carlos Gómez-Rodríguez, Daniel Fernández-González, David Vilares Calvo y Michalina Strzyz asistirán a la 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT 2019) que tendrá lugar en Minneapolis (EEUU) del 2 al 7 de junio de 2019.
En este artículo proponemos un novedoso algoritmo basado en transición que es capaz de analizar sintácticamente una oración de izquierda a derecha simplemente construyendo n arcos, siendo n la longitud de la oración de entrada. Al igual que el analizador propuesto por Ma et al. (2018), usamos las Pointer Networks que, dada una palabra, son capaces de directamente apuntar a una posición de la oración de entrada. Sin embargo, nuestro sistema es más simple que el analizador que ellos proponen (sin necesidad de utilizar una pila) y reduce la longitud de la secuencia de transiciones a la mitad, de 2n-1 acciones a n. Como resultado tenemos un analizador sintáctico de dependencias no proyectivo y cuadrático que es dos veces más rápido que el propuesto por Ma et al. (2018) y obtiene la mejor precisión hasta la fecha en el English PTB (96.04% UAS, 94.43% LAS) entre los sistemas supervisados, además de superar a Ma et al. (2018) en la mayoría de los idiomas donde ha sido probado.
Los modelos basados en etiquetación de secuencias para análisis sintáctico de constituyentes son más rápidos, pero también menos precisos que otros tipos de análizadores. En este trabajo, profundizamos en algunas de sus debilidades actuales: (a) las altas tasas de errores al cerrar constituyentes largos, (b) un vocabulario de salida disperso y (c) la propagación del error debido a las técnicas usadas de decodificación voraz. Para cerrar constituyentes de manera más efectiva, entrenamos un modelo que aprende a cambiar entre distintos esquemas de anotación. Para reducir la dispersión, descomponemos el espacio de salida y usamos aprendizaje multi-tarea para predecir etiquetas parciales. Finalmente, abordamos las limitaciones provenientes de la decodificación voraz a través de funciones de pérdida secundarias en la configuración multi-tarea y con aprendizaje por refuerzo mediante policy gradient. Combinando todas estas técnicas, mejoramos el rendimiento de los modelos de etiquetación de secuencias para el inglés y el chino, y también reducimos su latencia. En los corpus SPMRL (idiomas ricos desde el punto de vista morfológico), se observan incluso mayores mejoras, especialmente en el caso del vasco, hebreo, polaco y sueco.
Este trabajo explora el reto de predecir acciones a partir de descripciones de escenas, con el objetivo de aproximar como técnicas de clasificación de texto pueden usarse para predecir futuras acciones. Como caso de estudio, nuestro trabajo se basa en el mundo literario de Harry Potter, tratando de predecir que hechizo se va a castear a continuación, dado un fragmento de una historia. Los hechizos actúan en el libro como palabras clave que abstraen acciones (por ejemplo, ‘Alohomora’ se usa para abrir una puerta) y representa una respuesta al entorno. Esta idea se usa para construir automáticamente HPAC, un corpus que contiene 82836 muestras con 85 acciones distintas.
Reinterpretamos el análisis sintáctico de dependencias como un problema de etiquetado de secuencias, explorando varias codificaciones de árboles de dependencias en forma de etiquetas. Aunque el análisis de dependencias mediante etiquetado de secuencias se ha intentado en trabajos ya existentes, los resultados han sugerido que la técnica resultaba poco práctica. En cambio, nosotros mostramos que con un modelo convencional basado en BILSTMs es posible obtener analizadores gramaticales rápidos y precisos. Estos analizadores son conceptualmente simples, y no necesitan de algoritmos de análisis tradicionales ni de estructuras auxiliares. Al contrario, los experimentos en el PTB y en una muestra de colecciones de UD demuestran que ofrecen un buen equilibrio entre velocidad y precisión, con resultados competitivos respecto a enfoques más complejos.