Módulo 1: Analizando el lenguaje
Como una de las actividades básicas de cualquier aplicación de TLH, analizar texto o, incluso, habla a todos sus niveles es fundamental y prácticamente inevitable. En este módulo se van a introducir, precisamente, esos niveles de análisis, mostrando las dificultades de la tarea y las soluciones que se han planteado y se están utilizando actualmente.
Análisis sintáctico
Esta lección, de Carlos Gómez de la Universidade da Coruña, trata de una de esas tareas o módulos indispensables en cualquier aplicación TLH: el análisis sintáctico automático. Fase posterior al morfológico en cualquier análisis lingüístico ofrece información de vital importancia sobre la estructura de la oración.
Aquí tienes la transcripción del vídeo, (también en pdf).
Actividad
Te proponemos hacer diferentes experimentos con el analizador sintáctico online de Stanford. Esta actividad no se evalúa, simplemente pensamos que puede ser interesante que accedas a la herramienta que te vamos a enlazar.
El analizador sintáctico de Stanford (http://nlp.stanford.edu:8080/parser/) es uno de los analizadores más utilizados para lengua inglesa, con soporte tanto para constituyentes como para dependencias. Esta versión online que nos permite introducir oraciones y ver su análisis sintáctico. Si bien no lo muestra gráficamente, muestra una representación que contiene toda la información del análisis:
En el análisis de constituyentes, S ( B C ( D E ) ) significaría que la oración se divide en dos constituyentes B y C, y que C se divide en dos constituyentes D y E.
En el análisis de dependencias, la línea dobj(eating-5, sausage-6) quiere decir que hay una dependencia de tipo dobj (objeto directo) que va de la palabra "eating" (que es la quinta palabra de la oración) a la palabra "sausage" (que es la sexta).
Te proponemos:
Prueba unas cuantas oraciones sencillas en inglés (también puedes animarte con árabe o chino, si conoces esos idiomas) para familiarizarte con la salida del analizador. ¿Puedes entender los análisis que produce?
¿Qué sucede si le das al analizador alguna palabra que no exista en inglés? (por ejemplo, en lugar de "My dog also likes eating sausage", puedes probar "My dog also likes eating jamón ibérico").
¿Crees que es razonable cómo se comporta el analizador en este caso? (nota: se dice que un analizador es robusto si es capaz de dar una salida útil para cualquier entrada, incluso las que no se ajustan exactamente a la gramática que conoce).
¿Qué sucede si tecleamos una oración ambigua, como "John saw a man with a telescope"?
Semántica y pragmática
Maria Antònia Martí nos va hablar de semántica y pragmática como niveles de análisis del lenguaje. Esta lección la ha realizado conjuntamente con Mariona Taulé y ambas son doctoras de la Universitat de Barcelona.
Dentro de los niveles de análisis del lenguaje podemos considerar el análisis semántico y el pragmático como los más complejos y necesitados de recursos lingüísticos. Es por ello que la siguiente secuencia de vídeos o lecciones es la más larga del curso. Al final, se ofrecerá un documento de consulta que engloba todas las transcripciones ampliadas de los vídeos de semántica y pragmática —una introducción general—, semántica de la oración —un nivel más allá de análisis semántico— y pragmática —el nivel más complejo—.
Actividad
Te proponemos aclarar un par de términos utilizados en la lección:
El término "semántica" puede llegar a confundir si no se tiene claro el contexto en el que se usa, incluso a veces dentro de la propia comunidad PLN. Léete el artículo de la Wikipedia en español.
Aunque no es un tema a tratar en estas lecciones, se hace referencia en la introducción a la "semiótica". Profundiza algo más leyéndote igualmente el artículo de la Wikipedia en español, concretamente hasta el punto 3, "La semiología frente a la semiótica".
Semántica y pragmática 2
Maria Antònia Martí continúa mostrándonos las bases de semántica y su análisis computacional. Esta lección, realizada conjuntamente con Mariona Taulé, ambas son doctoras de la Universitat de Barcelona, es la segunda parte de la anterior y nos habla de los fenómenos lingüísticos a tratar relacionados con la semántica.
Cuestionario
(varias respuestas son posibles, incluso todas, en cada pregunta)
1. Saltó la valla como pudo. - Dile que no se vaya. Estas dos palabras resaltadas son
homófonas
homógrafas
2. Era muy tarde cuando llegó. - La era de la piratería. - Llegamos a una enorme era de batir el grano. Estas dos palabras resaltadas son
homófonas
homógrafas
Semántica y pragmática 3: WSD
La polisemia del léxico, de las palabras, es uno de los grandes retos de las TLH. De su análisis se esperan potenciales beneficios para mejorar aplicaciones de uso común como la búsqueda de página en Internet o la traducción automática sin ir más lejos. Sin embargo es una tarea compleja aún sin una solución plenamente satisfactoria.
Maria Antònia Martí nos hablará de la desambiguación semántica automática como complemento a las dos lecciones anteriores. Esta lección, realizada conjuntamente con Mariona Taulé, ambas son doctoras de la Universitat de Barcelona.
Cuestionario
Entra en el Multilingual Central Repository (http://adimen.si.ehu.es/cgi-bin/wei/public/wei.consult.perl) y busca (look up) la palabra "bomba". Debes seleccionar "nombre" (nouns), el idioma español (spanish 3.0) y escribir la palabra en minúsculas.
¿Cuántos sentidos diferentes (variants) consigues ver?
Bomba, como nombre, tiene ??? sentidos en WordNet en español.
Semántica de la oración
M. Antònia Martí, junto con Mariona Taulé, continua mostrándonos aspectos centrados todavía en el análisis semántico: la semántica de la oración. Más allá de la palabra y sus posibles sentidos, su inclusión en una oración ofrece más información que puede ser explotada por otras aplicaciones lingüísticas. Aquí nos hablará de las relaciones entre los predicados oracionales y sus papeles temáticos, también conocidos como roles semánticos.
Cuestionario
El cocinero partió el pastel en dos trozos. Elige los roles semánticos adecuados
"El cocinero" es AGENTE y el pastel" es INSTRUMENTO.
"El cocinero" es CAUSA y "el pastel" es PACIENTE.
"El cocinero" es TEMA y "el pastel" es FINALIDAD.
Pragmática
Si hemos estado visitando conceptos relacionados con la semántica de palabras y oraciones, ahora es el momento de ir un poco más allá y verlo como un conjunto, tratar el contexto, el discurso. M. Antònia Martí, junto con Mariona Taulé, nos hablarán del análisis de la pragmática.
Cuestionario
Alguno de estos textos tiene coherencia y es discurso:
El coche tomó la curva a gran velocidad. El sol estaba en el horizonte.
Tomó la curva a gran velocidad. Un coche más camino del Sol.
El coche tomó la curva a gran velocidad. Su conductor fue cegado por el sol.
Pragmática 2
Continuando con la serie de materiales relativos al análisis semántico y pragmático de textos, Maria Antònia Martí continúa la lección anterior centrada en la pragmática. En esta ocasión se centra en el concepto de "cohesión". Esta lección la ha realizado conjuntamente con Mariona Taulé y ambas son doctoras de la Universitat de Barcelona.
Cuestionario
“Es posible que solo lo descubran cuando ya sea tarde, es decir, cuando surja una controversia”; son marcadores del discurso
lo.
es decir.
cuando ya sea tarde.
Cuando contribuyen a la identificación de la estructura discursiva estamos hablando de
marcadores del discurso.
cohesionadores del discurso.
desambiguación del discurso.
Pragmática 3
Para terminar ya con los niveles de análisis semántico y pragmático, Maria Antònia Martí nos hablará de la correferencia en la pragmática. Esta lección la ha realizado conjuntamente con Mariona Taulé y ambas son de la Universitat de Barcelona.
Puedes consultar aquí la transcripción completa de la serie de vídeos sobre semántica y pragmática (también en pdf).
Cuestionario
La correferencia
utiliza los pronombres como marcadores del discurso.
se da entre el sujeto y el verbo de una oración.
contribuye a cohesionar el discurso.