Módulo 3: aplicaciones de las TLH

Este módulo, y los siguientes, introduce tareas y subtareas del PLN y las TLH que bien tienen un propósito final o bien son un proceso más dentro de otras más ambiciosas. Aquí vamos a presentar la Traducción Automática, la Búsqueda de Respuestas y la Recuperación de Información Geográfica.

Traducción automática

El profesor Mikel L. Forcada, de la Universidad de Alicante, nos muestra los principios de la traducción automática. Son las grandes líneas que definen la tarea que dio inicio a las tecnologías del lenguaje humano, por aquel entonces con una vertiente muy cercana a lo militar. 

El objetivo de la lección es conseguir una noción más exacta de en qué consiste la traducción automática realizada por un computador y llegar a comprender lo difícil que puede llegar a ser el conseguirlo.

Puedes consultar la transcripción del vídeo (también en pdf).

Referencias y material adicional

Aunque los artículos de Wikipedia en español necesitan alguna revisión más o menos profunda, siguen siendo un buen punto de partida por su brevedad y concisión.

Cuestionario

"Juega" con Apertium y con el Traductor de Google. Por ejemplo, si en ambos intentamos traducir la frase "Voy a cambiar la rueda usando el gato", tanto el uno como el otro cometen fallos al traducir al inglés. ¿Cuáles? ¿Por qué crees tú que fallan? ¿Cuál de los fallos intuyes que debe ser más difícil para el traductor automático?

Estas preguntas admiten más de una respuesta correcta, incluso todas las opciones podrían ser correctas.

    Como resultado de traducir en Apertium y en el Traductor de Google la frase "cambiaré la rueda del coche con el gato"

Búsqueda de respuestas

Dentro de la recuperación de información se identifica una rama especializada en responder, normalmente de forma breve, a preguntas concretas. Mientras la recuperación de información en general hace eso, encontrar información que después debemos procesar y filtrar nosotros mismos, muy habitualmente páginas web, la búsqueda de respuestas intenta extraer de ese conjunto de información datos específicos que satisfagan la pregunta concreta que hemos lanzado: ¿dónde está el museo del Louvre? Es por tanto, un grado más de dificultad; o unos cuantos grados más.

Puedes consultar la transcripción del vídeo (también en pdf).

Cuestionario

Vamos a buscar la respuesta a una pregunta sencilla: ¿Cuánto recaudo en total La Guerra de las Galaxias, en euros? De la serie buena, la primera que se rodó pero que ahora es el episodio IV. Todos nos lanzaríamos a Google y preguntaríamos (recaudación total euros "La Guerra de las Galaxias"). Haz la consulta.

¿Serías capaz de darnos la respuesta exacta?

Vamos a buscar la respuesta a una pregunta sencilla: ¿Cuánto recaudo en total La Guerra de las Galaxias, en euros? De la serie buena, la primera que se rodó pero que ahora es el episodio IV. Todos nos lanzaríamos a Google y preguntaríamos (recaudación total euros "La Guerra de las Galaxias"). Haz la consulta. ¿Serías capaz de darnos la respuesta exacta?

Ahora vamos a probar otra cosa.

¿Cuál es la recaudación total en euros de la película Star Wars (IV Una Nueva Esperanza)? La pregunta en inglés sería "star wars total receipts" porque posiblemente querrás utilizar WolframAlpha (http://www.wolframalpha.com). Cuidado, puede que no te dé directamente la respuesta a la película que queremos, puede que tengas que navegar un poco.

Redondea a la baja y responde solo con la parte entera. Por ejemplo, si la recaudación hubiera sido de 128.6 millones de dólares USA, responde con 100.

La recaudación total de esa película es de más          de millones de dólares US.

Recuperación de información geográfica

José Manuel Perea, que trabaja como investigador para la Comisión Europea en el Joint Research Centre de Ispra en Italia, nos introduce la tarea de recuperación automática de la información geográfica y ya nos avisa de las dificultades de la misma. En sucesivas lecciones, nos irá detallando aspectos más concretos.

Cuestionario

Según lo visto en la sección de conceptos básicos, las consultas geográficas se caracterizan por una tupla de tres componentes. Rellena los huecos en función de esas componentes.

Decide si la siguiente consulta es realmente geográfica (escribe "S") o no (escribe "N") y, en caso de que lo sea, identifica los tres componentes de la tupla. Si alguno de los componentes no tiene valor escribe "-".

"Shark Attacks off Australia and California"

Geográfica:         

Parte temática:         

Parte geográfica:         

Relación espacial:         

Decide si la siguiente consulta es realmente geográfica (escribe "S") o no (escribe "N") y, en caso de que lo sea, identifica los tres componentes de la tupla. Si alguno de los componentes no tiene valor escribe "-".

"Visits of the American president to Germany"

Geográfica:         

Parte temática:         

Parte geográfica:         

Relación espacial:         

Decide si la siguiente consulta es realmente geográfica (escribe "S") o no (escribe "N") y, en caso de que lo sea, identifica los tres componentes de la tupla. Si alguno de los componentes no tiene valor escribe "-".

"Cities near active volcanoes"

Geográfica:         

Parte temática:         

Parte geográfica:         

Relación espacial:         

Cuestionario

El preprocesamiento offline en un sistema GIR (esta pregunta admite más de una respuesta correcta, incluso todas las opciones podrían ser correctas).

Aqui puedes consultar la transcripción de la secuencia de vídeos (también en pdf).

Cuestionario

    Esta pregunta admite más de una respuesta correcta, incluso todas las opciones podrían ser correctas

Busca "Collado Villalba" en Geonames (http://www.geonames.org/)