Módulo 4: Resumen y simplificación automáticos
En este módulo seguimos presentado aplicaciones de las TLH, concretamente la simplificación y resumen de textos. Si bien el segundo trata de automatizar lo que todos entendemos por un resumen, la simplificación busca sustituir el texto original por formas más sencillas de leer y entender, con el objetivo de facilitar la tarea a personas con dificultades de comprensión.
Generación de resúmenes (1)
En esta lección Elena Lloret te va a presentar una de las tareas de las TLH que más interés está suscitando en la actualidad. Y la razón es evidente, la intuición nos dice que hay multitud de aplicaciones en nuestro día a día en las que, si pudiéramos leer un buen resumen, podríamos decidir si continuar leyendo; o si necesitamos hacernos una idea a partir de un gran volumen de textos sobre un tema.
Aquí puedes consultar la transcripción del vídeo (también en pdf).
Cuestionario
Selecciona las fuentes de información que escogerías para realizar un resumen multigénero (admite más de una respuesta correcta, incluso todas las opciones podrían ser correctas).
noticias periodísticas
blogs
micro-blogs
reseñas
Generación de resúmenes (y 2)
Laura Plaza, de la UNED, continúa desarrollando los conceptos introducidos por Elena Lloret en la unidad anterior.
Aquí puedes consultar la transcripción del vídeo (también en pdf).
Herramientas y recursos
Visita la página de las conferencias TAC (Text Analysis Conference). ¿Qué es TAC? ¿Para qué sirve? ¿Quién lo organiza? ¿Quiénes han participado? Por el tema en el que estamos de las tareas propuestas, investiga un poco como ha evolucionado la tareasummarization.
SUMMA (se trata de un toolkit descargable para desarrolladores; sin embargo, puede ser interesante navegar por la web y ver los recursos y demos que ofrecen)
Mead (esto es un fuente en Pearl descargable; solo recomendable si estás familiarizado con entornos de programación de ordenadores)
Cuestionario
Algunos de los aspectos importantes a la hora de diseñar un sistema automático de resúmenes de texto son (admite más de una respuesta correcta, incluso todas las opciones podrían ser correctas).
que el resumen tenga una longitud, medida en cantidad de caracteres, sensiblemente inferior al texto original
determinar qué información es importante y cuál irrelevante
que tenga formato de respuesta a preguntas del tipo "¿qué es x?"
Simplificación automática de textos
Horacio Saggion, de la Universitat Pompeu Fabra de Barcelona nos explica en qué consiste la tarea de simplificación de textos. No se debe confundir con el "resumen automático" aunque tiene algunos puntos de contacto. La simplificación trata de facilitar la lectura especialmente para ciertos colectivos con algunas dificultades a la hora de comprender lo que están leyendo. Es otro ejemplo de una aplicación de las TLH para facilitar el acceso cotidiano a las fuentes textuales de información disponibles.
Aquí puedes consultar la transcripción del vídeo (también en pdf).
Actividades
Una breve lista de recursos disponibles en internet para la simplificación de textos, por si te apetece explorarlos:
Los siguientes sitios Web publican textos “simples”, tradúcelos al español usando Google Translate para verificarlo
http://www.dueparole.it/sommario_.asp (italiano)
http://www.8sidor.se/ (sueco)
http://www.klartale.no/ (noruego)
Cuestionario
La simplificación de textos consiste en
resumir
analizar sintácticamente
facilitar la lectura