Módulo 6: Plagio y autoría
Dentro de las TLH, un área de creciente interés y de aplicación en ámbitos tan importantes como la educación es la detección del plagio y la autoría. En este módulo vamos a comprobar cómo se abordan actualmente y los resultados que se están obteniendo.
Detección automática del plagio
En esta lección, primera de dos partes, Paolo Rosso, de la Universitat Politècnica de València, nos introduce en las técnicas disponibles para la detección automática del plagio. Las dos partes comprenden los siguientes puntos:
Algunas definiciones
Plagio o reuso
Detección del plagio
El plagio en la investigación
En esta primera parte, Paolo nos lleva hasta la detección del plagio en sus dos vertientes:
Comparación externa
Análisis intrínseco
Aunque el texto original de las diapositivas está en inglés, el audio y las anotaciones están en español. Así mismo, te invitamos a leer la transcripción ampliada —en la siguiente lección— para apoyar los conceptos expuestos en el vídeo.
En esta segunda y última parte finaliza su introducción a las técnicas disponibles para la detección automática del plagio.
Aquí continuaremos viendo cuáles son las dificultades a las que ha de enfrentarse cualquier solución al problema como la paráfrasis o los cruces entre idiomas. Más tarde, veremos algunas competiciones de investigadores relativas al plagio, para terminar con un caso concreto y curioso, un estudio sobre la reutilización de texto en las publicaciones en congresos y revistas científicas.
Puedes consultar la transcripción completa de esta serie de vídeos aquí (también en pdf).
Cuestionario
La criptomnesia es
plagio puro y duro
un recuerdo que, inconscientemente, puede producir una obra muy parecida a la que originó el recuerdo
un tipo de solución del reconocimiento automático del plagio que se basa en la captura de emociones en la obra a analizar
El plagio con paráfrasis, comparado con el verbatim
es más difícil
es más fácil
es igual de fácil de detectar
Author profiling
Paolo Rosso, de la Universidad Politécnica de Valencia, continúa ilustrándonos en este caso sobre la autoría. Concretamente en el "perfil" del autor: rangos de edad, sexo, lenguaje nativo y detalles por el estilo, pero también inferir datos sobre su personalidad, por ejemplo. Desde un punto de vista comercial, la categorización de los autores por perfiles es otra forma de segmentar la pobración de posibles clientes y detectar cuáles son objetivo y cuáles no.
Continuamos con la exposición por parte de Paolo acerca del author profiling.
Finalizamos la descripción de la tarea author profiling como muestra de una más de las aplicaciones tratadas por las TLH. Puedes consultar la transcripción completa de esta serie de vídeos aquí (también en pdf).
Cuestionario
Estas preguntas admiten más de una respuesta correcta, incluso todas las opciones podrían ser correctas.
La clasificación en perfiles de autoría tiene interés para
la mercadotecnia ya que permite establecer si el autor de una determinada opinión es joven o adulto, hombre o mujer, etc.
la lingüística forense ya que permite extraer datos que pueden permitir deducir la autoría de un determiando texto
la recuperación de información georreferenciada ya que permite saber si el autor está más o menos lejos de nuestra posición
El estilo cambia con los años y los temas de interés también
si hablas de deberes, probablemente estarás en la infancia
si hablas de fiesta, de cerveza o de alquiler de piso probablemente es que no llegas ni a los 30
si hablas de hipoteca, de impuestos, de guarderías o de pensiones, probablemente ya has dejado atrás los 30
El idioma es determinante en algunos aspectos del author profiling
el español tiene ventaja frente al inglés en cuanto a la detección del sexo del autor
el inglés tiene ventaja frente al español en cuanto a la detección de la edad del autor
la tarea es independiente del idioma de los textos a tratar