El dataset se encuentra en el siguiente repositorio
https://github.com/DamiFur/brat-annotations-argumentation-schemes
El dataset del desafío consiste en contranarrativas y anotaciones argumentativas creadas sobre el dataset de discurso de odio HatEval, y se puede encontrar en este repositorio público. Contiene dos tipos de información adicional a la de HatEval: diferentes contranarrativas que contestan a un tweet de odio, distinguidas por subtipos, y análisis de componentes argumentativos.
Nos hemos centrado únicamente en los tweets argumentativos de HatEval, descartando los que consisten en lenguaje abusivo y los que atacan individuos particulares. Por esta razón, nos centramos en los tweets de discurso de odio contra inmigración, ya que los tweets contra mujeres son mayoritariamente abusivos y dirigidos contra individuos. El dataset resultante consiste de 970 tweets en inglés y 196 en español, con una importante proporción de tweets argumentativos.
Distinguimos diferentes componentes en tweets de odio argumentativos:
Colectivo: grupo contra el que se dirige el odio
Propiedad: característica que se asocia al colectivo
Conclusión: la parte del mensaje que expresa el posicionamiento del autor con respecto al tema (en este caso, inmigración). Podemos distinguir tres tipos de conclusión: hecho (si el autor presenta la información como un hecho objetivo), valor (si el autor explicita un juicio de valor) o política (si el autor hace un llamado a la acción o una exhortación).
Justificación: la parte del mensaje que provee datos, ampliaciones, aclaraciones u otros argumentos para apoyar la conclusión. También podemos distinguir tres tipos de justificación: hecho, valor y política.
Pivot: palabras en las que se explicita la relación entre justificación y conclusión.
Ejemplo:
"Vendieron una servicentro shell y echaron a todos los chilenos porque el nuevo dueño solo contrata inmigrantes. Tenemos mas del 7 % de desempleo y solo quieren inmigrantes.Apoyas a los inmigrantes hasta que te quitan el empleo, la polola, la casa o la vida. Defiende a tu gente"
Justificación: "Vendieron una servicentro shell y echaron a todos los chilenos porque el nuevo dueño solo contrata inmigrantes. Tenemos mas del 7 % de desempleo y solo quieren inmigrantes."
Conclusión: "Apoyas a los inmigrantes hasta que te quitan el empleo, la polola, la casa o la vida. Defiende a tu gente."
Colectivo: "inmigrantes"
Propiedad: "te quitan el empleo, la polola, la casa o la vida"
Pivot: "inmigrantes"
Podemos distinguir diferentes tipos de contranarrativas, según la estrategia utilizada para construirla y según los componentes anotados que utilicen.
Ejemplo:
"Vendieron una servicentro shell y echaron a todos los chilenos porque el nuevo dueño solo contrata inmigrantes. Tenemos mas del 7 % de desempleo y solo quieren inmigrantes.Apoyas a los inmigrantes hasta que te quitan el empleo, la polola, la casa o la vida. Defiende a tu gente"
Los cuatro tipos de contranarrativas que se pueden construir a partir del ejemplo son:
A: Negar la relación entre la justificación y la conclusión:
No es incompatible apoyar a los inmigrantes y a tu gente. Nadie tiene que perder, nos puede ir bien a todos.
B: Negar la relación entre el colectivo y las propiedades asociadas al mismo
Cada empleo es de quien es contratado. No puedes culpar a quien acepta un empleo de "robarlo". Y lo mismo con "la polola".
C: Atacar la justificación de la conclusión
No creo que eso este pasando realmente, suena exagerado.
D: Contra-narrativa libre:
Mi gente son los trabajadores honestos sean del país que sean. Quienes no son mi gente son los xenófobos y racistas como tú.
Para más detalle, pueden consultar el manual de anotación (en inglés).
Acá podemos ver un ejemplo más, antes de que vayan a ver el corpus directamente:
"No sé dónde vives pero la delincuencia que he visto yo cuando he ido de vacaciones a Madrid y a Barcelona es absoluta vale y estos señores al no tener papeles se ven totalmente Internet de lo que les pueda pasar sin miedo total a la ley"
Justificación: No sé dónde vives pero la delincuencia que he visto yo cuando he ido de vacaciones a Madrid y a Barcelona es absoluta
Conclusión: vale y estos señores al no tener papeles se ven totalmente Internet de lo que les pueda pasar sin miedo total a la ley
Colectivo: estos señores al no tener papeles
Propiedad: delincuencia
Contranarrativas:
A: Negar la relación entre la justificación y la conclusión:
No necesitas tener papeles para ser detenido o ir preso. No tiene sentido que alguien "no le tema a la ley" solo por no tener papeles. Eso no te hace inmune
B: Negar la relación entre el colectivo y las propiedades asociadas al mismo
Si los criminales estuvieran identificados, el problema seguramente estaría resuelto. Que creas saber quienes son solo deja en evidencia que estas siendo prejuicioso.
C: Atacar la justificación de la conclusión
Que digas haber ido de vacaciones a Madrid no significa nada. Estás hablando de un lugar que no conoces.