Cronograma

Clase 2 - 26 de agosto

Requisitos: tener instalado Bash y Python 2.7

Materiales

Clase 3 - 2 de setiembre

Requisitos: tener instalado Bash y Python 2.7

Clase 4 - 9 de septiembre

Requisitos: tener instalado R y RStudio. Paquetes de R: quanteda, readtext, tidyverse, tidytext, wordspace.

  • Corpus

Clase 5 - 23 de septiembre

Requisitos: tener instalado Python 2.7 y NLTK

  • POS Tagging
  • Lematización con POS Tagging

Clase 6 - 30 de septiembre

Requisitos: tener instalado Python 2.7 y NLTK

  • Parsing: Tipos de Parsers (por Reglas vs Probabilísticos) - Shallow y Full Parsing - Tipos de Representaciones (Dependencias - Constituyentes - Categorial) - Implementaciones (panorama)

Clase 7 - 7 de octubre

Requisitos: tener instalado R y RStudio. Paquete: STM

  • Tópicos - LDA

Clase 8 - 14 de octubre

Requisitos: tener instalado OpenNLP

  • Clasificadores - Sentiment - Tópicos
  • DocCat de OpenNLP