Cronograma
Clase 2 - 26 de agosto
Requisitos: tener instalado Bash y Python 2.7
Materiales
Clase 3 - 2 de setiembre
Requisitos: tener instalado Bash y Python 2.7
Clase 4 - 9 de septiembre
Requisitos: tener instalado R y RStudio. Paquetes de R: quanteda, readtext, tidyverse, tidytext, wordspace.
- Corpus
Clase 5 - 23 de septiembre
Requisitos: tener instalado Python 2.7 y NLTK
- POS Tagging
- Lematización con POS Tagging
Clase 6 - 30 de septiembre
Requisitos: tener instalado Python 2.7 y NLTK
- Parsing: Tipos de Parsers (por Reglas vs Probabilísticos) - Shallow y Full Parsing - Tipos de Representaciones (Dependencias - Constituyentes - Categorial) - Implementaciones (panorama)
Clase 7 - 7 de octubre
Requisitos: tener instalado R y RStudio. Paquete: STM
- Tópicos - LDA
Clase 8 - 14 de octubre
Requisitos: tener instalado OpenNLP
- Clasificadores - Sentiment - Tópicos
- DocCat de OpenNLP