Cronograma y materiales

Cronograma de clases

A lo largo de la cursada se utilizó una máquina virtual. Para más información sobre la máquina virtual, consultar aquí.

Clase 1:

  • Algoritmos. Introducción a Python: variables, objetos, operadores, funciones, clases. NLTK (Natural Language Toolkit).

Clase 3:

  • Algoritmos. Introducción a Python: variables, objetos, operadores, funciones, clases. NLTK (Natural Language Toolkit). (Continuación)

Clase 4:

  • Escritura y reconocimiento de expresiones regulares. Preprocesamiento y normalización de textos. Tokenización (separación de oraciones y palabras).

Clase 5:

  • Lematización (reconocimiento de lexemas) y Stemming (reconocimiento de raíces).

Clase 6:

  • POS Tagging.

Clase 8:

  • Parsing (etiquetadores sintácticos). Shallow y full parsing. Dependencias vs. constituyentes. Algoritmos básicos de parsing. NLTK. Parsing probabilístico.

Clase 9:

  • Modelos de bolsa de palabras. Eliminación de stopwords.

Clase 10:

  • Clustering. Clasificación de textos.