Programa: Licenciatura en computación, Facultad de Ingeniería, UNAM
Objetivo: El alumno conocerá los métodos, problemas y aplicaciones del Procesamiento del Lenguaje Natural basado en el procesamiento de corpus textuales y será capaz de imaginar soluciones a problemas concretos en este campo.
Introducción al curso
Definición del concepto de corpus
Antecedentes
¿Qué son los corpus?
Corpus lingüísticos informatizados
Lingüística de corpus
Características de un corpus
Tipología y compilación de corpus
Tipología
Identificación del objetivo
Extracción de textos
Corpus orales
Teoría de la información y representación de datos
Definición de información
Entropía
Modelo del canal ruidos
Ley de Zipf
Modelos del lenguaje
Lenguajes de anotación
Anotación de corpus
Extándares
Lenguajes de anotación
XML
Esquemas de anotación
Anotación fonética
Fonética y fonología
Rasgos fonéticos
Anotación de datos orales
Anotación de datos textuales
Anotación morfológica
Morfología
Métodos de detección morfológica
Lematización y stemming
Ultra-stemming
Anotación morfosintáctica
Categorías gramaticales
Etiquetado gramatical
Algoritmos basados en reglas
Modelos Ocultos de Markov
Herramientas para POST
Anotación Sintáctica
Sintaxis
Gramáticas libres de conte4xto
Gramáticas libres de contexto probabilísticas
Chunking
Parsing
Anotación semántica
Semántica
Terminología y terminótca
TF-IDF
Relaciones léxicas
Ontologías
Análisis de corpus
Conteo de palabras
Concordancias
Colocaciones
Medidas de asociación
Análisis cuantitativo
Herramientas disponibles