Métodos analíticos para texto
Programa: Maestría en Ciencia de Datos, ITAM.
Objetivos: Comprender los conceptos del análisis de textos y ser capaz de implementar tecnologías para la resolución de los problemas orientados a lenguaje natural.
Horarios: Jueves 6:00 PM a 9:00 PM
AVISO: Reposición: Martes 19 de abril a las 6:00 PM.
Salón RH008
Temario
1. Introducción
1.2. Introducción a la minería de textos
1.3. Datos estructurados y datos no estructurados
1.4. Lenguaje Natural
2. Herramientas lingüísticas
2.1. Corpora
2.2. Niveles lingüísticos
2.4. Morfosintaxis
2.5. Sintaxis
2.6. Semántica
2.8. Leyes empíricas del lenguaje
3. Representación de textos
3.1. Representación en espacios vectoriales
3.2. Modelo de bolsa de palabras
3.4. Word embeddings
3.5. Reducción de dimensionalidad
App1. Proceso de Gram-Schmidt
4. Clasificación y agrupamiento de textos
4.1. Algoritmos de clasificación
4.2. Algoritmos de agrupamiento
App2. Métricas y distancias
5. Recuperación de Información
5.1. Extracción de palabras clave
5.2. Extracción multi-documento y multi-palabra
6. Aplicaciones
Tareas
1. (21/enero/2016) Con relación a las expresiones regulares, realizar un sistema que reciba como entrada una palabra en plural y dé como salida su versión en singular.
2. (28/enero/2016) Instrucciones.
4. (25/febrero/2016). Intrucciones
5. (24/marzo/2016). Insturcciones
Corpus
6. (5/mayo/2016). Instrucciones
Corpus