IMT 3120: Fundamentos Matemáticos de Ciencia de Datos

Esta es la página oficial del curso IMT3120, segundo semestre de 2022, ofrecido por el Instituto de Ingeniería Matemática y Computacional de la Pontificia Universidad Católica de Chile

Equipo Docente

  • Profesor: Cristóbal Guzmán (crguzmanp@mat.uc.cl)

  • Ayudante: Benjamín Rubio (berubio@uc.cl)

Horario

  • Cátedras: Martes y Jueves, 14:00-15:20 (K301)

  • Ayudantías: Viernes, 14:00-15:20 (BC21)

  • Trabajo Personal: aprox. 6 horas semanales

Noticias

  • Cambio de Sala: Auditorio San Agustín, desde el martes 23 de agosto, todos los martes y jueves en el módulo 4 (14:00 a 15:20hrs) hasta el 24 de noviembre inclusive. El Martes 8 de Noviembre la cátedra será en la sala AE201

  • Se suspende la cátedra del 15 de Septiembre

  • Grupo de lectura de Optimización en Variedades durante el segundo semestre de 2022. Interesados pueden contactar al profesor. Nota: Esta actividad no es parte del curso. Sólo se recomienda para estudiantes interesados

Objetivos del Curso

  • Familiarizarse con la noción de aprendizaje estadístico

  • Analizar algoritmos de aprendizaje en el contexto PAC (probablemente, aproximadamente correcto)

  • Estudiar modelos y aplicaciones de la teoría de aprendizaje

  • Implementar algoritmos de aprendizaje de forma rigurosa, teniendo en cuenta las distintas etapas de aprendizaje (entrenamiento, validación y testeo) y las técnicas para prevenir sobreajuste

Contenidos

  1. Desigualdades de Concentración: 3 clases

  2. Aprendizaje PAC (probablemente, aproximadamente correcto): 3 clases

  3. Complejidad de Rademacher y Dimensión VC (Vapnik-Chervonenkis): 3 clases

  4. SVM (Support Vector Machines): 3 clases

  5. Kernels: 3 clases

  6. Aprendizaje Convexo y Convergencia Uniforme: 3 clases

  7. Aprendizaje en línea: 4 clases

  8. Estabilidad Algorítmica: 3 clases

  9. Reducción de dimensionalidad y problemas de reconstrucción: 5 clases

Información Práctica

  • Reglamento del curso

  • Fechas Interrogaciones: Martes 27 de Septiembre, Viernes 18 de Noviembre

  • Fecha Examen: Lunes 12 de Diciembre

Material del Curso

Lecturas Complementarias

Evaluaciones

  • 3 Tareas (30%)

  • 2 Interrogaciones (40%)

  • Examen (30%)

Material Adicional

Para facilitar el estudio y revisar evaluaciones anteriores, se recomienda revisar la versión anterior de este curso

Información de Interés

Referencias

Este curso se basa principalmente en los siguientes libros:

Otros cursos de teoría de aprendizaje

Principales conferencias y journals del Área

Preguntas frecuentes

  • Se suficiente sobre probabilidades y estadística como para tomar el curso?

Si bien el curso es demandante en las herramientas de probabilidades y estadística, los pre-requisitos son mínimos: entender la definición de probabilidad, esperanza, probabilidad condicional e independencia; y ser capaz de calcular estas cantidades para varias familias de distribuciones. Si necesita repasar estas materias, se recomienda leer los primeros 3 capítulos de Mitzenmacher & Upfal, o las partes que considere necesarias del libro de Rosenthal.

  • Se suficiente sobre optimización como para tomar el curso?

Nuevamente, la mayoría de los algoritmos que usaremos en el curso serán propiamente presentados y analizados. Sin embargo, tener entendimiento de conjuntos y funciones convexas, así como teoría de dualidad (por ej., Lagrangeana) es necesario. Esto es algo que se puede consultar sin mucha dificultad en libros como Boyd & Vanderberghe (en la Sección I, Teoría)