IMT 3120: Fundamentos Matemáticos de Ciencia de Datos

Esta es la página oficial del curso IMT3120, segundo semestre de 2019, ofrecido por la Escuela de Ingeniería de la Pontificia Universidad Católica de Chile

Equipo Docente

  • Profesor: Cristóbal Guzmán
  • Ayudantes: Germán Cheuque y Patricio Ulloa

Horario

  • Cátedras: Lunes y Viernes, 8:30-9:50
  • Ayudantías: Miércoles, 10:00-11:20
  • Trabajo Personal: aprox. 6 horas semanales

Objetivos del Curso

  • Familiarizarse con la noción de aprendizaje estadístico
  • Analizar algoritmos de aprendizaje en el contexto PAC (probablemente, aproximadamente correcto)
  • Estudiar modelos y aplicaciones de la teoría de aprendizaje
  • Implementar algoritmos de aprendizaje de forma rigurosa, teniendo en cuenta las distintas etapas de aprendizaje (entrenamiento, validación y testeo) y las técnicas para prevenir sobreajuste

Contenidos

  1. Desigualdades de Concentración: 3 clases
  2. Aprendizaje PAC (probablemente, aproximadamente correcto): 3 clases
  3. Complejidad de Rademacher y Dimensión VC (Vapnik-Chervonenkis): 3 clases
  4. SVM (Support Vector Machines): 3 clases
  5. Kernels: 3 clases
  6. Aprendizaje Convexo y Convergencia Uniforme: 3 clases
  7. Aprendizaje en línea: 4 clases
  8. Estabilidad Algorítmica: 3 clases
  9. Reducción de dimensionalidad y problemas de reconstrucción: 5 clases

Información Práctica

Evaluaciones

  • Redacción de apuntes: cada clase un alumno tomará notas en LaTex (10%)
  • 5 Tareas (30%)
  • 2 Interrogaciones (30%)
  • Proyecto final (30%): Los alumnos deberán trabajar por un periodo de un mes, en grupos de 2-3, investigando un problema reciente en teoría aprendizaje. Incluirá una lectura bibliográfica de temas avanzados, y el desarrollo de una solución original a un problema propuesto

Proyectos

Este curso no contará con un Examen como evaluación final. En cambio, los alumnos deberán estudiar, investigar y proponer soluciones a problemas de investigación actuales en teoría de aprendizaje. Se estima que el trabajo que deberán realizar los alumnos durará por al menos 1 mes, donde deberán reunirse regularmente con sus ayudantes y el profesor, para revisar sus avances.

Link para escoger proyectos aquí

Algunos de los proyectos que podrán desarrollar los alumnos son:

Nota: Las referencias escogidas no representan todo el trabajo existente en el área. Se recomienda a los alumnos investigar más referencias sobre cada tema.

Información de Interés

Referencias

Este curso se basa principalmente en los siguientes libros:

Otros cursos de teoría de aprendizaje

Principales conferencias del Área

Preguntas frecuentes

  • Se suficiente sobre probabilidades y estadística como para tomar el curso?

Si bien el curso es demandante en las herramientas de probabilidades y estadística, los pre-requisitos son mínimos: entender la definición de probabilidad, esperanza, probabilidad condicional e independencia; y ser capaz de calcular estas cantidades para varias familias de distribuciones. Si necesita repasar estas materias, se recomienda leer los primeros 3 capítulos de Mitzenmacher & Upfal

  • Se suficiente sobre optimización como para tomar el curso?

Nuevamente, la mayoría de los algoritmos que usaremos en el curso serán propiamente presentados y analizados. Sin embargo, tener entendimiento de conjuntos y funciones convexas, así como teoría de dualidad (por ej., Lagrangeana) es necesario. Esto es algo que se puede consultar sin mucha dificultad en libros como Boyd & Vanderberghe (en la Sección I, Teoría)