Segundo cuatrimestre 2019
Lunes, Miércoles y/o Viernes de 9 a 11
Aula 13
FaMAF - UNC
Docentes: Cristian Cardellino y Laura Alonso i Alemany
Para comunicación, háganse una cuenta en el slack de FaMAF: https://famaf-unc.slack.com . Pueden usar cualquier cuenta @unc.edu.ar o @famaf.unc.edu.ar.
github de la materia: https://github.com/PLN-FaMAF/text-mining-2019/
presentaciones de los proyectos finales de la materia
En este curso vamos a ver técnicas de Minería de Datos aplicadas a problemas de Procesamiento del Lenguaje Natural. No es necesario tener conocimientos previos ni de Minería de Datos, ni de Procesamiento del Lenguaje Natural, ya que vamos a introducir ambas áreas.
El objetivo del curso es ofrecer una perspectiva de los retos, dificultades y soluciones que se encuentran en este área. Se darán los fundamentos teóricos necesarios para entender y dimensionar esos retos. Se realizarán algunos trabajos prácticos que ayuden a dimensionar la complejidad de las soluciones.
Presentaremos fundamentos de aprendizaje automático, un poco de supervisado pero más de no supervisado y especialmente de semi-supervisado.
Vamos a trabajar principalmente con artículos científicos publicados en conferencias del área, no con libros de texto, aunque vamos a recurrir a las referencias cuando hablemos de las técnicas.
El tema especial de este año será el procesamiento de texto legal. Esto significa que voy a tratar de que los datasets y las tareas sean específicas del dominio legal. También voy a proponer proyectos finales de la materia principalmente sobre este tema, aunque todos sabemos que acepto proyectos en temas muy diversos.
La evaluación de la materia consiste en:
20% un examen teórico al final del curso
20% un práctico chico sobre clustering
20% otro práctico chico sobre feature selection
50% un proyecto grande