Text Mining
2021
Segundo cuatrimestre 2021
Lunes y Miércoles de 9 a 11
Para comunicación usaremos el canal text mining del Zulip de FaMAF.
La cursada será no presencial pero sincrónica, pídanme dirección de la sala por mail!
En este curso vamos a ver técnicas de Minería de Datos aplicadas a problemas de Procesamiento del Lenguaje Natural. No es necesario tener conocimientos previos ni de Aprendizaje Automático, ni de Minería de Datos, ni de Procesamiento del Lenguaje Natural, ya que vamos a introducir ambas áreas.
El objetivo del curso es ofrecer una perspectiva de los retos, dificultades y soluciones que se encuentran en este área. Se darán los fundamentos teóricos necesarios para entender y dimensionar esos retos. Se realizarán algunos trabajos prácticos que ayuden a dimensionar la complejidad de las soluciones.
Presentaremos fundamentos de aprendizaje automático, un poco de supervisado pero más de no supervisado y especialmente de semi-supervisado.
Vamos a trabajar principalmente con artículos científicos publicados en conferencias del área, no con libros de texto, aunque vamos a recurrir a las referencias cuando hablemos de las técnicas.
El tema especial de este año será el responsabilidad en inteligencia artificial, discurso de odio y argumentación. Esto significa que voy a tratar de que los problemas de ejemplo, los datasets y las tareas sean sobre estos temas. También voy a proponer proyectos finales de la materia principalmente sobre estos temas, aunque todos sabemos que el mejor proyecto es el que mejor se alinea con sus intereses, y siempre vamos a preferirlo :)
La evaluación de la materia consiste en:
10% un examen teórico oral al final del curso
20% un práctico chico sobre clustering
20% otro práctico chico sobre feature selection
50% un proyecto grande
Si quieren saber más, pueden ver cómo fue la cursada 2019