C. Manning and H. Schütze (1999) Foundations of Statistical Natural Language Processing MIT Press.
Jurafsky & Martin 2019 Speech and Language Processing.
curso de PLN con Deep Learning de Chris Manning
curso de Machine Learning de Andrew Ng
Language Resources and Evaluation
Journal of Machine Learning Research
ACL (Association for Computational Linguistics)
EMNLP (Empirical Methods for Natural Language Processing)
NAACL (North American Chapter of the Association for Computational Linguistics)
EACL (European Chapter of the Association for Computational Linguistics)
COLING (Conference on Computational Linguistics)
y papers seleccionados en:
y algunas más locales:
Fundamentos de Lingüística
referencia: capítulo 3 de Manning y Schütze 1999
para ampliar:
Emily Bender. 2013. Linguistic Fundamentals for Natural Language Processing. 100 Essentials from Morphology and Syntax. Morgan Claypool. (https://doi.org/10.2200/S00493ED1V01Y201303HLT020)
Fundamentos de Aprendizaje Automático
referencia: capítulos 1 y 2 de Machine Learning, de Tom Mitchell.
filminas: Introducción a Machine Learning de Alex Smola.
para ampliar:
Adquisición Léxica
referencia: capítulo 5 de Foundations of Statistical Natural Language Processing de Manning y Schütze
filminas: Collocations de Rada Mihalcea y Lexical Acquisition de Nathalie Japkowicz
para ampliar:
Semejanza entre palabras
referencia: capítulos 15, 16 y 17 de Speech and Language Processing (3a edición) de Jurafsky y Martin
filminas: Las filminas correspondientes a ese capítulo, Vector Semantics, del mismo libro, pero antes veremos un poquito sobre semejanza entre palabras SIN espacio vectorial. También usaremos algunas filminas sobre cómo se construye la representación de palabras en un espacio vectorial de Gemma Boleda y Marco Baroni para el curso de NLP de Ray Mooney.
Más adelante vamos profundizar sobre el espacio vectorial con Cristian Cardellino. Usaremos estas notebooks, por si quieren empezar a jugar: notebook sobre Vector Space Models, notebook sobre reducción de dimensionalidad y notebook sobre retrofitting.
Feature selection y embeddings
filminas: Filminas sobre embeddings que usamos en la Diplomatura en Ciencia de Datos
referencia: An Introduction to Variable and Feature Selection. Isabelle Guyon and André Elisseeff. Journal of Machine Learning Research 3 (2003) 1157-1182
Clases de equivalencia entre palabras, clustering
referencia: capítulos sobre flat y hierarchical clustering del libro Information Retrieval de Chris Manning, Prabhakar Raghavan y Hinrich Schütze
filminas: flat clustering y hierarchical clustering asociadas al libro
presentamos el práctico de clustering! a entregar el día 18 de septiembre la primera parte
seminario sobre modelos de lenguaje a cargo de Damián Furman y Mariano Schmidt
10 hs - Sala Smith o Aula 13
Profundizando sobre el espacio vectorial
con Cristian Cardellino!
referencia: materiales del curso de Natural Language Understanding de Bill McCartney y Chris Potts,
filminas: filminas sobre representaciones distribuídas de palabras
código: notebook sobre Vector Space Models
Reducción de dimensionalidad en el espacio vectorial
con Cristian Cardellino!
referencia: materiales del curso de Natural Language Understanding de Bill McCartney y Chris Potts,
filminas: filminas sobre representaciones distribuídas de palabras
código: notebook sobre reducción de dimensionalidad
Reglas de asociación
referencia: el capítulo n. 2 del libro Web Data Mining de Bing Liu y también pueden revisar el artículo de la wikipedia
filminas: las filminas sobre reglas de asociación del curso Data Mining and Text Mining de Bing Liu
Desambiguación y Discriminación de Sentidos
referencia: el clásico paper de Hinrich Schütze Automatic Word Sense Discrimination, volveremos al de Pantel y Lin Discovering Word Senses from Text y haremos un vista de águila sobre el método basado en grafos de Jean Véronis, HyperLex: lexical cartography for information retrieval
filminas: no, pero daremos un bonito paseo por las diferentes ediciones de SenSeval y SemEval
Discovering Word Senses from Text de Pantel y Lin en el KDD 2002.
Primera discusión del práctico de clustering
Revisión de las últimas tendencias y planificación del resto de la materia
Les propongo estos papers, pero la idea es que cada uno haga una búsqueda de artículos de ACL 2019 y EMNLP 2019, lean (superficialmente) uno cada uno, lo presenten en clase y discutamos estas tendencias.
Sentiment Analysis
incluyendo un repaso a los challenges de SemEval
Aprendizaje Semi-Supervisado
sin clase por no-laborable
Traducción Automática (statistical, neural, attention)
Sin clase por enfermedad
Evaluación de traducción automática con la discusión de los resultados del WMT19 Metrics Shared Task
Feria de proyectos
Minado de Argumentos
Procesamiento de Diálogo
Presentación de papers sobre procesamiento de diálogo
Multimodal y grounding, viendo cosas de image captioning, visual question answering y terminando con Illustrative Language Understanding: Large-Scale Visual Grounding with Image Search, de Kiros, Chan y Hinton en ACL 2019
Deep Learning (con Cristian Cardellino)
Discusión del práctico de clustering
Deep Learning (con Cristian Cardellino)
Deep Learning (con Cristian Cardellino)
Sesgo, métricas de evaluación
sin clase!
Ontologías (incluyendo Description Logics)
usando ontologías para desambiguación de sentidos, traducción, respuesta a preguntas
Población y enriquecimiento de ontologías
Information Extraction y población de ontologías
Names and Similarities on the Web: Fact Extraction in the Fast Lane, Marius Pasca, Dekang Lin, Jeffrey Bigham, Andrei Lifchits and Alpa Jain, ACL 2006
Textual Entailment and Inference
Textual Entailment Portal de la ACL, con directorio de recursos, incluyendo:
tutorías para proyectos y presentaciones