teaching‎ > ‎

Computerlinguistische Anwendungen 2017

Zeit: Mi 14:00-17:00 (VL), Übung Fr. 14:00-16:00 und Di. 16:00-18:00 (beide Termine CIP-Räume Gobi&Sibirien LU112)
Raum: L155
Start: 26.4.2017

Klausur: 26.7.2017, 14:00, Raum L155
  • Dauer: 90 Minuten
  • Es sind keine Hilfsmittel zugelassen, außer ein selbst von Hand beschriebenes DIN A4 - Blatt (beidseitig).
Ergebnisse der Klausur*
*für Studenten, die der Veröffentlichung unter der Matrikelnummer zugestimmt haben. Emailanfragen anderer Studenten zur Note bleiben unbeantwortet (Sie müssen warten, bis die Note im LSF angezeigt wird oder an das Prüfungsamt Informatik weitergeleitet ist).

Klausureinsicht:
  • Mittwoch, 30.8.2017, 16:00-17:00
  • Raum: Oettingenstr. 67 - C 105


Wiederholungsklausur:

  • Donnerstag, 21.9.2017, 14:00
  • Raum: Oettingenstr. 67 - B U101
  • Anmeldung:
    • Studenten mit Computerlinguistik als Hauptfach:
      Anmeldung über LSF. Beachten Sie die Anmeldefrist dort.
    • Studenten mit Computerlinguistik als Nebenfach (und Hauptfach mit LSF zur Notenverwaltung):
      Anmeldung über LSF. Beachten Sie die Anmeldefrist dort.
    • NUR Studenten mit Informatik als Haupfach und Computerlinguistik als Nebenfach:
      Verwenden Sie das Webformular. Anmeldefrist für Studenten mit Hauptfach Informatik: 19.9.2017



Sie erreichen den Dozent und die Tutoren per Email: cla2017 [at] cis [dot] uni [minus] muenchen [dot] de

In dieser Veranstaltung wird das Programmieren computerlinguistischer Verfahren in Python vertieft.

Hinweis: Für die Übungen benötigen Sie einen Gitlab-Account des Ifi (Info).

Falls Sie noch kein Team haben, können Sie den Code des ersten Übungsblatt hier einsehen: ex01_text_search.tgz
Verwenden Sie aber zur Bearbeitung und Abgabe auf jeden Fall das Gitlab Repository.

 Datum Themen Folien Materialien
 26.4.  --
 Course intro (pdf)
 
 28.4. Homework 1
  (pdf) Typo in ex4 korrigiert (5.5.)
 enron.tgz
 3.5. Representing Documents
 Text Search
 Unit Tests
 Wiederholung: Tf.idf (pdf)
 Documents and Search (pdf)
 Unit Tests (pdf)
 Literatur: Manning 6.2 u. 6.3 (pdf)
 10.5. Klassifikation
 Naive Bayes
 Wiederholung: Klassifikation (pdf)
 Naive Bayes (pdf)
 Literatur: Jurafsky&Martin (pdf)
 12.5. Homework 2
  (pdf) Abgabe: 24.5. 14:00
 17.5. Sentiment-Klassifikation; Perzeptron
 (pdf) Literatur: Daume (pdf)
 19.5. Homework 3
  (pdf)
 23.5. Paraphrasenerkennung; Numpy; Scikit-Learn
 Paraphrases, Scikit (pdf)
 Numpy (pdf)
 
 26.5. Homework 4
 Achtung: Versehentlich wurde eine falsche Version in die Repos geladen.
Für Aufg. 1.4 benötigen Sie die aktuelle Version von
paraphrases.py
 (pdf) paraphrases.tgz

 31.5. Word representations 1
 MaxEnt Classifier
 (pdf)
 (pdf)
 
 2.6. Homework 5
  (pdf)
 7.6. Word representations 2
 Support Vector Machines
 (pdf)
 (pdf)
 
 Effect of C-parameter (link)
 9.6. Homework 6
  (pdf)
 14.6.
 Wortähnlichkeit: Implementierung (pdf) 
 16.6. Homework 7
Sie können die Similarity bei Sparse-Matrizen mit einem zusätzlichen Unit-test überprüfen:
test_word_similarity.py
 (pdf)
 21.6. Word Embeddings;
 Implementierung: Skipgram (word2vec)
 (pdf)
 (pdf)
 Word2Vec: Levy/Goldberg (paper)
 Gradient Descent: Andrew Ng (coursera)
 23.6. Homework 8
 Die Rückgabewerte von positive_and_negative_cooccurrences sollen vom Typ (int,int,boolean) sein, nicht (string,string,boolean)
 (pdf)
 28.6. Wortvektoren:
 - Fasttext, SGD, Visualisierung
 - Anwendung
 
 (pdf)
 (pdf)
 
 30.6. Homework 9
  (pdf)
 entities_types.tgz
 5.7. Neural Networks: CNNs
 Neural Networks: RNNs, Keras
 (pdf)
 (siehe 12.7.)
 Weitere Materialien zu CNNs:
  - Folien von Eduard Saller: (pptx)
  - Blog von Chris Olah: (link)
 Kein Tutorat
am 7.7.
und 11.7.

   
 12.7. Homework 10
 Recurrent Neural Networks, Keras
 Probeklausur
(Typo in Aufg. 7 korrigiert (13.7.))
 (pdf)
 (pdf)
 (pdf) Wichtig: bearbeiten Sie alle Aufgaben der Probeklausur - anstelle einer Musterlösung wird es am 19.7. eine Besprechung Ihrer Fragen geben.
 
-----
 Weitere Materialien zu RNNs:
  - Blog von Chris Olah (RNN/LSTM): (link)


Für die Bewertung der Übungsaufgaben verwendete Unit-Tests:

Themen:
  • Unit-Tests und Test-driven-development
  • Einführung in Machine-Learning und Implementierung einfacher Klassifikatoren
    • Naive Bayes
    • Perceptron
  • Einführung in die Machine-Learning Bibliothek Scikit-Learn
  • Implementierung typischer NLP-Anwendungen wie z.B.
    • Spam-detection
    • Sentiment-Analyse
    • Paraphrasen-Erkennung
  • Distributionelle Wortvektoren
  • Grundlagen von Neuronalen Netzwerken für die Sprachverarbeitung, die Bibliothek Keras
Subpages (1): Klausurergebnisse
Ċ
Benjamin Roth,
Apr 26, 2017, 2:41 AM
Ċ
Benjamin Roth,
Jul 10, 2017, 2:55 AM
Ċ
Benjamin Roth,
Apr 26, 2017, 4:19 AM
Ċ
Benjamin Roth,
Jun 8, 2017, 7:18 AM
Ċ
cnn.pdf
(950k)
Benjamin Roth,
Jul 6, 2017, 6:53 AM
ć
cnn.pptx
(2034k)
Benjamin Roth,
Jul 14, 2017, 12:53 AM
Ċ
Benjamin Roth,
Jun 2, 2017, 12:46 AM
ċ
ex01_text_search.tgz
(1k)
Benjamin Roth,
Jun 20, 2017, 7:40 AM
Ċ
Benjamin Roth,
May 5, 2017, 9:12 AM
Ċ
Benjamin Roth,
May 16, 2017, 7:54 AM
ċ
ex02_naive_bayes.tgz
(2k)
Benjamin Roth,
Jun 20, 2017, 7:40 AM
Ċ
Benjamin Roth,
May 18, 2017, 2:42 PM
ċ
ex03_perceptron.tgz
(2k)
Benjamin Roth,
Jun 20, 2017, 7:40 AM
Ċ
Benjamin Roth,
May 26, 2017, 10:26 AM
ċ
ex04_paraphrases.tgz
(2k)
Benjamin Roth,
Jun 20, 2017, 7:40 AM
ċ
ex05_cooccurrence.tgz
(1k)
Benjamin Roth,
Jun 20, 2017, 7:40 AM
Ċ
Benjamin Roth,
Jun 2, 2017, 2:59 AM
Ċ
ex06.pdf
(194k)
Benjamin Roth,
Jun 9, 2017, 5:55 AM
ċ
ex06_sklearn_paraphrases.tgz
(2k)
Benjamin Roth,
Jul 12, 2017, 5:02 AM
Ċ
ex07.pdf
(144k)
Benjamin Roth,
Jun 16, 2017, 4:15 AM
ċ
ex07_word_similarity.tgz
(1k)
Benjamin Roth,
Jul 12, 2017, 5:02 AM
Ċ
ex08.pdf
(179k)
Benjamin Roth,
Jun 23, 2017, 4:12 AM
ċ
ex08_skipgram.tgz
(2k)
Benjamin Roth,
Jul 18, 2017, 11:47 PM
Ċ
ex09.pdf
(166k)
Benjamin Roth,
Jun 30, 2017, 3:15 AM
ċ
ex09_entities_types.tgz
(1k)
Benjamin Roth,
Aug 23, 2017, 12:50 AM
Ċ
ex10.pdf
(116k)
Benjamin Roth,
Jul 12, 2017, 4:30 AM
ċ
ex10_lstm.tgz
(1k)
Benjamin Roth,
Aug 23, 2017, 12:50 AM
Ċ
Benjamin Roth,
May 10, 2017, 4:49 AM
Ċ
Benjamin Roth,
Aug 9, 2017, 12:54 AM
Ċ
Benjamin Roth,
Jul 25, 2017, 9:53 AM
Ċ
Benjamin Roth,
Jul 5, 2017, 10:55 AM
Ċ
Benjamin Roth,
Jul 15, 2017, 2:39 AM
ċ
paraphrases.py
(4k)
Benjamin Roth,
May 26, 2017, 10:13 AM
Ċ
Benjamin Roth,
May 17, 2017, 4:29 AM
Ċ
Benjamin Roth,
Jul 12, 2017, 11:37 PM
Ċ
Benjamin Roth,
May 24, 2017, 6:41 AM
Ċ
Benjamin Roth,
Jun 7, 2017, 7:52 AM
ċ
test_word_similarity.py
(3k)
Benjamin Roth,
Jun 20, 2017, 9:59 AM
Ċ
tf-idf.pdf
(635k)
Benjamin Roth,
Apr 26, 2017, 2:41 AM
Ċ
Benjamin Roth,
Jun 7, 2017, 4:19 AM
Ċ
Benjamin Roth,
Jul 20, 2017, 1:16 AM
Ċ
Benjamin Roth,
Jun 22, 2017, 3:27 AM
Ċ
Benjamin Roth,
Jun 29, 2017, 4:17 AM
Ċ
Benjamin Roth,
Jul 11, 2017, 4:32 AM
Ċ
Benjamin Roth,
Jun 28, 2017, 9:32 AM
Comments