teaching‎ > ‎

Einführung in die Computerlinguistik

Termine, Leistungspunkte
Zeit / Raum Vorlesung:
Mo. 14-16 (B U101), Fr. 10-11 (B U101)
Zeit / Raum Übung: Mi 9-10 (123), Do 9-10 (057), Fr 11-12 (B U101)

Ergebnisse der Wiederholungsklausur*.
*für Studenten, die der Veröffentlichung unter der Matrikelnummer zugestimmt haben. Emailanfragen anderer Studenten zur Note bleiben unbeantwortet (Sie müssen warten, bis die Note im LSF angezeigt wird oder an das Prüfungsamt Informatik weitergeleitet ist).

Klausureinsicht: Fr. 23.6., 15:00-16:00, Raum C 105





Termin für die Wiederholungsprüfung: Samstag 20.05.2017, 10:00-12:00. (Anmeldung geschlossen).
Klausureinsicht: Freitag, 24.3.2017, 10:00 - 11:00, Raum C 105.

Hinweise zur Wiederholungsklausur:
Ort: Prof.-Huber-Pl. 2 (W) Raum LEHRTURM-W201
Zeit: Samstag 20.05.2017, 10:00-12:00
Weitere Hinweise:
  • Sie müssen für die Klausur angemeldet sein und Sie benötigen Ihren Studentenausweis um bei der Klausur mitschreiben zu dürfen.
  • Sie können ein von Ihnen handbeschriebenes, zweiseitiges DIN-A4 Blatt mit für Sie nützlichen Informationen/Merkhilfen in der Klausur verwenden. Das Blatt wird zusammen mit der Klausur eingesammelt.
  • Sie dürfen einen nicht-programmierbaren Taschenrechner benutzen.
  • Handys (... Smartwachtes etc.) sind nicht erlaubt (müssen ausgeschaltet und weggepackt sein).
  • Dauer der Klausur: 90 Minuten

Dozenten:

Kontakt: Bitte kontaktieren Sie je nach Anliegen den verantwortlichen Dozenten oder Ihren zuständigen Tutor.

6 ECTS: 1 ECTS entspricht 30 Arbeitsstunden, d.h. der Arbeitsaufwand für den Kurs sollte über das Semester verteilt ca. 180 Stunden betragen.
  • 16 Wochen * 4 * 45 Minuten Vorlesung/Tutorium = 48 Stunden
  • 16 Wochen * ca. 6 Stunden Bearbeitung Übungsblatt / Vor-/Nacharbeiten des Vorlesungsmaterials
  • 36 Stunden zusätzlich / Klausurvorbereitung etc.

Übungsgruppen


Hinweise zur Abgabe der Übungsblätter:
  • 23.11.2016: WICHTIG: Ab dem Aufgabenblatt zum Thema "Automaten" werden wir bei der Abgabe der Übungsblätter auf das Moodle-System umsteigen. (Das Arbeitsblatt zum Thema Pragmatik und Semantik wird wie gewohnt eingereicht.) Bitte melden Sie sich bis spätestens Sonntag, 27.11.2016, auf der Moodle-Plattform bei unserem Kurs an (Anleitung hier). Wenn die Tutoren Sie nicht rechtzeitig den Gruppen zuweisen können und Sie nicht für den Kurs registriert sind, können keine Punkte für die jeweiligen Arbeitsblätter vergeben werden. Wir werden verspätetete Anmeldungen im Moodle-System nicht berücksichtigen können. Bitte beachten Sie auch, dass sich JEDES Gruppenmitglied anmelden muss. Die Anmeldung läuft über den LMU-Account, bei etwaigen Passwort-Problem etc. bitte rechtzeitig an den entsprechenden Support wenden!
  • 8.11.2016: Verspätete Abgaben werden mit 0 Punkten bewertet. Wenn es Unklarheiten bei der Aufgabenstellung gibt, informieren Sie Ihren Tutor bitte sofort (z.B. per e-Mail).
  • Bitte verwenden sie das Kürzel EICL im Betreff der Email, und denken Sie bitte daran, die Namen und Matrikelnummern aller Teammitglieder auf dem Übungsblatt zu vermerken. Bitte beachten Sie auch: Die Übungsgruppen müssen aus 2 oder 3 Studenten bestehen, 4 Personen sind leider nicht möglich. Jede Übungsgruppe muss eine eigenständige Lösung für das Blatt abgeben. Wenn offensichtlich ein Team die Lösung von einem anderen übernommen hat, bewerten wir beide Lösungen mit 0 Punkten.

Inhalte

In dieser Vorlesung werden grundlegende Konzepte der Computerlinguistik eingeführt. Es werden sprachwissenschaftliche Konzepte, computerlinguistische Methoden und Anwendungen erarbeitet.

Themen der Vorlesung:
  • Sprachwissenschaftliche Grundlagen:
    • Grundlagen der Phonetik
    • Morphologische Grundkonzepte
    • Syntax: Dependenz und Konstituenz. Wortstellung im Deutschen.
    • Semantische Relationen und Wortähnlichkeit.
    • Pragmatische Grundkonzepte
  • Computerlinguistische Methoden:
    • Endliche Automaten
    • Hidden-Markov Modelle
    • Automatische Syntaktische Analyse
  • Computerlinguistische Anwendungen
    • Maschinelle Übersetzung
    • Informationssuche

Literaturempfehlungen:
  • Daniel Jurafsky, James H. Martin. Speech and Language Processing. 2nd Edition. Pearson.
  • Horst M. Müller (Hg.). Arbeitsbuch Linguistik. 2. Auflage. UTB.
  • Victoria Fromkin, Robert Rodman, Nina Hyams. An Introduction to Language. 9th Edition. Wadsworth.
  • Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. (link)
  • Keith Brown (ed.): Encyclopedia of Language & linguistics (link)
  • Emily M. Bender: Linguistic Fundamentals for Natural Language Processing.

Vorlesungsplan


Teil 1, vor Weihnachten:
 Datum
Themen
 Dozent Folien
 Zu lesen
 Übungsblatt
 17.10. (Mo, 2h)
 Was ist Computerlinguistik?
 Überblick über Teilbereiche der Linguistik
 Roth  (pdf)  Jurafsky,
 Ch. 1-1.5
 (pdf)
 21.10. (Fr, 1h)
 Phonetik (Überblick)
 Roth  (pdf)
 Müller, Kap. 3
 (ohne 3.4, 3.5)
 
 24.10. (Mo)
 Phonologie
 [Morphologie] Sprachliche Zeichen / Was ist ein Wort?
 Roth  (pdf)
 (pdf)

 (pdf)
 28.10. (Fr)
 [Morphologie] Morphologische Zerlegung und Bildung: Derivation / Flexion / Komposition  Roth  (pdf)  Müller, Kap. 5  
 31.10. (Mo)
 [Morphologie] Wortarten
 [Syntax] Syntaktische Funktionen I
 Roth  (pdf)
 
 (pdf)
 4.11. (Fr)
 [Syntax] Syntaktische Funktionen II und Dependenzgrammatik  Roth  (pdf)  Müller, Kap.6  
 7.11. (Mo)
 [Syntax] Konstituententests, Kontextfreie Grammatik
 Roth  (pdf)    (pdf)
 11.11. (Fr)
 [Syntax] Satztopologie des Deutschen  Roth  (pdf)    
 14.11. (Mo)
 Semantik I  Friedrich
(hallo.pdf)
 (pdf, 18/11 kleine Updates)
Aussagenlogik,
Prädikatenlogik
 (pdf)
 (Lösung Prädikatenlogik)
 18.11. (Fr)
 Semantik II
 Friedrich  siehe Semantik I Skalarprodukt
Winkel zwischen Vektoren
Zur Frage, warum der Winkel der "Ähnlichkeit" entspricht: Cosine similarity
Unbenotete Übung (im Tutorium):
 (pdf)
 21.11. (Mo)
 Pragmatik
 Roth  (pdf)   Fromkin, Ch.3
 "Pragmatics"
 (pdf)
 25.11. (Fr)
 Diskurs, Wiederholung
 Friedrich/Roth  siehe Semantik I
 freiwillig für Interessierte:
Discourse structure and language technology
 
 28.11. (Mo)
 Endliche Automaten I
 Friedrich  (pdf)    siehe Moodle
 2.12. (Fr)
 Endliche Automaten II
 Friedrich  (pdf) 8.12.: Update zu epsilon-Closure!
20.1: Tippfehler entfernt.
   
 5.12. (Mo)
 Wortarten-Tagging und Hidden Markov Modelle  Friedrich  (pdf) T. Brants: Part-of-Speech Tagging. In: The Encyclopedia of Language and Linguistics. Keith Brown (ed.), Elsevier, 2006. (verfügbar über LMU Bibliothek, online! Formeln müssen (noch) nicht verstanden werden.)
 siehe Moodle
 9.12. (Fr)
 Wiederholung Automaten & HMMs
 Friedrich  (pdf)
Satz von Bayes  
 12.12. (Mo)
 Merkmale und Merkmalsstrukturen  Roth  (pdf)  Müller, Kap 21, bis 2.2 inkl.  (pdf)
 16.12. (Fr)
 Wiederholung/Fragestunde
 Roth/Friedrich      
 19.12. (Mo)
 Probeklausur  Roth/Friedrich Probeklausur (pdf)
   
 23.12. (Fr)
 Fragestunde Roth
     

Teil2, nach Weihnachten:
 9.1. (Mo, 2h) Kontextfreie Grammatik und Parsing  Friedrich (pdf)Erklärungen zu CNF
(pdf)
Abgabe per Moodle!
 13.1. (Fr, 1h)  Parsing  Friedrich  (pdf)
 
 16.1. (Mo)
 Maschinelles Lernen (Einführung, Evaluation)  Roth/Friedrich  (pdf, pdf)
20.1: Tippfehler entfernt.
Tipps zur Benutzung von R als Taschenrechner
 siehe Moodle
 20.1. (Fr)  Maschinelles Lernen (Sprachmodelle, Naive Bayes)  Friedrich

 
 23.1. (Mo) Maschinelles Lernen (Entscheidungsbäume)
 Maschinelle Übersetzung I
Friedrich
Roth
 (pdf)
 (pdf)
 Jurafsky, Ch. 25.3 - 25.4 (inkl.)
 siehe Moodle
 27.1. (Fr)  Maschinelle Übersetzung II

 Roth/Huck  (pdf)   
 30.1. (Mo)  Suchmaschinen: Invertierte Indexe
 Suchmaschinen: Ranking mit tf.idf
 Roth  (pdf)
 (pdf)
Manning,
 Ch.1
 Manning, Ch. 6.2 - 6.4 (inkl.)
 
 3.2. (Fr)  Quiz & Fragestunde
     Probeklausur 2
 6.2. (Mo)  Besprechung Probeklausur, Fragestunde
    
 10.2. (Fr)  Klausur 10:00-12:00       
 
 
      
          

Ċ
Benjamin Roth,
Sep 13, 2016, 11:12 AM
Ċ
Benjamin Roth,
Nov 21, 2016, 4:54 AM
Ċ
Anne Friedrich,
Feb 6, 2017, 9:48 AM
Ċ
Anne Friedrich,
Nov 25, 2016, 2:35 AM
Ċ
hallo.pdf
(1417k)
Anne Friedrich,
Nov 14, 2016, 8:07 AM
Ċ
Benjamin Roth,
Jan 30, 2017, 12:54 AM
Ċ
Benjamin Roth,
Sep 13, 2016, 11:18 AM
Ċ
Benjamin Roth,
Sep 13, 2016, 11:17 AM
Ċ
Benjamin Roth,
Nov 9, 2016, 4:34 AM
Ċ
Anne Friedrich,
Nov 28, 2016, 8:42 AM
Ċ
main.pdf
(282k)
Benjamin Roth,
Dec 19, 2016, 7:25 AM
Ċ
Anne Friedrich,
Jan 20, 2017, 2:36 AM
Ċ
Anne Friedrich,
Jan 23, 2017, 2:43 AM
Ċ
Anne Friedrich,
Jan 23, 2017, 1:22 AM
Ċ
Benjamin Roth,
Dec 12, 2016, 4:23 AM
Ċ
mt.pdf
(464k)
Benjamin Roth,
Jan 23, 2017, 2:23 AM
Ċ
Benjamin Roth,
Dec 19, 2016, 7:06 AM
Ċ
Anne Friedrich,
Jan 9, 2017, 1:52 AM
Ċ
Anne Friedrich,
Jan 13, 2017, 12:41 AM
Ċ
Anne Friedrich,
Feb 6, 2017, 9:45 AM
Ċ
Benjamin Roth,
Nov 14, 2016, 5:39 AM
Ċ
Benjamin Roth,
Jan 27, 2017, 2:41 AM
Ċ
Anne Friedrich,
Nov 28, 2016, 3:53 AM
Ċ
Anne Friedrich,
Jan 20, 2017, 2:35 AM
Ċ
Anne Friedrich,
Dec 2, 2016, 8:03 AM
Ċ
Benjamin Roth,
Oct 27, 2016, 11:55 PM
Ċ
Benjamin Roth,
Oct 20, 2016, 9:17 AM
Ċ
Benjamin Roth,
Oct 20, 2016, 9:46 AM
Ċ
Anne Friedrich,
Dec 2, 2016, 12:59 AM
Ċ
Benjamin Roth,
Nov 4, 2016, 3:22 AM
Ċ
Benjamin Roth,
Oct 31, 2016, 8:29 AM
Ċ
Benjamin Roth,
Oct 17, 2016, 7:21 AM
Ċ
Benjamin Roth,
Oct 24, 2016, 4:23 AM
Ċ
Benjamin Roth,
Oct 31, 2016, 5:35 AM
Ċ
tf-idf.pdf
(635k)
Benjamin Roth,
Feb 2, 2017, 2:51 AM
Ċ
Anne Friedrich,
Jan 13, 2017, 2:25 AM
Ċ
Benjamin Roth,
Oct 17, 2016, 3:00 AM
Ċ
Benjamin Roth,
Oct 24, 2016, 4:28 AM
Ċ
Benjamin Roth,
Oct 31, 2016, 5:17 AM
Ċ
Benjamin Roth,
Nov 7, 2016, 7:21 AM
Ċ
Anne Friedrich,
Nov 14, 2016, 2:43 AM
Ċ
Benjamin Roth,
Nov 21, 2016, 7:06 AM
Ċ
Benjamin Roth,
Dec 12, 2016, 4:23 AM
Ċ
Anne Friedrich,
Dec 7, 2016, 8:39 AM
Comments