5. Arbeitstagung (Uni Hamburg, 2013)

5. Arbeitstagung, Universität Hamburg, 25.-26.04.2013

Die 5. Arbeitstagung wurde von Jannis Androutsopoulos und Jana Tereick an der Universität Hamburg ausgerichtet.

Ein Schwerpunkt der Hamburger Tagung lag auf soziolinguistischen und multimodalen Perspektiven auf die Sprachverwendung in der internetbasierten Kommunikation (IBK). Die Keynote von Oliver Ehmer (Freiburg) über „Online writing styles and social status“ stellte den Ansatz des Freiburger DFG-Projekts „RomWeb“ vor und zeigte an exemplarischen Analysen die methodischen Möglichkeiten einer quantitativen, EDV-unterstützten Auswertung eines großen Korpus aus spanischsprachigen Diskussionsforen. Zentral in der Analyse von Ehmer ist dabei der Zusammenhang sprachlicher Variation mit dem sozialen Status der an IBK Beteiligten. In der zweiten Keynote des Treffens präsentierte Seza Doğruöz (Tilburg) unter dem Titel „Multilingual Language use in online environments“ ihre aktuelle Forschung an der Schnittstelle zwischen Kognitiver Linguistik und Informatik mit Schwerpunkt auf dem Verhältnis zwischen der Mehrsprachigkeit in der IBK und in der direkten gesprochenen Sprache ein und derselben Population (am Beispiel der Community von türkischstämmigen Menschen in den Niederlanden).

Auf vielfachen Wunsch aus den Reihen der Netzwerkbeteiligten wurde darüber hinaus das Thema „Rechtliche Fragen“ erneut mit einem Gastvortrag behandelt. Der Fokus lag dabei auf dem rechtlichen Status von ‚user generated content‘ in Twitter und in sozialen Netzwerken. Nikolaus Forgó (Hannover) beleuchtete das juristisch komplizierte Zusammenspiel zwischen dem Urheberrecht, den Bestimmungen in den AGB und den Rechten der Plattformbetreiber. Unterschiedliche nationale Rechtslagen machen die Rechtefrage zusätzlich kompliziert. Der Vortrag zeigte ein weiteres Mal, dass rechtliche Fragen in Bezug auf die Nutzung von IBK-Daten für Forschungszwecke einer grundsätzlichen Klärung bedürfen, die von an IBK interessierten Wissenschaftlerinnen und Wissenschaftlern aufgrund fehlender juristischer Expertise nicht selbstständig geleistet werden kann.

Einen weiteren Themenkomplex der Tagung bildeten erneut Fragen der Annotation und Verarbeitung von IBK-Daten. Jan Christoph Meister (Hamburg) stellte die Werkzeuge des heureCLÉA-Projekts vor, die die kooperative Analyse und semantische Annotation von Textdaten erlauben. Sandra Hansen und Roman Schneider (IDS Mannheim) präsentierten in einem Gastbeitrag Ergebnisse aus der Anpassung von Verfahren des maschinellen Lernens für die Analyse linguistischer Phänomene im Dortmunder Chat-Korpus. In einer netzwerkinternen Arbeitssitzung wurde die Vorbereitung einer Shared Task zur linguistischen Annotation von IBK-Korpora vereinbart, die als Projekt des Netzwerks und unter Leitung von Michael Beißwenger und Stefan Evert die Entwicklung innovativer sprachtechnologischer Verfahren für die automatische Tokenisierung und für das PoS-Tagging von Daten aus IBK-Genres voranbringen soll. Die Konzeption und Vorbereitung der Shared Task (EmpiriST) startete 2014 und wurde von der Gesellschaft für Sprachtechnologie und Computerlinguistik (GSCL) finanziell unterstützt. Die Ergebnisse des Projekts wurden auf dem 10. Web-as-Corpus-Workshop im Rahmen der ACL-Konferenz 2016 international präsentiert und im Rahmen eines Bandes in der ACL Anthology publiziert.

Tagungsprogramm