7. Arbeitstagung (TU Dortmund, 2014)

Internationale Abschlusstagung des Netzwerks, TU Dortmund, 19.-21.02.2014

Die Abschlusstagung wurde von Michael Beißwenger und Angelika Storrer an der Technischen Universität Dortmund ausgerichtet und stand unter dem Rahmenthema "Social Media Corpora for the eHumanities: Standards, Challenges, and Perspectives".

Auf der Tagung wurden Ergebnisse aus der Arbeit im Netzwerk vorgestellt und Perspektiven für die weitere Forschung zum Thema aufgezeigt. Die Veranstaltung fand unter Einbezug einer breiteren Fachöffentlichkeit statt: Kollegen und Kooperationspartner aus dem In- und Ausland waren eingeladen, die Beiträge des Netzwerks zu kommentieren und Ergebnisse aus eigenen Arbeiten zum Thema zu präsentieren. Die Tagung wurde mitveranstaltet vom neu gegründeten GSCL-Arbeitskreis „Social Media / Internetbasierte Kommunikation“, in dem nach Auslaufen der DFG-Förderung zentrale Themen des Netzwerks verstetigt wurden. Entsprechend lag ein Schwerpunkt der Tagung auf einem Überblick über den Stand der Arbeiten in Initiativen, die durch das Netzwerk auf den Weg gebracht wurden: In die Tagung integriert war ein Panel „Modeling CMC genres in TEI“, in dem Mitglieder der TEI-SIG „Computer-Mediated Communication“ inkl. französischer und italienischer Kooperationspartner (Thierry Chanier, Kun Jin, Isabella Chiari) einen Überblick über die bislang erarbeiteten Modelle für die TEI-Repräsentation von IBK-Genres präsentierten und Optionen für die Konzeption eines Metadatenschemas für IBK-Korpora diskutierten. Die Beiträge aus der SIG wurden von Laurent Romary (ehemals TEI Council Chair) und Andreas Witt (Convener der TEI-SIG „TEI for Linguists“) kommentiert. Des Weiteren wurde das finale Konzept für die Shared Task des Netzwerks zur automatischen linguistischen Annotation deutschsprachiger IBK-Daten sowie das in Kooperation mit dem IDS Mannheim entwickelte PoS-Tagset für IBK-Korpora vorgestellt, das die Grundlage für den Goldstandard der Shared Task bilden sollte.

Mit Blick auf die Weiterentwicklung von Analysekategorien und darauf bezogenen Annotationsschemata wurden darüber hinaus Fragen der linguistischen Modellierung von sprachlichen Besonderheiten in IBK- und Social-Media-Technologien behandelt: Angelika Storrer diskutierte im Anschluss an die Diskussionslinien der 2013 von Beteiligten des Netzwerks organisierten DGfS-AG Implikationen und Perspektiven einer Beschreibung von IBK-Phänomenen als ‚nichtstandardisierte‘ Schriftlichkeit. Christa Dürscheid stellte in einem eingeladenen Gastvortrag Vorschläge für die Beschreibung orthographischer Variation in WhatsApp-Daten vor. Wolfgang Imo behandelte am Beispiel von Diskursmarkern Unterschiede zwischen konzeptioneller Mündlichkeit in gesprochener und geschriebener Sprache.

Die Vorträge wurden um Beiträge aus Qualifikationsarbeiten im Netzwerk zur Analyse orthographischer Variation (Irina Mostovaia, Essen) und zur Normalisierung normabweichender Schreibungen (Ronja Laarmann-Quante, Bochum) ergänzt. Weitere Beiträge behandelten innovative Ansätze zur Erhebung von Korpusdaten aus CC-lizenzierten IBK-Ressourcen (Adrien Barbaresi) und zur Annotation von Foren-Threads (Iris Hendrickx). Mit einem Gastvortrag von Vertretern des CLARIN-D Legal HelpDesk (Paweł Kamocki & Erik Ketzan) wurde auf vielfachen Wunsch abschließend noch einmal die rechtliche Grauzone in Bezug auf die Erhebung und Nutzung von IBK- und Social-Media-Daten für den Aufbau von Sprachressourcen beleuchtet. Die beiden Referenten stellten dabei die Perspektive der Juristen der Perspektive von Linguisten und Ressourcenanbietern gegenüber und diskutierten die Schwierigkeit, Konzepte des Urheberrechts wie ‚Werk‘ und ‚Schöpfungshöhe‘ pauschal auf Nutzer-Postings in Social-Media-Anwendungen zu beziehen. Die Klärung der Rechtslage bleibt eines der zentralen Desiderate beim Aufbau und bei der Bereitstellung von IBK-Korpora.

Tagungsprogramm