1. Arbeitstagung (TU Dortmund, 2011)

Auftaktagung des Netzwerks, TU Dortmund, 14.-16.02.2011

Die Auftakttagung wurde von Michael Beißwenger an der Technischen Universität Dortmund ausgerichtet. Die Eröffnung bildete ein Kick-off-Meeting, in dessen Rahmen die Netzwerkbeteiligten ihre individuellen Forschungsprojekte sowie ihre Perspektiven und Interessen in Bezug auf den Gegenstand Internetbasierte Kommunikation (IBK) präsentierten.

Einen thematischen Schwerpunkt der sich anschließenden, zweitägigen Fachtagung bildeten juristische und forschungsethische Fragen in Bezug auf die Erhebung, Aufbereitung und Bereitstellung von IBK-Daten für Forschungszwecke. Für Impulsvorträge zu diesem Schwerpunkt waren zwei Gastvortragende eingeladen: Christina Bankhardt (IDS Mannheim) referierte die aktuelle Rechtslage in Bezug auf die Nutzung von Sprachdaten (speziell IBK-Daten) für Forschungszwecke und für den Aufbau von Sprachressourcen. Reiner Kuhlen (Konstanz/Helsinki) sprach über informationsethische Aspekte der empirischen Erforschung internetbasierter Kommunikation und beleuchtete dabei insbesondere die Konzepte „Gemeingüter (commons)“, „Informationelle Selbstbestimmung“ und „Privatheit“. In zentralen Punkten ist die Rechtslage unklar bzw. (noch) nicht speziell an die besonderen Bedingungen der Produktion schriftlicher Sprachäußerungen im Internet angepasst. Dies führt zu einer juristisch unsicheren Situation bei der Erhebung von IBK-Daten für Forschungszwecke, insbesondere dann, wenn es um den Aufbau von linguistischen Korpora geht, die der Scientific Community frei als Forschungsressourcen zur Verfügung gestellt werden sollen. Kuhlen empfahl für diese Zwecke die Arbeit mit Daten, die unter bestimmten Typen der Creative Commons (CC) lizenziert sind (z.B. CC-BY-SA). Da nur ein kleiner Teil aller IBK-Anwendungen tatsächlich unter CC lizenziert ist, schränkt dies zwar die Möglichkeiten der Datenauswahl stark ein; allerdings erlauben die Lizenzmodelle explizit die Wiederbereitstellung der Daten, so dass in diesem Fall eine Integration in Korpora unproblematisch scheint.

Einen zweiten Schwerpunkt der Tagung bildeten Fragen der texttechnologischen Repräsentation von IBK-Genres. Hier wurden zum einen aus Sicht verschiedener im Netzwerk vorhandener Projekte Anforderungen an Schemata für die Strukturrepräsentation und für die Annotation linguistischer Besonderheiten in IBK-Genres skizziert. Für die Repräsentation von IBK-Genres gibt es bislang keine Standards; unter dem Gesichtspunkt der Interoperabilität und Austauschbarkeit von Ressourcen und Verfahren wäre die Etablierung eines Repräsentationsstandards aber für viele Projekte wünschenswert. Laurent Romary (Berlin/Paris), amtierender Council Chair der Text Encoding Initiative (TEI), gab in einem Gastvortrag einen Überblick über die Standards der TEI und die Architektur des TEI-Encoding-Frameworks (TEI P5) und zeigte Möglichkeiten auf, wie die Modelle der TEI für die Annotation von Textdaten an neue Genres wie z.B. IBK-Genres angepasst werden könnten. Von zentraler Bedeutung ist dabei die in den TEI-Standard implementierte Möglichkeit der customization, die es erlaubt, in TEI schon vorhandene Modelle an die Anforderungen neuer Genres anzupassen und sie dabei zu modifizieren und zu erweitern.

Weiteren externe Gäste stellten einschlägige Projekte zum Thema vor. Vertreten waren das niederländische Referenzkorpus SoNaR (STEVIN Nederlandstalig Referentiecorpus), das BBAW-Projekt „Digitales Wörterbuch der deutschen Sprache“ (DWDS), die Nachwuchsforschergruppe „Wissenschaft und Internet“ an der Universität Düsseldorf, das DFG-Projekt „World Languages – Digital Languages“ an der Universität Freiburg sowie das Projekt „Linguistic Networks“ an der Universität Frankfurt.

Dokumentation der Tagungsbeiträge

Zu den folgenden Tagungsbeiträgen liegen Folienpräsentationen vor: