AG bei der DGfS-Tagung (2013)

Modellierung nichtstandardisierter Schriftlichkeit / Modeling Non-Standardized Writing

AG im Rahmen der 35. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), Universität Potsdam, 13.-15.03.2013

Die AG, die von Michael Beißwenger, Stefanie Dipper, Stefan Evert und Bianka Treivsan organisiert wurde, hatte zum Ziel, theoretisch und empirisch arbeitende Linguisten, Korpuslinguisten und Computerlinguisten zusammenzubringen, die beim Aufbau und bei der linguistischen Analyse von Korpora in unterschiedlichen Forschungsfeldern mit Phänomenen nichtstandardisierter Schriftlichkeit befasst sind, sowie zu diskutieren, zu welchem Grad die in diesen Forschungsfeldern bearbeiteten „Nonstandard“-Phänomene vergleichbar sind und einen Transfer von Konzepten, Verfahren und Werkzeugen zulassen. Die AG versammelte Beitrage aus vier Forschungsfeldern: (i) Webkorpora und internetbasierte Kommunikation, (ii) Lernertexte, (iii) Sprach(varietät)en mit emergenter Schriftlichkeit, (iv) Verschriftung zu Zwecken wissenschaftlicher Modellierung und Analyse (Transkription gesprochener Sprache, Logging von Schreibprozessen). Ein Teil der Beiträge war primär linguistisch orientiert und präsentierte empirische Befunde und Modellierungen zu Phänomenen nichtstandardisierter Schriftlichkeit. Ein anderer Teil der Beiträge war primär computerlinguistisch motiviert und behandelte Fragen der automatischen Verarbeitung (mit Beispielen aus für die AG relevanten Forschungsfeldern). Einige Beiträge brachten beide Perspektiven zusammen.

Als besonders fruchtbar erwies sich in verschiedenen Beiträgen und auch in der Diskussion die Kooperation von Linguistik und Sprachtechnologie bzw. Computerlinguistik. Bei der Frage der Übertragbarkeit von Beschreibungsansätzen zwischen unterschiedlichen Forschungsfeldern (Internetbasierte Kommunikation, Lernertexte, emergente Schriftlichkeit, Transkription gesprochener Sprache) sind hingegen die unterschiedlichen Bedingungen des Bezugs auf Standard(s) zu berücksichtigen. Während beispielsweise bei der Sprachverwendung im Netz Abweichungen von den Normen der redigierten Schriftlichkeit synchron beschrieben werden können, ist das für "Nonstandard"-Phänomene in historischen Texten nicht oder nur begrenzt möglich. Darüber hinaus hat die Frage der bewussten und unbewussten Normabweichung in unterschiedlichen Forschungsfeldern einen unterschiedlichen Stellenwert und ist die Abbildung normabweichender Schreibungen auf einen Standard für Zwecke der Analyse unterschiedlich motiviert (vergleiche etwa Normabweichungen mit performativem Charakter in IBK-Genres und kompetenzbedingte Normabweichungen in Lernertexten). Gemeinsame Interessen zwischen den Forschungsfeldern ergeben sich in Bezug auf Fragen der Anpassung sprachtechnologischer Verfahren für die linguistische Aufbereitung und Analyse von Korpora. Inwieweit ein Transfer von Ansätzen u.a. zur Normalisierung, zur Lemmatisierung, zur Tokenisierung und zum Part-of-Speech-Tagging (PoS-Tagging) zwischen den Forschungsfeldern konkret möglich und sinnvoll ist, wurde als lohnender Gegenstand für weiteren Austausch zwischen den Forschungsfeldern identifiziert.

Berichte über die AG sind in den Mitteilungen der DGfS (2013) sowie in der Zeitschrift für Germanistische Linguistik erschienen (2014).