Publications
The following publications related to German sentiment analysis are written by members of the IGGSA:
Manfred Klenner: Sentiment Inference for Gender Profiling. In Language, Data, and Knowledge, 2023.
Christoph Demus, Mina Schütz, Nadine Probol, Melanie Siegel and Dirk Labudde: Automatische Klassifikation offensiver deutscher Sprache in sozialen Netzwerken. In Sylvia Jaki und Stefan Steiger (eds.): Digitale Hate Speech, 2023, J.B. Metzler, Berlin, Heidelberg.
Christoph Demus, Mina Schütz, Jonas Pitz, Nadine Probol, Melanie Siegel, and Dirk Labudde: Handbuch Cyberkriminologie, Chapter Hass im Netz – Aggressivität und Toxizität von Hasskommentaren und Postings, Detektion und Analyse. Thomas-Gabriel Rüdiger und Petra Saskia Bayerl, 2022. Springer VS, Wiesbaden.
Christoph Demus, Jona Pitz, Mina Schütz, Nadine Probol, and Melanie Siegel, and Dirk Labudde: DeTox: A Comprehensive Dataset for German Offensive Language and Conversation Analysis. In Proceedings of the Sixth Workshop on Online Abuse and Harms (WOAH), pages 143–153, 2022.
Preslav Nakov, Alberto Barrón-Cedeño, Giovanni da San Martino, Firoj Alam, Julia Maria Struß, Thomas Mandl, Rubén Míguez, Tommaso Caselli, Mucahid Kutlu, Wajdi Zaghouani, Chengkai Li, Shaden Shaar, Gautam Kishore Shahi, Hamdy Mubarak, Alex Nikolov, Nikolay Babulkov, Yavuz Selim Kartal, Michael Wiegand, Melanie Siegel and Juliane Köhler (2022). Overview of the CLEF-2022 CheckThat! Lab on Fighting the COVID-19 Infodemic and Fake News Detection, LNCS, volume 13390.
Juliane Köhler, Gautam Koshore Shahi, Julia Maria Struß, Michael Wiegand, Melanie Siegel, Thomas Mandl and Mina Schütz (2022). Overview of the CLEF-2022 CheckThat! Lab: Task 3 on Fake News Detection, CEUR Workshop Notes.
Melpomeni Alexa and Melanie Siegel (2021). Tools für Social Listening und Sentiment-Analyse. Springer, 2021. – ISBN 978-3-658-33467-3
Mina Schütz, Christoph Demus and Jonas Pitz, Nadine Probol, Melanie Siegel and Dirk Labudde (2021). DeTox at GermEval 2021: Toxic Comment Classification. In: Proceedings of the GermEval 2021 Workshop on the Identification of Toxic, Engaging, and Fact-Claiming Comments. Heinrich Heine University Düsseldorf, 2021, S. 54–61.
Mina Schütz, Alexander Schindler, and Melanie Siegel (2021). Disinformation Detection: An Explainable Transfer Learning Approach. In: CODE Conference 2021 – Science Workshop for Ph.D. and masters’ theses research proposals.
Mina Schütz and Alexander Schindler, Melanie Siegel, and Kawa Nazemi (2021). Automatic Fake News Detection with Pre-Trained Transformer Models.In: Del Bimbo A. et al. (eds) Pattern Recognition. ICPR International Workshops and Challenges. ICPR 2021. Lecture Notes in Computer Science, vol 12667. Springer, Cham.
Julian Risch, Anke Stoll, Lena Wilms and Michael Wiegand (2021). Overview of the GermEval 2021 Shared Task on the Identification of Toxic, Engaging, and Fact-Claiming Comments. In: Proceedings of GermEval 2021 Shared Task on the Identification of Toxic, Engaging, and Fact-Claiming Comments co-located with KONVENS, pp 1-12.
Josef Ruppenhofer, Melanie Siegel and Julia Maria Struß (2020). Journal for Language Technology and Computational Linguistics: Special Issue on Offensive Language, Volume 34, Number 1. Gesellschaft für Sprachtechnologie & Computerlinguistik (GSCL).
Melanie Siegel and Melpomeni Alexa (2020). Sentiment-Analyse deutschsprachiger Meinungsäußerungen Springer, Wiesbaden.
Julia Maria Struß, Melanie Siegel, Josef Ruppenhofer, Michael Wiegand and Manfred Klenner (2019). Overview of GermEval Task 2, 2019 Shared Task on the Identification of Offensive Language. In: Proceedings of the 15th Conference on Natural Language Processing (KONVENS 2019), October 9 – 11, 2019 at Friedrich-Alexander-Universität Erlangen-Nürnberg. - München [u.a.]: German Society for Computational Linguistics & Language Technology and Friedrich-Alexander-Universität Erlangen-Nürnberg, 2019, pp. 352-363.
Marc Schulder, Michael Wiegand and Josef Ruppenhofer: Automatically Creating a Lexicon of Verbal Polarity Shifters: Mono- and Cross-lingual Methods for German. In Proceedings of COLING, 2018.
Michael Wiegand, Melanie Siegel and Josef Ruppenhofer: Overview of the GermEval 2018 Shared Task on the Identification of Offensive Language. In Proceedings of GermEval, 2018.
Michael Wiegand, Tatiana Anikina, Anastasija Amann, Aikaterini Azoidou, Anastasia Borisenkov, Kirstin Kolmorgen, Insa Kröger, and Christine Schäfer: Saarland University’s Participation in the GermEval Task 2018 — Examining Different Types of Classifiers and Features, in Proceedings of GermEval, 2018.
Melanie Siegel and Markus Meyer: h_da Submission for the Germeval Shared Task on the Identification of Offensive Language. In Proceedings of GermEval, 2018.
Manfred Klenner: Offensive language without offensive words (OLWOW). In Proceedings of GermEval, 2018.
Manfred Klenner: What Does it Mean to be a Wutbürger? A First Exploration. In Proceedings of the Workshop on Sentic Computing, Sentiment Analysis, Opinion Mining, and Emotion Detection, 2018.
Uladzimir Sidarenka. PotTS at GermEval-2017 Task B: Document-Level Polarity Detection Using Hand-Crafted SVM and Deep Bidirectional LSTM Network. In Proceedings of the GSCL GermEval Shared Task on Aspect-based Sentiment in Social Media Customer Feedback, 2017.
Manfred Klenner, Don Tuggener and Simon Clematide: Stance Detection in Facebook Posts of a German Right-wing Party. In Proceedings of the Workshop on Linking Models of Lexical, Sentential and Discourse-level Semantics, 2017.
Manfred Klenner: An Unification-based Model for Attitude Prediction. In Proceedings of TSD, 2017.
Manfred Klenner: An Object-oriented Model of Role Framing and Attitude Prediction. In Proceedings of IWCS, 2017.
Josef Ruppenhofer, Petra Steiner and Michael Wiegand: Evaluating the morphological compositionality of polarity. In Proceedings of RANLP, 2017.
Michael Wiegand, Maximilian Wolf and Josef Ruppenhofer: Negation Modeling for German Polarity Classification. In Proceedings of GSCL, 2017.
Uladzimir Sidarenka and Manfred Stede: Generating Sentiment Lexicons for German Twitter. In Proceedings of the Workshop on Computational Modeling of People's Opinions, Personality, and Emotions in Social Media, 2016.
Josef Ruppenhofer and Jasper Brandes: Effect Functors for Opinion Inference. In Proceedings of LREC, 2016.
Roman Klinger, Surayya Samat Suliya and Nils Reiter: Automatic Emotion Detection for Quantitative Literary Studies -- A case study based on Franz Kafka's “Das Schloss” and “Amerika”. In Digital Humanities, 2016.
Mario Sänger, Ulf Leser, Steffen Kemmerer, Peter Adolphs and Roman Klinger: SCARE ― The Sentiment Corpus of App Reviews with Fine-grained Annotations in German. In Proceedings of LREC, 2016.
Dirk Reinel and Jörg Scheidt: Automatische Auswertung von Kundenmeinungen - Opinion Mining am Beispiel eines Projekts für die Versicherungswirtschaft. Dialogmarketing Perspektiven 2014/2015 - Tagungsband 9. wissenschaftlicher Kongress für Dialogmarketing.
Manfred Klenner and Simon Clematide: How Factuality Determines Sentiment Inferences. In Proceedings of *SEM, 2016.
Manfred Klenner: A Model for Multi-Perspective Opinion Inferences. In Proceedings of IJCAI Workshop Natural Language Meets Journalism, 2016.
Manfred Klenner, Michael Amsler: Sentiframes: A Resource for Verb-centered German Sentiment Inference. In Proceedings of LREC, 2016.
Uladzimir Sidarenka: PotTS: The Potsdam Twitter Sentiment Corpus. In Proceedings of LREC, 2016.
Roman Klinger and Philipp Cimiano: Instance selection improves cross-lingual model training for fine-grained sentiment analysis. In Proceedings of CoNLL, 2015.
Josef Ruppenhofer and Jasper Brandes. Extending effect annotation with lexical decomposition. In Proceedings of WASSA, 2015.
Michael Wiegand, Christine Bocionek and Josef Ruppenhofer: Opinion Holder and Target Extraction on Opinion Compounds – A Linguistic Approach. In Proceedings of NAACL, 2016.
Michael Wiegand and Josef Ruppenhofer: Opinion Holder and Target Extraction based on the Induction of Verbal Categories. In Proceedings of CoNLL, 2015.
Josef Ruppenhofer, Roman Klinger, Julia Maria Struß, Jonathan Sonntag, Michael Wiegand: IGGSA Shared Tasks on German Sentiment Analysis (GESTALT). Workshop Proceedings of the 12th Edition of the KONVENS Conference. http://nbn-resolving.de/urn:nbn:de:gbv:hil2-opus-3196
Michael Wiegand,Christine Bocionek, Andreas Conrad, Julia Dembowski, Jörn Giesen, Gregor Linn and Lennart Schmeling: Saarland University’s Participation in the GErman SenTiment AnaLysis shared Task (GESTALT). Workshop Proceedings of the 12th Edition of the KONVENS Conference. http://nbn-resolving.de/urn:nbn:de:gbv:hil2-opus-3208
M. Klenner, M. Amsler, and N. Hollenstein. Inducing domain-specific noun polarity guided by domain-independent polarity preferences of adjectives. In Proceedings of the 5th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis, pages 18–23. Association for Computational Linguistic, 2014.
M. Klenner and S. Petrakis. Inducing the contextual and prior polarity of nouns from the induced polarity preference of verbs. Data & Knowledge Engineering, 90:13–21, 2014.
M. Klenner, S. Tron, M. Amsler, and N. Hollenstein. The detection and analysis of bi- polar phrases and polarity conflicts. In Proceedings of 11th International Workshop on Natural Language Processing and Cognitive Science. s.n., 2014.
M. Klenner, M. Amsler, and N. Hollenstein. Verb polarity frames: a new resource and its application in target-specific polarity classification. In Proceedings of KONVENS 2014, pages 106–115. s.n., 2014.
S. Rill, D. Reinel, J. Scheidt, R. V. Zicari. PoliTwi: Early Detection of Emerging Political Topics on Twitter and the Impact on Concept-Level Sentiment Analysis. Knowledge-Based Systems. Elsevier; 2014, DOI: 10.1016/j.knosys.2014.05.008
Roman Klinger and Philipp Cimiano: The USAGE review corpus for fine-grained, multi-lingual opinion analysis. LREC 2014
Josef Ruppenhofer, Julia Maria Struß, Stefan Gindl and Jonathan Sonntag, Taking STEPS: Shared Task on Source and Target Extraction from Political Speeches. Journal for Language Technology and Computational Linguistics, 2014 (preprint). jlcl_preprint.pdf
R. Remus, S. Rill. Data-driven vs. Dictionary-based Word n-gram Feature Induction for Sentiment Analysis. International Conference of the German Society for Computational Linguistics and Language Technology (GSCL); 2013
F. Wogenstein, J. Drescher, D. Reinel, S. Rill, J. Scheidt. Evaluation of an Algorithm for Aspect-Based Opinion Mining Using a Lexicon-Based Approach. Proceedings of the 2nd International Workshop on Issues of Sentiment Discovery and Opinion Mining (WISDOM). ACM; 2013, DOI: 10.1145/2502069.2502074
M. Klenner, S. Clematide, S. Petrakis, and M. Luder. Compositional syntax-based phrase-level polarity annotation for german. In The 10th International Workshop on Treebanks and Linguistic Theories (TLT 2012), number 7/15 in Linguistic Issues in Language Technology, page online, Januar 2012.
Simon Clematide, Stefan Gindl, Manfred Klenner, Stefanos Petrakis, Robert Remus, Josef Ruppenhofer, Ulli Waltinger and Michael Wiegand: MLSA - A Multi-Layered Reference Corpus for German Sentiment Analysis. LREC 2012. 125_Paper1.pdf
S. Rill, J. Drescher, D. Reinel, J. Scheidt, F. Wogenstein. Particular Requirements on Opinion Mining for the Insurance Business. The Second International Conference on Advances in Information Mining and Management (IMMM); 2012
S. Rill, J. Drescher, D. Reinel, J. Scheidt, O. Schütz, F. Wogenstein, D. Simon. A Generic Approach to Generate Opinion Lists of Phrases for Opinion Mining Applications. Proceedings of the First International Workshop on Issues of Sentiment Discovery and Opinion Mining (WISDOM). ACM; 2012, DOI: 10.1145/2346676.2346683
S. Läubli, M. Schranz, U. Christen, and M. Klenner. Sentiment analysis for me- dia reputation research. In Natural Language Processing and Information Systems. 17th International Conference on Applications of Natural Language to Information Systems, Heidelberg, September 2012.
A list of other sentiment analysis research, focused on the German language, was started by Melanie Siegel and co-workers. If you know other papers which should be included in this list, please write a mail with bibliographic details.
Kasper, Walter; Vela, Mihaela. 2011. Sentiment Analysis for Hotel Reviews. http://www.dfki.de/lt/publication_show.php?id=5601. ISBN 978-83-60810-47-7. Proceedings of the Computational Linguistics-Applications Conference, S. 45-52. 8 S.
Schlagwörter: Opinion Mining, Hotellerie.
Abstract: Dieser Artikel gibt einen Überblick über das vom DFKI gestartete Projekt Besahot, welches als Explanative Bewertungsanalyse für die Saarländische Hotellerie implementiert wurde. Es sammelt Bewertungen aus verschiedenen Hotelbewertungsportalen und analysiert diese auf positive oder negative Polarität hin. Der Inhalt wird klassifiziert nach Kategorien (Service, Bad,…) dem Nutzer über ein Userinterface zur Verfügung gestellt. Im Einzelnen werden die verschiedenen Komponenten des System, wie Datenerhebung, Datenanalyse und Speicherung beschrieben. Schwerpunkt liegt dabei auf den zwei Analysemethoden: eine statistische Klassifikation, die mit 4-Gramen arbeitet und eine linguistische Informationsextraktion (basierend auf SProUT). Das System arbeitet mit einem eigens erstellten domänenspezifischen- und Sentiment Wörterbuch. Dadurch kann es nicht nur die Polarität der Bewertungssegmente errechnen, sondern auch die Aspekte auf die sich eine Meinungsäußerung bezieht.
Schönhalz, David.2011. Lernende Maschinen. Social Media Verlag. http://www.social-media-magazin.de/index.php/heft-03-2011/lernende-maschinen.html. ISBN 3-941835-10-6. Social Media Magazin Nr. 2011/3.
Schlagwörter : Opinion Mining.
Abstract: Der Artikel liefert eine Definition zu Sentimentanalyse und Opinion Mining im Allgemeinen und verschafft einen Überblick über die grundlegenden Methoden des Opinion Mining. Schönholz geht auf die Bestandteile des NLP-Verfahrens (Natural Language Processing) ein. Des Weiteren vorgestellt wird das wörterbuchbasierte Verfahren und das Machine-Learning-Verfahren, die für die Analyse und Klassifizierung der Dokumente bezüglich ihrer Tonalität als populärste Verfahren gelten. Bei den Machine-Learning-Verfahren handelt es sich um die "Naive-Bayes-Classification", die "Support Vector Machine (SVM)" und das "Maximum Entropy Model (ME)".
Kaiser, Carolin.2009. Opinion Mining im Web 2.0 - Konzept und Fallbeispiel. dpunkt. ISBN 978-3-89864-600-0. In: Knoll, Matthias; Meier, Andreas. Web. Data Mining. HMD, Heft 268
Schlagwörter: Opinion Mining, Text Mining, Produktmarketing
Abstract: In diesem Beitrag wird ein Opinion-Mining-Konzept vorgestellt, das durch den Einsatz von Text Mining eine automatisierte Extraktion, Aggregation und Analyse von Kundenmeinungen zu Produkten erlaubt. Somit können Stärken und Schwächen von Produkten erkannt und Ansatzpunkte für die Produktgestaltung und Verkaufsförderung gewonnen werden. Anwendung und Nutzen des Konzepts werden an einem Fallbeispiel der Automobilbranche aufgezeigt.10 S.
Kaiser, Carolin.2012. Business Intelligence 2.0: Knowledge-Based Services zur automatisierten Analyse der Meinungsbildung im Web 2.0. Gabler. http://www.wi2.uni-erlangen.de/research/research-projects-de/business-intelligence-2.0-de.html ISBN 978-3-8349-3989-0.
Schlagwörter: Business Intelligence, Opinion Mining.
Abstract: Das vorliegende Werk beschreibt klassische Elemente des Opinion Mining wie Identifikation und Analyse von Meinungen und Meinungsentwicklung. Zudem wird ein Tool zur Frühwarnung bei drohendem kippen der Meinungen in das vorgestellte Projekt integriert sowie zur Entscheidungsunterstützung. Einem Manager sollen Vorschläge zur richtigen Beeinflussungsmaßnahme der Meinungsbildung gemacht werden..
Aßmann, Stefanie.2010. Instrumente des Social-Media-Monitoring, Eine kritische Bestandsaufnahme. http://de.scribd.com/doc/37758351/53/Stimmungsanalyse.
Schlagwörter: Social Media, Webmonitoring, Opinion Mining .
Abstract: Hauptthema der Masterarbeit ist das Social Media Monitoring. Zu Beginn der Arbeit wird zunächst auf die Social Media Plattformen eingegangen. Im Kapitel 5.5 wird das Thema Stimmungsanalysen charakterisiert. Im weiteren Kapitel wird beschrieben was eine automatische Tonalität ist. Anschließend wird ein Stimmungsanalyse-System untersucht. 120 S.
Valerius, Peter.2012.Opinion Mining, Nutzung von Twitter als Meinungsquelle zur Vorhersage von Börsenkursen...http://kola.opus.hbz-nrw.de/volltexte/2012/802/pdf/Master_Thesis_Peter_Valerius.pdf.
Schlagwörter: Data Mining, Text Mining, Opinion Mining, Social Media, Twitter, Börse.
Abstract: Zunächst werden in dieser Masterarbeit wichtige Begriffe wie Data Mining, Web Mining, etc. definiert. Im Kapitel 2.2.5 wird auf das Thema „Opinion Mining“ eingegangen. Sehr interessant ist die Abbildung 3, auf der Seite 14. Diese Abbildung zeigt ein Opinion Mining Prozess. Auch auf das Thema „Sarkasmus Erkennung“ wird hier im Kapitel 3.5.1 näher eingegangen. Hauptteil der Arbeit ist das Kapitel 4. Hier geht der Verfasser auf die „Sentimentanalyse“ ein. Hierbei geht er unter anderem auf folgende Themen ein:
- Vorverarbeitung (Erster Schritt einer Sentimentanalyse)
- Semantikbasierte Ansatz (Vergleich von Worten, die im Text vorkommen mit einem Lexikon)
- Lernbasierter Ansatz (Textklassifikationsmethoden, Klassifikationsverfahren)
- Distanzmaße.103 S.
Kimmling, Ina.2010.Entwicklung eines Vorgehensmodells .http://kola.opus.hbznrw.de/frontdoor.php?source_opus=496&la=de.
Schlagwörter: Business Intelligence, Opinion Mining.
Abstract: Die vorliegende Masterarbeit entwickelt ein Vorgehensmodell zum Opinion Mining am Beispiel des iPhone 3G/3GS. Die theorethischen Grundlagen umfassen Blogs, Meinungsführerschaft in Sozialen Netzwerken, Online Foren und Bewertungsportale. Im Business Intelligence-Abschnitt werden Data Mining, Text Mining und Opinion Mining dargestellt. Der Hauptteil beschreibt die einzelnen Schritte zur Erstellung des Tools und dessen Anwendung einschließlich Folgen für Forschung und Praxis. 126 S.
Rill, Sven; Drescher, Johannes; Reinel, Dirk, Schleidt, Jörg; Schütz, Oliver; Wogenstein, Florian; Zicari, Roberto V.; Korfiatis, Nikolaos. 2012. A Phrase-Based Opinion List for the German Language. Eigenverlag ÖGAI..http://www.oegai.at/konvens2012/proceedings/46_rill12w/. ISBN 3-85027-005-X. In: Buchberger, Ernst; Jancsary, Jeremy. Schriftenreihe der Österreichischen Gesellschaft für Artificial Intelligence (ÖGAI), Band 5.
Schlagwörter: Opinion Mining, Lexikon, Deutsch.
Abstract: Im vorliegenden Konferenzbeitrag wurde das konkrete Vorgehen der Arbeitsgruppe zur Erstellung einer Sentiment Phrase List (SePL), also einer Liste von meinungstragenden deutschsprachigen Wörtern und Phrasen, beschrieben. ([1] Die Sentiment Phrase List habe ich bei der Gruppe angefordert und stelle sie gerne zur Verfügung.) Die Gruppe präsentiert eine Liste von deutschen Nomen und Adjektiven als auch von Adjektiv- und Nomen-basierten Phrasen, die alle eine Meinungsorientierung in sich tragen. Als Datengrundlage wurden die Sterne-Bewertungen und die zugehörigen Titel von Amazon- Kundenbewertungen herangezogen. Alle anderen user-generierten Inhalte, inklusive des Bewertungstextes an sich, wurden nicht genutzt. Titel und die quantitativen Sterne-Bewertungen werden als Zusammenfassung der Nutzerbewertungen angesehen. Es wird davon ausgegangen, dass die Opinion Words des Titels mit der Sterne-Bewertung miteinander stark korrelieren. Die Titel und Sterne-Bewertungen, welche somit die Datenbasis bilden, wurden zunächst von der deutschen Amazon-Webseite gecrawlt. Als Ergebnis erhielten sie ein Datenset von 1,16 Millionen Paaren von Titeln und Sterne-Bewertungen. Danach wurden Tokenisierung und Part-of-Speech-Tagging zur Vorverarbeitung angewandt. In einigen Fällen korrelierten die Sterne-Bewertung und die Polarität der Titel nicht, daher wurden Filter auf folgende Phänomene angewandt: Konjunktiv, Fragesätze, Emoticons und Anführungszeichen als Hinweis auf Ironie sowie Review-Titel mit Wörtern wie aber, jedoch, sondern usw. Alle diese Daten wurden aus dem Datenset entfernt. Da die Sentiment List meinungstragende deutschen Nomen und Adjektiven sowie Adjektiv- und Nomen-basierte Phrasen enthält wurden diese im nun folgenden Schritt extrahiert:
- Nomen: einzelnen Nomen oder einzelnes Nomen mit Ausrufezeichen, einzelnes Nomen mit Artikel und Ausrufezeichen, Nomen + eine Form von „sein“, Nomen + „mit“ oder „in“, Nomen mit einem folgenden „bei“
- Nomen-basierte meinungstragende Phrasen: einzelnes Nomen, Nomen und Adjektiv, Nomen mit einem oder mehreren Adverbien
- Adjektiv-basierte meinungstragende Phrasen: einzelne Adjektive; ein oder mehrere Adverbien/Adjektive, Partikel oder Partizip Perfekt und ein Adjektiv
Auf alle extrahierten Opinion Words wurde danach eine Lemmatisierung angewandt. Darauf folgend wurde eine Rechtschreibprüfung durchgeführt und alle falsch geschriebenen Worte wurden eliminiert. Ebenso wurden Titel mit zwei oder mehr Meinungsphrasen aus dem Datenset gelöscht. Nach den vorbereitenden Verarbeitungsschritten bestand das Datenset aus 42000 Review-Titeln und zugehörigen Bewertungen zwischen einem und fünf Sternen. Der Meinungswert (opinion value OV) wurde ermittelt indem die durchschnittliche Bewertung auf eine kontinuierliche Skala (mit Werten von -1 bis +1) angewandt wurde. Die Bewertung mit drei Sternen wird als neutral (Wert = 0) angesehen. Zusätzlich wurden zwei Qualitätswerte nämlich die Standardabweichung des opinion value und der Standard Fehler (Berechnung: Division der Standardabweichung durch die Quadratwurzel der Anzahl der Reviews, die diese Phrase enthalten) errechnet. Einige der Meinungswerte der opinion words waren nicht zufriedenstellend, da bei eigentlich neutralen Adjektiven der errechnete Wert in den positiven Bereich überging. Die Ursache hierfür ist, dass Online-Reviews oft die sog. „J-shaped distribution“ zeigen, also quantitative (Sterne-)Bewertungen eher im positiven Bereich liegen und so die eigentlich neutral ausformulierten Bewertungen nicht in der Mitte der Skala sondern bereits im positiven Bereich liegen. Die Sterne-Bewertung korrelierte also nicht mehr mit dem Meinungswert des Review-Titels. Daher wurde dieses Phänomen durch die Arbeitsgruppe rechnerisch korrigiert. Nach allen Verarbeitungsschritten ergab sich eine Liste von 3210 meinungstragenden Worten und Phrasen. Die Terme mit einem opinion value zwischen 0,33 und 0,67 bzw. zwischen -0,33 und -0.67 werden als schwach subjektiv klassifiziert. Die Werte darüber und darunter werden als stark positiv bzw. negativ angesehen. Als neutral werden die Wörter und Phrasen mit Meinungswerten zwischen -0,33 bis 0,33 angesehen.
Hammer, Timo. 2010. Opinion und Relationship Mining in sozialen Netzwerken: Extraktion von Meinungen und Beziehungen mittels Textmining und sozialer Netzwerkanalyse. VDM Verlag Dr. Müller. ISBN: 978-3639295191.
Schlagwörter: Marketing, Opinion Mining, Text Mining, Wirtschaftsinformatik, soziale Netzwerke.
Abstract: Tilo Hammer beschreibt in seinem Buch, dass das Internet bei der Bewertung und Analyse von Meinungen eine entscheidende Rolle spielt. Unternehmen können herausfinden, was Kunden von ihren Produkten halten und Privatpersonen können sich durch Erfahrungsberichte über die verschiedensten Dinge informieren. Er stellt außerdem ein System vor, welches Bewertungen mit Text Mining automatisch extrahiert. Meinungstrends werden mithilfe der sozialen Netzwerkanalyse identifiziert. 89 S.
Brambring, Dirk; Liu, Zhongde; Schirrmann, Frank-Michael; Stein, Stefan.2009.Weißt du wie viel Sternlein stehen? Opinion Mining - ein Ansatz zur semantischen Analyse von Rezessionen. URL: http://www.dhbw-mosbach.de/fileadmin/user/public/studienangebote/on/OpinionMining.pdf.
Schlagwörter: Opinion Mining, Amazon.
Abstract: Die Seminararbeit befasst sich mit der Bewertung von Rezensionen der Internetplattform Amazon, in diesem Fall speziell zu Büchern und Navigationsgeräten. Die Arbeit gliedert sich in acht Teile. Als erstes wird ein kurzer Überblick gegeben und auf die Tools GATE und RapidMiner eingegangen. Im Anschluss wird die Durchführung der Rezensionsanalyse detailliert und verständlich erläutert. Zum Schluss werden die Ergebnisse vorgestellt und ein Ausblick gegeben. Durch viele Grafiken und Tabellen kann man die Ergebnisse und Inhalte gut nachvollziehen. 19 S.
Sprejz, Michele. 2011. Extraktion und Klassifikation von bewerteten Produktfeatures auf Webseiten. URL: http://www.rn.inf.tu-dresden.de/uploads/Studentische_Arbeiten/Diplomarbeit_Sprejz_Mich%C3%A9le.pdf.
Abstract: Nirgendwo sonst als im Internet können positive und negative Erfahrungen schneller und weitläufiger ausgetauscht werden. Für heutige Unternehmen wird somit immer wichtiger vorhandene Meinungen von Kunden zu kennen, zu analysieren und zu überwachen, um schnellstmöglich auf einen negativen Ruf reagieren zu können. Da nahezu jeder Mensch in der Lage ist, seine Meinungen online aus-zudrücken – und dies auch tut – entsteht eine fast unendliche Masse an Daten, welche analysiert werden muss. Hier ist das manuelle Durchsuchen nicht mehr ausreichend und automatisierte Methoden werden benötigt. In der vorliegenden Arbeit wird ein solches Verfahren auf Eignung für die Klassifikation von Sätzen hinsichtlich ihrer Polarität überprüft. Ein Klassifikator aus dem Bereich des maschinellen Lernens wird mit unterschiedlichen Datensätzen und Einstellungen getestet und anschließend prototypisch in ein bestehendes Informationsextraktions-System integriert.
Weigl, Elisabeth. 2008. Emotionen in deutschen Texten. Ein quantitativer Ansatz mit GATE. URL: http://ebookbrowse.com/elisabeth-weigl-2008-emotionen-in-deutschen-texten-pdf-d55737635.
Schlagwörter: Text Mining, Emotion.
Abstract: Weigl untersucht in Ihrer Arbeit „Emotionen in deutschen Texten“ unter dem Kapitel „Sentiment Analysis und Opinion Mining wie sich die Sentiment Analyse zum Opinion Mining verhält, wie hier die Beziehungen zwischen den Begrifflichkeiten sind und wo hier Unterschiede gesehen werden können. Dem deutschen Sprachgebrauch zufolge sieht Weigl in der Sentiment Analyse einen Oberbegriff und stellt das Opinion Mining als eine Kategorie der Sentiment Analyse dar. Jedoch sei es schwierig hier klare Differenzen zu sehen. Zudem geht die Autorin näher auf die Bedeutung des Opinion Mining im Internetzeitalter und Onlineshopping ein, verdeutlicht näher die Motivation der Hersteller als auch der Konsumenten und gibt einen Überblick aus der technischen Sicht in der Sie die Analyse auf Dokumenten- und Satzebene beschreibt. Sie drückt aber auch deutlich aus, das aktuelle Fakten eher in Richtung Untersuchungen tendieren und keinesfalls heute schon ausgereifte Techniken sind. 36 S.
Böhnke, Andreas. Opinion Mining in der Marktforschung. URL: http://www.cogsys.wiai.uni-bamberg.de/teaching/ss11/sem_m2/KogSys_Seminararbeit_Andreas_Boehnke.pdf.
Schlagwörter: Opinion Mining, Text Mining, Wirtschaftsinformatik.
Abstract: Die Ausarbeitung befasst sich mit den Funktionen, die der maschinellen Verarbeitung natürlichsprachiger Texte zu Grunde liegen und erläutert drei zentrale Vorgehensweisen zur Meinungsextraktion: Sentiment Classification, Feature-Based Opinion Mining und Sentiment Analysis of Comparative Sentences. Darauf aufbauend werden anhand eines Fallbeispiels mit einem realen Produkt die einzelnen Prozessschritte abgehandelt und Komplikationen bei der Verwendung des Tools aufgedeckt. Als Tool wird das Programm RapidMiner des Herstellers Rapid-I verwendet. Grundlage sind Produktbewertungen von amazon.de, die mit Hilfe von RapidMinder extrahiert werden..23 S.
Scholz, Thomas.2013.Opinion Mining für verschiedene Webinhalte. LIT Verlag. URL: http://books.google.de/books?hl=de&lr=&id=jVLPAQAAQBAJ&oi=fnd&pg=PA11&dq=Opinion+Mining+f%C3%BCr+verschiedene+Webinhalte&ots=yBSsFA-L74&sig=QWYsqXj_-2ifRXbPwn_Qqqpb6gc#v=onepage&q=Opinion%20Mining%20f%C3%BCr%20verschiedene%20Webinhalte&f=false.978-3-643-11367-2. In: Scherfer, Konrad; Volpers, Helmut. Schriftenreihe Webwissenschaft: Methoden der Webwissenschaft, Teil 1.
Schlagwörter: Web Mining, Opinion Extraction, Automation.
Abstract: In diesem Buchbeitrag konzentriert sich Thomas Scholz auf die Relevanz von Webinhalten beim Opinion Mining. Der Fokus liegt hierbei auf Rezensionen, Online-Nachrichten und Posts in Sozialen Netzwerken.Scholz schildert die Problematiken bei der Extraktion einzelner Merkmale und annotierter Daten der einzelnen Webinhalte. Daraus resultierend werden Unterschiede in der Arbeit mit Webinhalten aufgezeigt, wie zum Beispiel in der Bildung der Tonalität. Um dies genauer zu beleuchten, werden die vier Phasen einer automatischen Meinungsanalyse betrachtet und anhand von Anwendungsbeispielen in der Praxis aufgezeigt. Der Beitrag hält erste ausgereifte Ansätze für die Einsetzbarkeit von Opinion Mining und die automatische Erfassung von Trends fest und dokumentiert die unterschiedlichen Ergebnisse der Untersuchungen bei den drei behandelten Webinhalten. 20 S.
Nerbonne, John [u.a.].1993. A diagnostic tool for German syntax. Springer Netherlands.Volume 8, Issue 1-2, pp 85-107. URL: http://rd.springer.com/article/10.1007/BF00981246">http://rd.springer.com/article/10.1007/BF00981246.0922-6567.
Schlagwörter: Machine Translation. Text Mining, Natural Language Processing, NLP, deutsche Sprache, Korpus.
Abstract: Nerbonne und Kollegen beschreiben in diesem Paper den fortdauernden Versuch einen Korpus zu erstellen, der die Deutsche Sprache korrekt in ihrer Syntax wiederspiegelt. Hinter dem Versuch steckt die Absicht, ein fehlerfreies NLP, Natural Language Processing, auch für deutsche Texte durchzuführen. Der Korpus enthält künstliche, wie systematische Ausdrücke und Phrasen, die in relationalen Datenbanken als annotierte Daten organisiert sind. Das Paper erklärt unteranderem die Notwendigkeit eines korrekten Korpus für den Prozess des NLP, nämlich zur Fehlerminimierung und beschreibt außerdem das Vorgehen bei der Erstellung des Korpus unter Bereitstellung von Beispielen. 22 S.
Osherenko, Alexander.2010.Opinion Mining and Lexical Affect Sensing. URL: http://scholar.google.de/scholar?q=opinion+mining+and+lexical+affect+sensing&btnG=&hl=de&as_sdt=0%2C5.
Schlagwörter: Emotionen, Text Mining, Opinion Mining, Korpus.
Abstract: Emotionen kontrollieren die menschliche Kommunikation - auf diesem Grundsatz untersucht Osherenko in seiner Doktorarbeit sogenannte „emotional Korpora“, Wortsammlungen, die vorwiegend Emotionsausdrücke und Phrasen enthalten, zur Verwendung für das Opinion Mining. Im Rahmen seiner Arbeit beschreibt er verschiedene Herangehensweisen um Texte als negativ bzw. positiv zu kategorisieren. Osherenko nennt neben einem statistischen Tool, welches unteranderem grammatikalische Informationen aus Texten extrahiert, auch eine semantische Methode, die in der Lage ist, tatsächliche Bedeutungen von Texten zu erschließen. Schließlich nennt er eine Kombination beider Werkzeuge, welches statistische und semantische Informationen auslesen kann. 273 S.
Scholz, Thomas; Conrad, Stefan.2013.Linguistic Sentiment Features for Newspaper Opinion Mining. Springer. URL: http://link.springer.com/chapter/10.1007/978-3-642-38824-8_24#page-1. ISBN: 978-3-642-38823-1. Natural Language Processing and Information Systems : Lecture Notes in Computer Science, Volume 7934.
Schlagwörter: Sentiment Analysis, Computerlinguistik.
Abstract: Der Artikel befasst sich mit verbreiteten Ansätzen der Sentiment Analyse. Es werden semantische Merkmale und deren Einfluss auf die Sentiment Analyse untersucht. Hierzu werden über 4000 deutsche Zeitungsartikel untersucht. Daran soll veranschaulicht werden, dass diese Analysetechnik den Prozess verbessern kann und linguistische Eigenschaften sehr nützlich für das Opinion Mining in Zeitungsartikeln sind. Für die Evaluation werden zwei verschiedene Datensätze genutzt: "pressrelations" und der "Finance"-Korpus. Die linguistischen Merkmale können in bereits bestehende Lösungen integriert werden und diese somit verbessern. 5 S.
Scholz, Thomas; Conrad, Stefan; Hillekamps, Lutz.2012.Opinion Mining on a German Corpus of a Media Response Analysis. Springer.URL: http://link.springer.com/chapter/10.1007/978-3-642-32790-2_4#page-1. Text, Speech and Dialogue : Lecture Notes in Computer Science, Volume 7499.
Schlagwörter: Sentiment Analysis, Meinungsextraktion.
Abstract: Mit Hilfe der Analyse von Medienechos in deutschen Zeitungsartikeln soll ein neuer Korpus erstellt werden: der "pressrelations"-Korpus. Um den "pressrelations"-Korpus zu erstellen, werden Zeitungsartikel durchsucht und je nach Relevanz in positive bzw. negative Tonalitäten oder Standpunkte eingeteilt. Der Korpus kann für verschiedene Bereiche des Opinion Mining genutzt werden: für die Sentimentanalyse, die Meinungsextraktion und zur Festlegung von Standpunkten. Zudem kann der Korpus für Sentiment-Wörterbücher verwendet werden.
Scholz, Thomas; Conrad, Stefan; Wolters, Isabel.2012.Comparing Different Methods for Opinion Mining in Newspaper Articles. Springer. URL: http://link.springer.com/chapter/10.1007/978-3-642-31178-9_31#page-1. ISBN: 978-3-642-31177-2. Bouma, Gosse; Ittoo, Ashwin; Métais, Elisabeth; Wortmann, Hans.
Schlagwörter: SentimentWortschatz, Sentiment Analysis, Opinion Mining, Meinungsextraktion.
Abstract: Wie der Titel schon verlauten lässt, handelt es sich in diesem Buchbeitrag um den Vergleich verschiedener Methoden zum Opinion Mining bei Zeitungsartikeln. Spezielle Verfahren des Opinion Mining werden mit der Sentimentanalyse von Produktbewertungen verglichen. Bei der Gegenüberstellung wird deutlich, dass die Methoden die auf Entropie und Informationsgewinnung basieren etwa 7 bis 9% bessere Ergebnisse liefern als SentiWS. Dies zeigt, dass spezielle Opinion-Mining-Verfahren wirkungsvoller für den Einsatz bei der Untersuchung von Zeitungsartikeln sind als wortbasierte Methoden und patterns. 6 S.
Shen, Chunze.2013. Korpus-basierte effiziente Informationsextraktion und Grammatikinduktion der natürlichen Sprachen. URL: http://geb.uni-giessen.de/geb/volltexte/2013/9925/pdf/ShenChunze_2013_07_11.pdf.
Schlagwörter: Computerlinguistik, Grammatik-Induktion, Korpus.
Abstract: Chunze Shen befasst sich in seiner Dissertation mit der zunehmenden Wichtigkeit von Grammatikinduktion (Erkennung syntaktischer Strukturen) in der Computerlinguistik. Zur Untersuchung von Texten wird versucht, kontextfreie Grammatik zu extrahieren und lokale Grammatik, die unmittelbar in der Nähe eines bestimmten Wortes oder einer Wortklasse vorkommt, zu induzieren. Diese lokale Grammatik kann für Informationsextraktion, automatische Übersetzung und lexikalische Disambiguierung verwendet werden.
Für die Extraktion der lokalen Grammatik wird ein neuer Korpus-basierter Ansatz getestet, der EDSI-Ansatz (Effiziente Destillation Syntaktischer Informationen). Um den Erfolg dieser Methode genauer zu beleuchten, wird sie in zwei verschiedenen Sprachen getestet, Englisch und Deutsch. Verglichen mit klassischen Ansätzen wie dem ABL-Ansatz (Alignment-Based Learning), erweist sich der EDSI-Ansatz als effizienter und liefert bessere Ergebnisse. 260 S.
Waltinger, Ulli.2010.GermanPolarityClues: A Lexical Resource for German Sentiment Analysis. URL: http://lexitron.nectec.or.th/public/LREC-2010_Malta/pdf/91_Paper.pdf. LREC Conferences.
Schlagwörter: Lexikalische Ressourcen, Sentimentanalyse, Text Mining.
Abstract: In diesem Artikel werden vier verschiedene englische und drei verschiedene deutsche Sentimentressourcen vergleichend evaluiert. Das Hauptaugenmerk liegt auf GermanPolarityClues, eine öffentliche lexikalische Ressource für die Sentimentanalyse deutscher Sprache. Diese Ressource wurde erstellt, indem eine semi-automatische Übersetzungsmethode und die manuelle Bewertung und Erweiterung von Polaritätsbasierten Merkmalen kombiniert wurden. Die auf Polarität basierenden Terme wurden auf positive, negative und neutrale Merkmale überprüft und aus den Texten extrahiert. Es wird festgestellt, dass eine Selektion basierend auf Polarität in Kombination mit SVM-basierten (Support Vector Machine) Methoden für beide Sprachen am besten funktionieren. Dennoch kann diese Arbeit nur als Einführung gesehen werden, da der erarbeitete Datensatz mit Hilfe weiterer Ressourcen und Wörterbüchern erweitert und verbessert werden soll. 5 S.
Romacker, Martin.2002.Ebenen der Semantikintegration im Textverstehenssystem SynDiKATe. URL: http://www.freidok.uni-freiburg.de/volltexte/409/.
Schlagwörter: Medizininformatik, Medical Language Processing, Text Mining, Textverstehenssysteme, Computerlinguistik , Semantik, semantische Interpretation.
Abstract: Diese Doktorarbeit von Romacker, entstanden im Bereich Computerlinguistik an der Universität Freiburg, behandelt die Problematik der semantischen Interpretation von Textverstehenssystemen. Zunächst stellt Romacker einige Textverstehenssysteme vor. Hierbei konzentriert er sich auf Systeme der Medizininformatik und definiert den Begriff des Medical Language Processing. Im Rahmen seiner Doktorarbeit legt er sich schließlich auf das System SynDiKATe fest, untersucht und evaluiert es. Im Verlauf der Arbeit geht er verstärkt auf die Probleme ein, die eine semantische Interpretation der Systeme mit sich bringt, so nennt er unteranderem die umfangreiche deutsche Grammatik als ausschlaggebenden Grund für ein geringfügiges semantisches Verständnis der Systeme von Texten, und die damit einhergehende schwache Performance. 292 S.
Schieber, Andreas; Heinrich, Kai; Hilbert, Andreas.2011.Analyse von Konsumentenmeinungen in Microblogs. URL: http://scholar.google.de/scholar?hl=de&q=Analyse+von+Konsumentenmeinungen+in+Microblogs&lr. Gesellschaft für Informatik. Impulse für die Forschung oder Impulse durch die Forschung: Entwicklungsperspektiven der BI-Forschung in Deutschland: S. 50 - 58.
Schlagwörter: Opinion Mining, Web 2.0, Microblogs.
Abstract: Dem Web 2.0 wird ein immer größer werdender Einfluss im 21. Jahrhundert zugesprochen. Viele Plattformen bilden eine hervorragende Fläche, um Meinungen zu Produkten und Dienstleistungen Kund zu tun und sogenanntes E-Commerce zu betreiben. Auf dieser These basiert das Paper von Schieber, Heinrich und Hilbert, die Kundenmeinungen in Microblogs mit Hilfe verschiedenster Verfahren analysieren, des Weiteren überprüft das Autorenteam die Übertragbarkeit auf Microblogs. Ziel ist hierbei, Meinungen zu identifizieren und zu clustern, um der Frage nach zu gehen, „was Konsumenten denken“. Als Datenquelle dient der Microblogdienst Twitter..
Schmidt, Anika.2014.Automatisierte Sentiment Analyse als betriebswirtschaftlicher Erfolgsfaktor. diploma...9,78384E+12.
Schlagwörter: Opinion Mining, Online Reputation, E-Commerce.
Abstract: In den vergangenen Jahren ist die Zahl der Onlinekäufe rapide angestiegen. Immer mehr Kunden informieren sich über das jeweilige Produkt und Onlinebewertungen sind für den Kauf bzw. Nichtkauf ausschlaggebend. Schmidt spricht in ihrer Diplomarbeit Onlinebewertungen eine hohe betriebswirtschaftliche Relevanz zu. Sie unterscheidet manuelle und automatisierte Verfahren zum Auslesen solcher Kundenmeinungen und legt Vorteile und Nachteile fest. Automatisierte Verfahren helfen Unternehmen schnell zu agieren und Nachteile, die ihnen beispielsweise durch negative Bewertungen entstehen, abzuwenden. Manuelle Verfahren hingegen kosten viel Zeit und Geld, sofern sie bei den immer größeren Datenmengen überhaupt möglich sind. Schmidt legt in ihrer Arbeit die automatische Sentiment Analyse als gewinnbringende Methode im betriebswirtschaftlichen Sektor fest, um z.B. Imageverlusten von Unternehmen vorzubeugen. 45 S.
Schmidt, Irina..SentiStrength. URL: http://www.uni-koblenz-landau.de/campus-koblenz/fb4/west/teaching/ss12/seminarir/material/ausarbeitung-sentistrength.pdf.
Schlagwörter: Opinion Mining, Sentiment Analyse, Emotionen, SentiStrength, Web 2.0, Social Media.
Abstract: Im Social Web werden verstärkt Nachrichten veröffentlicht, die Emotionen zum Ausdruck bringen. Das Filtern und Erkennen von emotionsgeladenen Beiträgen kann als erfolgreiche Grundlage für z.B. die sozialwissenschaftliche Forschung sein. Unteranderem kann sie zu der Erkenntnis führen, wie Geschlechter unterschiedlich agieren, wenn sie z.B. mit Verlusten umgehen müssen. Schmidt stellt in ihrer Arbeit verschiedene Ansätze vor, Emotionen aus Textdaten zu extrahieren. Neben einen Machine-Learning-Ansatz richtet sie ihr Hauptaugenmerk auf das Verfahren SentiStrength. Hierbei handelt es sich um einen wörterbuchbasierten Ansatz, der negative, wie positive Äußerungen erkennt. Im Rahmen ihrer Arbeit stellt Schmidt fest, dass sich dieser Ansatz vor allem für die Analyse von kurzen Texten anbietet und demnach gut im Bereich Social Media einsetzbar ist. 14 S.
Kaiser, Carolin.2008.Produkt Mining im Web 2.0.Gito. URL: http://books.google.de/books?hl=de&lr=&id=gBsGSG_ZkX0C&oi=fnd&pg=PA51&dq=Produkt-Mining+im+Web+2.0&ots=yexub-hC2x&sig=gs6Ya74_AXho9qBIHG9gp1_jbhM#v=onepage&q=Produkt-Mining%20im%20Web%202.0&f=false. ISBN: 978-3-940019-34-9. Bichler, Martin; Hess, Thomas; Krcmar, Helmut; Lechner, Ulrike; Matthes, Florian; Picot, Arnold; Speitkamp, Benjamin; Wolf, Petra.Multikonferenz Wirtschaftinformatik 2008, S. 229-240.
Schlagwörter: Mining, Produkt-Mining, Opinion-Mining, Wirtschaftinformatik, Kongress.
Abstract: Carolin Kaisers „Produkt-Mining im Web 2.0“ stellt ein automatisches Verfahren dar, mit dem Unternehmen detaillierte Kenntnisse über Kundenwünschen erwerben können. Hierbei werden Text Mining Verfahren genutzt, um aus den unstrukturierten Daten der Produkt-Reviews, mit den von den Kunden beschriebenen expliziten Charakteristika, strukturierte Daten zu extrahieren. Zur Klassifizierung von Wörtern und Polarität wird die Stützvektormethode angewandt. Die gewonnen Daten werden in der Aggregrationsphase verknüpft und zusammengeführt. So können Bewertungen einzelnen Produkteigenschaften zugeordnet werden und über verschiedene Benutzer hinaus in einer grafischen Darstellungen zusammengefasst werden. Abhängigkeiten einzelner Eigenschaften sollen per Assoziationsregeln kenntlich gemacht werden. Die herausgefilterten Beziehungen erlauben es, festzulegen welche Eigenschaften ausschlaggebend für eine positive oder negative Bewertung sind. Diese sind ein Ansatzpunkt für Produktentwicklung und -verbesserungen. .12 S.
Kaiser, Carolin; Kröckel, Johannes.2011.Meinungsanalyse in Onlinenetzwerken mittels Schwarmintelligenz.Springer. URL: http://link.springer.com/article/10.1007%2Fs00287-010-0444-4. Bode, Arndt.Informatik-Spektrum Vol. 34, 4/2011, S. 355-363.
Schlagwörter: Informatik, Opinion Mining.
Abstract: Der Artikel „Meinungsanalyse in Onlinenetzwerken mittels Schwarmintelligenz“ von Kaiser und Kröckel befasst sich mit Meinungsentwicklung durch Online-Communities. Ziel ist mittels Text-Mining und Algorithmen die Meinungen eines Nutzers vorherzusehen. Dazu werden bestehende Meinungen extrahiert und nach Polarität sortiert. Anschließend werden die Beziehungen des betrachteten Users analysiert. Als Beispiel dient die deutschsprachige Online-Gaming- Community GameStar.de. Die Ergebnisse zeigen, dass sich die verschiedenen Meinungen gegenseitig beeinflussen. Näher stehende Personen haben dabei einen größeren Einfluss als weiter Entfernte. Dabei tritt das Phänomen auf, dass bei eindeutig positiver Community - Einstellung das Individuum dazu neigt, die Gegenposition einzunehmen. .9 S.
Kaiser, Carolin.2011.Entscheidungsunterstützung zur Meinungsbeeinflussung in Webcommunitys.Gabler. URL: http://link.springer.com/article/10.1007%2FBF03340608. Print ISSN: 1436-3011, Online ISSN: 2198-2775. Fröschle, Hans-Peter.HMD Praxis der Wirtschaftsinformatik, 2011 Vol. 48, Nr. 4, S. 83-93.
Schlagwörter: Marketing, Computerwissenschaft, Opinion Mining.
Abstract: In „Entscheidungsunterstützung zur Meinungsbeeinflussung in Webcommunitys“ stellt Kaiser ein Frühwarnsystem für Marketingmanager vor. Die Meinungsentwicklung in Onlinenetzwerken soll beobachtet werden und daraus Vorschläge für Marketingmaßnahmen abgeleitet werden, um mit Stealth-Marketing-Methoden, wie die aktive Empfehlung von Produkten in Foren, anzuwenden. Mittels statistisch-linguistischer Analyse werden typische Attribute aufgedeckt, die eine Meinung als positiv, negativ oder neutral kennzeichnen. Dieser Vorgang geschieht vor und nach Durchführung eine empfohlenen Maßnahme, um deren Wirksamkeit zu testen. Die Maßnahmenempfehlung selbst wird durch Data Mining auf Grundlage von früher eingesetzten Methoden prognostiziert. Entscheidungsbäume stellen für jede Maßnahme das erwartete Ergebnis dar und jene mit positiven Output werden empfohlen. In einem Fallbeispiel zu Smartphones zeigte sich, dass Beeinflussung bei sachlichen Diskussionen erfolgreicher sind, als bei emotional geprägten. Die Grundstimmung der Diskussionsteilnehmer bestimmt das Ergebnis. Zuvor negativ gestimmte Teilnehmer waren nach der Maßnahme positiv gestimmter. Zuvor neutral oder positiv Eingestellte haben danach eher eine negative Meinung .11 S.
Kartal, Aliye; Doerfel, Stephan; Roßnagel, Alexander; Stumme, Gerd.2011.Privatsphären- und Datenschutz in Community-Plattformen. Gestaltung von Online-Bewertungsportalen.GI (Gesellschaft für Informatik). URL: http://www.user.tu-berlin.de/komm/CD/paper/090222.pdf
ISBN: 978-88579-286-4. Heiß, Hans-Ulrich; Pepper, Peter; Schlingloff, Holger, Schneider, Jörg. Informatik 2011.
Schlagwörter: Bewertungsportale, Community, Web 2.0 - Anwendungen, Datenschutzrecht, Meinungsfreiheit, Persönlichkeitsrecht.
Abstract: Die Projektgruppe Verfassungsverträgliche Technikgestaltung des IteG beschäftigt sich in diesem Werk mit rechtlichen Grundlagen in Bezug auf Informationsverarbeitung und Informationsdarstellung in Bewertungsportalen. Im Mittelpunkt steht das ineinandergreifende Gefüge aus Meinungsfreiheit, Persönlichkeitsrecht und Datenschutzrecht. Die untersuchten Portale forderten meist eine Anmeldung mit E-Mail Verifizierung, um eine Bewertung abgeben zu können. Für bestimmte Bewertungen ist eine fachliche Kompetenz notwendig. Mittels eines vorher festgelegten Kriterienkatalogs soll diese sichergestellt werden. Diese umzusetzen gestaltet sich als schwierig. Für die Bewertungen selbst gibt es verschiedene Designs in Form von Skalen, z.B. Sterne, oder Freitext. Bei einem skalenbasierten Bewertungssystem wird meist das arithmetische Mittel sichtbar angezeigt. Das erschwert die objektive Beurteilung der Bewertungen, weil sie je nach Verfasser unterschiedliche Gewichtungen haben sollten. Das erfordert wiederum personenbezogene Daten. Das rasant wachsende Angebot der Online-Communities macht eine fortwährende Anpassung der rechtlichen Rahmenbestimmungen nötig. 15 S.
Li, Hong; Cheng, Xiwen; Adson, Kristina; Kirshboim, Tal; Xu, Feiyu.2012.Annotating Opinions in German Political News. URL: http://www.lrec-conf.org/proceedings/lrec2012/pdf/640_Paper.pdf. LREC 2012, Istanbul.
Schlagwörter: Deutsche Politik, Opinion Mining, Nachrichten.
Abstract: In diesem Projekt ist ein annotierter Korpus für das Opinion Mining entstanden, bei dessen Dokumenten es sich um deutschsprachige Presseartikel zu politischen Themen handelt. Die Annotationen enthalten
-Subjekt der Meinungsäußerung
-Meinungsäußerung
-Englische Übersetzung der Meinungsäußerung
-Polarität
-Typ (context-dependent | context-independent)
-Intensität.
6 S.
Momtazi, Saeedeh.2012.Fine-grained German Sentiment Analysis on Social Media. URL: http://www.lrec-conf.org/proceedings/lrec2012/pdf/999_Paper.pdf. LREC 2012, Istanbul.
Schlagwörter: Opinion Mining, Deutsche Sprache, Social Media.
Abstract: In diesem Projekt ist ein Sentiment Lexicon für die deutsche Sprache entstanden , das 1864 Sentiment words enthält . Dafür wurde SentiStrength ( Thelwall et al . 2010 ) mit einer Übersetzungssoftware in die deutsche Sprache übersetzt und danach manuell von zwei Muttersprachlern nachbearbeitet..6 S.
Remus, Robert; Quasthoff, Uwe; Heyer, Gerhard.2010.SentiWS - a Publicly Available German-language Resource for Sentiment Analysis. URL: http://asv.informatik.uni-leipzig.de/publication/file/155/490_Paper.pdf. LREC 2010, Malta.
Schlagwörter: Opinion Mining, Deutsche Sprache.
Abstract: In diesem Projekt wurde SentimentWortschatz entwickelt , ein Sentiment Lexicon für die deutsche Sprache , das eine Liste von Termen , deren Polarität , POS und Flektionen enthält . Bei den Termen handelt es sich nicht nur um Adjektive und Adverbien , sondern auch um Nomen und Verben , die eine Polarität enthalten . Als Quellen für das Lexikon wurde eine deutsche Übersetzung des General Inquirer (Stone et al. 1966), eine Kookkurrenz-Analyse einer Liste von manuell annotierten Kundenrezensionen und der German Collocation Dictionary ( Quasthoff 2010) genutzt. 4 S.
Schmid, Helmut.1995.Improvements in Part-of-Speech Tagging with an Application to German. URL: http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger2.pdf. ACL SIGDAT-Workshop 1995, Dublin.
Schlagwörter: Opinion Mining, Deutsche Sprache, POS Tagging.
Abstract: Schmid stellt seinen POS Tagger TreeTagger vor , der auf dem M arkov Modell basiert . Durch spezifische Erweiterungen schaffte er es , ihn für die deutsche Sprache einzusetzen , ohne eine Vielzahl an Parametern oder eine extrem große Anzahl an Trainigsdaten zu benötigen, wie dies bei ähnlichen Markov Modell-Adaptionen für die deutsche Sprache bisher üblich war, und dennoch zu guten Ergebnissen zu kommen. 9 S.
Kalisch, Florian.2012.Opinion Mining. Eine Einführung in den Themenkomplex. URL: http://www.floriankalisch.de/projects/om/Paper-Opinion-Mining.pdf.
Schlagwörter: Data Mining, Text Mining, Opinion Mining
Abstract: Kalisch beschreibt in seiner Einführung in das Thema Opinion Mining grundsätzliche Methoden und gibt einen glossarartigen Überblick über die wichtigsten Begriffe. Die Verzahnung der angrenzenden Themengebiete der Computerlinguistik, des Text Mining und des Data Mining werden hervorgehoben. Der Hauptteil befasst sich mit der Sentiment Analyse. Folgend wird ein selbsterstellter, englischsprachiger Prototyp für ein Opinion Mining - Tool vorgestellt, welcher die angesprochenen Theoriegrundlagen am Beispiel verdeutlichen sollen. XI, 33 S.
Schönhalz, David.2010.Opinion Mining und Sentiment-Analyse im Web 2.0 : Interview mit dem Informationswissenschaftler David Schönhalz. Social Media Verlag. URL: http://www.social-media-magazin.de/index.php/inhalt/opinion-mining-und-sentiment-analyse-im-web-20.html. Social Media Magazin, Nr. 2010-03.
Schlagwörter: Opinion Mining, Sentimentanalyse, Social Media, Marktforschung, Trendanalyse.
Abstract: Im Interview berichtet David Schönhalz von der Wichtigkeit des Opinion Mining im Bereich Social Media. Unter anderem geht er auf den Einfluss und die Wichtigkeit von Social Networks für Unternehmen und Marktforschung mittels Trendanalysen ein. Im Fokus steht die automatische Sentimentanalyse, die noch immer eine Herausforderung bei der Ermittlung von Meinungen darstellt. Es werden Definitionen zu diesen Aspekten geliefert und Fortschritte im Bereich der Sentimentanalyse erläutert, die die Unverzichtbarkeit von intellektuellen Auswertungen aufzeigen..
Kasper, Harriet; Dausinger, Moritz; Kett, Holger; Renner, Thomas.2010. Marktstudie Social Media Monitoring Tools, IT -Lösungen zur Beobachtung und Analyse unternehmensstrategisch relevanter Informationen im Internet. Fraunhofer Verlag, Fraunhofer-Informationszentrum Raum und Bau IRB. URL: http://wiki.iao.fraunhofer.de/index.php/Marktstudie:_Social_Media_Monitoring_Tools.978-3-8396-0194-5. Fraunhofer-Institut für Arbeitswirtschaft und Organisation.
Schlagwörter: Social Media Monitoring, Tonalitätsanalyse, Opinion Mining.
Abstract: Die vom Fraunhofer-Institut für Arbeitswirtschaft und Organisation (IAO) durchgeführte Marktstudie für Social Media Monitoring Tools stammt aus dem Jahr 2010. Ziel der Studie ist die Schaffung eines Überblicks über das zu diesem Zeitpunkt bestehende Angebot an IT-gestützten Lösungen zur Identifikation, zum Monitoring und zur Analyse unternehmensbezogener Daten im (Social) Web. Neben einer fundierten Einführung in die Anwendungsfelder von Social Media Monitoring Tools sowie deren grundsätzliche Merkmale werden 20 am Markt verfügbare Software-Lösungen in ausführlichen Produktprofilen vorgestellt. Dabei werden sowohl kostenpflichtige als auch kostenfreie Tools berücksichtigt. Aus den Produktprofilen gehen neben detaillierten Herstellerinformationen insbesondere Informationen über den Funktionsumfang der jeweiligen Software-Produkte hervor. Betrachtet werden u. a. Möglichkeiten zur Anbindung von relevanten Datenquellen, Such- und Speicherfunktionen, Analysemöglichkeiten, Filterfunktionen, Möglichkeiten zur Relevanzbewertung, Funktionen für Häufigkeits-, Demographie-/Profiling- und Tonalitätsanalyse sowie Integrationsmöglichkeiten mit anderen Softwareprodukten. 146 S.
Klinger, Roman, Cimiano, Phillip.2014.The USAGE review corpus for fine-grained, multi-lingual opinion analysis. URL: http://pub.uni-bielefeld.de/download/2664218/2669583
Schlagwörter: Corpora, Opinion Mining, Sentimentanalyse, Produktreviews.
Abstract: Cimiano und Klinger stellen in dem Paper den am Center of Excellence Cognitive Interaction Technology (CITEC) in der Arbeitsgruppe Semantische Datenbanken und Wissensverarbeitung entwickelten Bielefeld University Sentiment Analysis Corpus for German and English (USAGE) vor. Der Corpus basiert auf 622 englisch- und 611 deutschsprachigen Produktbewertungen acht verschiedener Produktkategorien der Verkaufsplattform Amazon. Das Paper erläutert zum einen die im Rahmen der Corpus-Erstellung angewendete Methodik zur manuellen Annotation der insgesamt 1233 Produktreviews. Zum anderen werden statistische Auswertungen bezüglich der genutzten Entitäten „aspects“ (Aspekte) und „evaluative (subjective) phrases“ (Sentimentausdrücke) bereitgestellt. Der Corpus USAGE steht der wissenschaftlichen Öffentlichkeit zur Verfügung. 8 S.
Steinberger, Josef et. al; Vazquez, Silivia.2012.Creating Sentiment Dictionaries via Triangulation. URL: http://publications.jrc.ec.europa.eu/repository/handle/111111111/26852. 0167-9236 (ISSN). Elsevier Science BV.
Schlagwörter: Opinion Mining, Corpora, Sentimentanalyse.
Abstract: Im Zentrum des Papers steht die Erstellung vergleichbarer, multilingualer Sentiment-Wörterbücher unter Nutzung von Triangulationsmethoden mit dem Ziel, die Verfolgung und Analyse von im Internet verfügbaren Nachrichten aus Sicht des Opinion Mining über Sprachgrenzen hinweg zu ermöglichen. Die Autoren adressieren mit ihrer Arbeit den Umstand, dass zum aktuellen Zeitpunkt nur für die englische Sprache umfassende Sentiment-Wörterbücher verfügbar sind. Basierend auf den englischsprachigen Wörterbüchern MicroWNOp (Cerini et al., 2007) sowie JRC Tonality Dictionary (Balahur 2009) wurde daher ein neues englischsprachiges Dictionary entwickelt, ins Spanische übertragen und manuell weiterbearbeitet. Eine Erweiterung der Sentiment-Termzahl wurde durch Einsatz des sprachunabhängig einsetzbaren Algorithmus zur Termextraktion, Ontopopulis, erreicht. Durch weitere Triangulationsprozesse und manuelle Weiterbearbeitungen wurden Wörterbücher in Tchechisch, Französisch, Deutsch, Italienisch und Russisch erstellt, deren Qualität analysiert wurde..9 S.
Clematide, Simon; Gindl, Stefan; Klenner, Manfred; Petrakis, Stefanus; Remus, Robert.; Ruppenhofer, Josef; Waltinger, Ulli; Wiegand, Michael. 2012. MLSA – A Multi-layered Reference Corpus for German Sentiment Analysis. URL: http://www.lrec-conf.org/proceedings/lrec2012/pdf/125_Paper.pdf. ISBN: 978-2-9517408-7-7. European Language Resources Association.
Schlagwörter: Sentimentanalyse, Opinion Mining, Corpus.
Abstract: In dem Paper wird das deutschsprachige Sentiment-Wörterbuch MLSA vorgestellt. Das Wörterbuch basiert auf insgesamt 270 deutschen Sätzen, die dem DeWaC Corpus (Baroni et al., 2009) unter Nutzung des Polaritätslexikons von Clematide und Klenner (2010) entnommen wurden. Die ausgewählten Sätze wurden von den Autoren auf drei unterschiedlichen Ebenen (Satz, Wort/Phrase und Ausdruck) manuell annotiert. Das Verfahren zur Erstellung des Corpus wird anhand vieler Beispiele ausführlich dargestellt. Der MLSA-Corpus wurde der wissenschaftlichen Öffentlichkeit zur Verfügung gestellt. 6 S.
Declerck, Thierry; Krieger, Hans Ulrich. 2014. Harmonization of German Lexical Resources for Opinion Mining. URL: http://www.lrec-conf.org/proceedings/lrec2014/index.html ISBN: 978-2-9517408-8-4.
Schlagwörter: Sentimentanalyse, Corpora.
Abstract: Das Paper stellt einen Teilbereich des europäischen Projekts TrendMiner vor, der sich mit der Zusammenführung und Vereinheitlichung von vier bereits existierenden, deutschsprachigen Sentiment-Wörterbüchern beschäftigt. Ziel in diesem ersten Schritt des Vorhabens ist die Schaffung einer einheitlichen, deutschsprachigen Sentiment-Lexikonressource. Das Vorgehen bei der Zusammenführung der verschiedenen Datenbestände wird anhand von Beispielen anschaulich beschrieben. In einem weiteren Projektschritt ist die Integration zweier deutschsprachiger Sentiment-Corpora vorgesehen. 5 S.
Jakob, Niklas. 2011 .Extracting Opinion Targets from User-Generated Discourse with an Application to Recommendation Systems, Dissertation. URL: http://tuprints.ulb.tu-darmstadt.de/2609/1/Diss.pdf">http://tuprints.ulb.tu-darmstadt.de/2609/1/Diss.pdf.
Schlagwörter: Opinion Mining, Sentimentanalyse.
Abstract: Jakob analysiert in seiner Dissertation zunächst den Stand der Forschung im Bereich des Opinion Mining. Die Darstellung der Vorgehensweise und Ergebnisse einer vergleichenden Studie zu den unüberwachten Verfahren Association Mining sowie Likelihood Ratio Test zur Extraktion von Meinungszielen aus Kundenrezensionen unterschiedlicher Produkttypen sowie die Evaluation des überwachten als State-of-the-Art-Algorithmus eingestuften Algorithmus von Zhuang stellen zentrale Themen der Arbeit dar. Weiterhin wird ein auf Conditional Random Fields (CRF)-basierender Algorithmus vorgestellt und evaluiert. Ein Ansatz zur Integration eines Anaphernalgorithmus in ein überwachtes System zur Extraktion von Meinungen wird außerdem vorgestellt. Die Arbeit schließt mit einer Darlegung möglicher Optimierungen von Anwendungen wie Empfehlungssystemen durch Integration von meinungsextrahierenden Systemen..152 S.
Brester, Christina; Minker, Wolfgang; Semenkin, Eugene; Sidorov, Maxim. 2014. Speech-Based Emotion Recognition: Feature Selection by Self-Adaptive Multi-Criteria Genetic Algorithm. URL: http://www.lrec-conf.org/proceedings/lrec2014/pdf/341_Paper.pdf. ISBN: 978-2-9517408-8-4.
Schlagwörter: Sprachanalyse, Sentimentanalyse, Opinion Mining.
Abstract: Das Paper beschäftigt sich mit einem besonderen Anwendungsfall des Opinion Mining. Kern ist die Analyse gesprochener Worte hinsichtlich menschlicher Emotionen. Mit Hilfe geeigneter Verfahren zur Erkennung von Gefühlen in gesprochenen Texten sehen die Autoren des Papers die Chance zur Verbesserung von zum Beispiel Spoken Dialogue Systems (SDS) oder von Call Center-Applikationen. Das Paper stellt einen MOGA (multi-objective genetic algorithm)-basierten Ansatz zur Optimierung der Erkennung von Emotionen vor. Als Corpora dienten insgesamt drei Sprachdatenbanken mit Texten in englischer und deutscher Sprache. Für die deutsche Sprache wurden die Datenbasen Berlin und VAM genutzt, für englische Texte der Corpus SAVEE. Die Corpora stellten zusammen sowohl Sprachaufzeichnungen aus realen Situationen als auch künstlich erzeugte Aufnahmen bereit. Mit Hilfe des MOGA-Ansatzes konnte eine Verbesserung der Emotionserkennung in gesprochenen Texten belegt werden..5 S.
Boland, Katarina; Wira-Alam, Andias; Messerschmidt, Reinhard. 2013. Creating an Annotated Corpus for Sentiment Analysis of German Product Reviews. URL: http://www.ssoar.info/ssoar/bitstream/handle/document/33939/ssoar-2013-boland_et_al-Creating_an_Annotated_Corpus_for.pdf?sequence. GESIS - Leibniz-Institut für Sozialwissenschaften.
Schlagwörter: Opinion Mining, Sentiment Lexikon, Sentimentanalyse.
Abstract: Die Autoren des Forschungsberichts legen das Vorgehen bei der Erstellung eines annotierten Corpus zur Sentiment-Analyse von deutschsprachigen Produktbewertungen dar. Angestrebt wurde ein Corpus, der Produkttyp-übergreifend (domänenunabhängig) ist. Ausgangspunkt war dabei die Erkenntnis, dass die Art der Emotionsäußerungen in Produktbewertungen zwischen verschiedenen Produkttypen erheblich abweicht. Darin sehen die Autoren für die Entwicklung und Optimierung von Algorithmen zur Sentiment-Analyse eine Herausforderung. Zur Erstellung eines Produkttyp-übergreifenden Corpus wurden insgesamt 63.067 Sätze aus deutschsprachigen Produktbewertungen sechs verschiedener Produkttypen bei Amazon extrahiert und von Annotatoren auf Basis einheitlicher Richtlinien bearbeitet. Der resultierende Corpus soll zum Beispiel dem Vergleich von Eigenheiten bei emotionalen Äußerungen in Produktbewertungen unterschiedlicher Produktarten sowie der Bewertung von Algorithmen bei Einsatz in unterschiedlichen Domänen (Produkttyp-Bewertungen) dienen. 16 S.
Balahur, Alexandra; Turchi, Marco; Steinberger, Ralf; Perea-Ortega Jose-Manuel; Jacquet, Guillaume; Kücük, Dilek; Zavarella, Vanni; El Ghali, Adil. 2014. Resource Creation and Evaluation for Multilingual Sentiment Analysis in Social Media Texts. URL: http://www.lrec-conf.org/proceedings/lrec2014/pdf/965_Paper.pdf.
Schlagwörter: Opinion Mining, Sentimentanalyse.
Abstract: Das Paper beschäftigt sich mit der Bewertung des Einsatzes automatischer Sprachübersetzungsverfahren zur Generierung von Testdaten zum Training multilingualer Sentiment-Classifier. Untersuchungsgegenstand waren die Sprachen Türkisch, Italienisch, Spanisch, Deutsch und Französisch. Die Evaluation zeigt, dass maschinelle und manuelle Übersetzungen von Originaltexten bei der Sentiment-Klassifizierung ähnliche Ergebnisse liefern. Weiterhin wird deutlich, dass schon die Nutzung geringer Anteile von annotierten Originaltexten zusätzlich zu übersetzten Daten zu einer weiteren Steigerung der Güte der Sentiment-Klassifizierung führt. 5 S.