Publications

The following publications related to German sentiment analysis are written by members of the IGGSA:





A list of other sentiment analysis research, focused on the German language, was started by Melanie Siegel and co-workers. If you know other papers which should be included in this list, please write a mail with bibliographic details.

Kasper, Walter; Vela, Mihaela. 2011. Sentiment Analysis for Hotel Reviews. http://www.dfki.de/lt/publication_show.php?id=5601. ISBN 978-83-60810-47-7. Proceedings of the Computational Linguistics-Applications Conference, S. 45-52. 8 S.

Schlagwörter: Opinion Mining, Hotellerie.

Abstract: Dieser Artikel gibt einen Überblick über das vom DFKI gestartete Projekt Besahot, welches als Explanative Bewertungsanalyse für die Saarländische Hotellerie implementiert wurde. Es sammelt Bewertungen aus verschiedenen Hotelbewertungsportalen und analysiert diese auf positive oder negative Polarität hin. Der Inhalt wird klassifiziert nach Kategorien (Service, Bad,…) dem Nutzer über ein Userinterface zur Verfügung gestellt. Im Einzelnen werden die verschiedenen Komponenten des System, wie Datenerhebung, Datenanalyse und Speicherung beschrieben. Schwerpunkt liegt dabei auf den zwei Analysemethoden: eine statistische Klassifikation, die mit 4-Gramen arbeitet und eine linguistische Informationsextraktion (basierend auf SProUT). Das System arbeitet mit einem eigens erstellten domänenspezifischen- und Sentiment Wörterbuch. Dadurch kann es nicht nur die Polarität der Bewertungssegmente errechnen, sondern auch die Aspekte auf die sich eine Meinungsäußerung bezieht.

Schönhalz, David.2011. Lernende Maschinen. Social Media Verlag. http://www.social-media-magazin.de/index.php/heft-03-2011/lernende-maschinen.html. ISBN 3-941835-10-6. Social Media Magazin Nr. 2011/3.

Schlagwörter : Opinion Mining.

Abstract: Der Artikel liefert eine Definition zu Sentimentanalyse und Opinion Mining im Allgemeinen und verschafft einen Überblick über die grundlegenden Methoden des Opinion Mining. Schönholz geht auf die Bestandteile des NLP-Verfahrens (Natural Language Processing) ein. Des Weiteren vorgestellt wird das wörterbuchbasierte Verfahren und das Machine-Learning-Verfahren, die für die Analyse und Klassifizierung der Dokumente bezüglich ihrer Tonalität als populärste Verfahren gelten. Bei den Machine-Learning-Verfahren handelt es sich um die "Naive-Bayes-Classification", die "Support Vector Machine (SVM)" und das "Maximum Entropy Model (ME)".

Kaiser, Carolin.2009. Opinion Mining im Web 2.0 - Konzept und Fallbeispiel. dpunkt. ISBN 978-3-89864-600-0. In: Knoll, Matthias; Meier, Andreas. Web. Data Mining. HMD, Heft 268

Schlagwörter: Opinion Mining, Text Mining, Produktmarketing

Abstract: In diesem Beitrag wird ein Opinion-Mining-Konzept vorgestellt, das durch den Einsatz von Text Mining eine automatisierte Extraktion, Aggregation und Analyse von Kundenmeinungen zu Produkten erlaubt. Somit können Stärken und Schwächen von Produkten erkannt und Ansatzpunkte für die Produktgestaltung und Verkaufsförderung gewonnen werden. Anwendung  und Nutzen des Konzepts werden an einem Fallbeispiel der  Automobilbranche aufgezeigt.10 S.

Kaiser, Carolin.2012. Business Intelligence 2.0: Knowledge-Based Services zur automatisierten Analyse der Meinungsbildung im Web 2.0. Gabler. http://www.wi2.uni-erlangen.de/research/research-projects-de/business-intelligence-2.0-de.html ISBN 978-3-8349-3989-0.

Schlagwörter: Business Intelligence, Opinion Mining.

Abstract: Das vorliegende Werk beschreibt klassische Elemente des Opinion Mining wie Identifikation und Analyse von Meinungen und Meinungsentwicklung. Zudem wird ein Tool zur Frühwarnung bei drohendem kippen der Meinungen in das vorgestellte Projekt integriert sowie zur Entscheidungsunterstützung. Einem Manager sollen Vorschläge zur richtigen Beeinflussungsmaßnahme der Meinungsbildung gemacht werden..

Aßmann, Stefanie.2010. Instrumente des Social-Media-Monitoring, Eine kritische Bestandsaufnahme. http://de.scribd.com/doc/37758351/53/Stimmungsanalyse.

Schlagwörter: Social Media, Webmonitoring, Opinion  Mining .

Abstract: Hauptthema der Masterarbeit ist das Social Media Monitoring. Zu Beginn der Arbeit wird zunächst auf die Social Media Plattformen eingegangen. Im Kapitel 5.5 wird das Thema Stimmungsanalysen charakterisiert. Im weiteren Kapitel wird beschrieben was eine automatische Tonalität ist. Anschließend wird ein Stimmungsanalyse-System untersucht. 120 S.

Valerius, Peter.2012.Opinion Mining, Nutzung von Twitter als Meinungsquelle zur Vorhersage von Börsenkursen...http://kola.opus.hbz-nrw.de/volltexte/2012/802/pdf/Master_Thesis_Peter_Valerius.pdf.

Schlagwörter: Data Mining, Text Mining, Opinion Mining, Social Media, Twitter, Börse.

Abstract: Zunächst werden in dieser Masterarbeit wichtige Begriffe wie Data Mining, Web Mining, etc. definiert. Im Kapitel 2.2.5 wird auf das Thema „Opinion Mining“ eingegangen. Sehr interessant ist die Abbildung 3, auf der Seite 14. Diese Abbildung zeigt ein Opinion Mining Prozess. Auch auf das Thema „Sarkasmus Erkennung“ wird hier im Kapitel 3.5.1 näher eingegangen. Hauptteil der Arbeit ist das Kapitel 4. Hier geht der Verfasser auf die „Sentimentanalyse“ ein. Hierbei geht er unter anderem auf folgende Themen ein:

- Vorverarbeitung (Erster Schritt einer Sentimentanalyse)

- Semantikbasierte Ansatz (Vergleich von Worten, die im Text vorkommen mit einem Lexikon)

- Lernbasierter Ansatz (Textklassifikationsmethoden, Klassifikationsverfahren)

- Distanzmaße.103 S.

Kimmling, Ina.2010.Entwicklung eines Vorgehensmodells .http://kola.opus.hbznrw.de/frontdoor.php?source_opus=496&la=de.

Schlagwörter: Business Intelligence, Opinion Mining.

Abstract: Die vorliegende Masterarbeit entwickelt ein Vorgehensmodell zum Opinion Mining am Beispiel des iPhone 3G/3GS. Die theorethischen Grundlagen umfassen Blogs, Meinungsführerschaft in Sozialen Netzwerken, Online Foren und Bewertungsportale. Im Business Intelligence-Abschnitt werden Data Mining, Text Mining und Opinion Mining dargestellt. Der Hauptteil beschreibt die einzelnen Schritte zur Erstellung des Tools und dessen Anwendung einschließlich Folgen für Forschung und Praxis. 126 S.

Rill, Sven; Drescher, Johannes; Reinel, Dirk, Schleidt, Jörg; Schütz, Oliver;  Wogenstein, Florian; Zicari, Roberto V.; Korfiatis, Nikolaos. 2012. A Phrase-Based Opinion List for the German Language. Eigenverlag ÖGAI..http://www.oegai.at/konvens2012/proceedings/46_rill12w/. ISBN 3-85027-005-X. In: Buchberger, Ernst; Jancsary, Jeremy. Schriftenreihe der Österreichischen Gesellschaft für Artificial Intelligence (ÖGAI), Band 5.

Schlagwörter: Opinion Mining, Lexikon, Deutsch.

Abstract: Im vorliegenden Konferenzbeitrag wurde das konkrete Vorgehen der Arbeitsgruppe zur Erstellung einer Sentiment Phrase List (SePL), also einer Liste von meinungstragenden deutschsprachigen Wörtern und Phrasen, beschrieben. ([1] Die Sentiment Phrase List habe ich bei der Gruppe angefordert und stelle sie gerne zur Verfügung.) Die Gruppe präsentiert eine Liste von deutschen Nomen und Adjektiven als auch von Adjektiv- und Nomen-basierten Phrasen, die alle eine Meinungsorientierung in sich tragen. Als Datengrundlage wurden die Sterne-Bewertungen und die zugehörigen Titel von Amazon- Kundenbewertungen herangezogen. Alle anderen user-generierten Inhalte, inklusive des Bewertungstextes an sich, wurden nicht genutzt. Titel und die quantitativen Sterne-Bewertungen werden als Zusammenfassung der Nutzerbewertungen angesehen. Es wird davon ausgegangen, dass die Opinion Words des Titels mit der Sterne-Bewertung miteinander stark korrelieren. Die Titel und Sterne-Bewertungen, welche somit die Datenbasis bilden, wurden zunächst von der deutschen Amazon-Webseite gecrawlt. Als Ergebnis erhielten sie ein Datenset von 1,16 Millionen Paaren von Titeln und Sterne-Bewertungen. Danach wurden Tokenisierung und Part-of-Speech-Tagging zur Vorverarbeitung angewandt. In einigen Fällen korrelierten die Sterne-Bewertung und die Polarität der Titel nicht, daher wurden Filter auf folgende Phänomene angewandt: Konjunktiv, Fragesätze, Emoticons und Anführungszeichen als Hinweis auf Ironie sowie Review-Titel mit Wörtern wie aber, jedoch, sondern usw. Alle diese Daten wurden aus dem Datenset entfernt. Da die Sentiment List meinungstragende deutschen Nomen und Adjektiven sowie Adjektiv- und Nomen-basierte Phrasen enthält wurden diese im nun folgenden Schritt extrahiert:

- Nomen: einzelnen Nomen oder einzelnes Nomen mit Ausrufezeichen, einzelnes Nomen mit Artikel und Ausrufezeichen, Nomen + eine Form von „sein“, Nomen + „mit“ oder „in“, Nomen mit einem folgenden „bei“

- Nomen-basierte meinungstragende Phrasen: einzelnes Nomen, Nomen und Adjektiv, Nomen mit einem oder mehreren Adverbien

- Adjektiv-basierte meinungstragende Phrasen: einzelne Adjektive; ein oder mehrere Adverbien/Adjektive, Partikel oder Partizip Perfekt und ein Adjektiv

Auf alle extrahierten Opinion Words wurde danach eine Lemmatisierung angewandt. Darauf folgend wurde eine Rechtschreibprüfung durchgeführt und alle falsch geschriebenen Worte wurden eliminiert. Ebenso wurden Titel mit zwei oder mehr Meinungsphrasen aus dem Datenset gelöscht. Nach den vorbereitenden Verarbeitungsschritten bestand das Datenset aus 42000 Review-Titeln und zugehörigen Bewertungen zwischen einem und fünf Sternen. Der Meinungswert (opinion value OV) wurde ermittelt indem die durchschnittliche Bewertung auf eine kontinuierliche Skala (mit Werten von -1 bis +1) angewandt wurde. Die Bewertung mit drei Sternen wird als neutral (Wert = 0) angesehen. Zusätzlich wurden zwei Qualitätswerte nämlich die Standardabweichung des opinion value und der Standard Fehler (Berechnung: Division der Standardabweichung durch die Quadratwurzel der Anzahl der Reviews, die diese Phrase enthalten) errechnet. Einige der Meinungswerte der opinion words waren nicht zufriedenstellend, da bei eigentlich neutralen Adjektiven der errechnete Wert in den positiven Bereich überging. Die Ursache hierfür ist, dass Online-Reviews oft die sog. „J-shaped distribution“ zeigen, also quantitative (Sterne-)Bewertungen eher im positiven Bereich liegen und so die eigentlich neutral ausformulierten Bewertungen nicht in der Mitte der Skala sondern bereits im positiven Bereich liegen. Die Sterne-Bewertung korrelierte also nicht mehr mit dem Meinungswert des Review-Titels. Daher wurde dieses Phänomen durch die Arbeitsgruppe rechnerisch korrigiert. Nach allen Verarbeitungsschritten ergab sich eine Liste von 3210 meinungstragenden Worten und Phrasen. Die Terme mit einem opinion value zwischen 0,33 und 0,67 bzw. zwischen -0,33 und -0.67 werden als schwach subjektiv klassifiziert. Die Werte darüber und darunter werden als stark positiv bzw. negativ angesehen. Als neutral werden die Wörter und Phrasen mit Meinungswerten zwischen -0,33 bis 0,33 angesehen.

Hammer, Timo. 2010. Opinion und Relationship Mining in sozialen Netzwerken: Extraktion von Meinungen und Beziehungen mittels Textmining und sozialer Netzwerkanalyse. VDM Verlag Dr. Müller. ISBN: 978-3639295191.

Schlagwörter: Marketing, Opinion Mining, Text Mining, Wirtschaftsinformatik, soziale Netzwerke.

Abstract: Tilo Hammer beschreibt in seinem Buch, dass das Internet bei der Bewertung und Analyse von Meinungen eine entscheidende Rolle spielt. Unternehmen können herausfinden, was Kunden von ihren Produkten halten und Privatpersonen können sich durch Erfahrungsberichte über die verschiedensten Dinge informieren. Er stellt außerdem ein System vor, welches Bewertungen mit Text Mining automatisch extrahiert. Meinungstrends werden mithilfe der sozialen Netzwerkanalyse identifiziert. 89 S.

Brambring, Dirk; Liu, Zhongde; Schirrmann, Frank-Michael; Stein, Stefan.2009.Weißt du wie viel Sternlein stehen? Opinion Mining - ein Ansatz zur  semantischen Analyse von Rezessionen. URL: http://www.dhbw-mosbach.de/fileadmin/user/public/studienangebote/on/OpinionMining.pdf.

Schlagwörter: Opinion Mining, Amazon.

Abstract: Die Seminararbeit befasst sich mit der Bewertung von Rezensionen der Internetplattform Amazon, in diesem Fall speziell zu Büchern und Navigationsgeräten. Die Arbeit gliedert sich in acht Teile. Als erstes wird ein kurzer Überblick gegeben und auf die Tools GATE und RapidMiner eingegangen. Im Anschluss wird die Durchführung der Rezensionsanalyse detailliert und verständlich erläutert. Zum Schluss werden die Ergebnisse vorgestellt und ein Ausblick gegeben. Durch viele Grafiken und Tabellen kann man die Ergebnisse und Inhalte gut nachvollziehen. 19 S.

Sprejz, Michele. 2011. Extraktion und Klassifikation von bewerteten Produktfeatures auf Webseiten. URL: http://www.rn.inf.tu-dresden.de/uploads/Studentische_Arbeiten/Diplomarbeit_Sprejz_Mich%C3%A9le.pdf.

Abstract: Nirgendwo sonst als im Internet können positive und negative Erfahrungen schneller und weitläufiger ausgetauscht werden. Für heutige Unternehmen wird somit immer wichtiger vorhandene Meinungen von Kunden zu kennen, zu analysieren und zu überwachen, um schnellstmöglich auf einen negativen Ruf reagieren zu können. Da nahezu jeder Mensch in der Lage ist, seine Meinungen online aus-zudrücken – und dies auch tut – entsteht eine fast unendliche Masse an Daten, welche analysiert werden muss. Hier ist das manuelle Durchsuchen nicht mehr ausreichend und automatisierte Methoden werden benötigt. In der vorliegenden Arbeit wird ein solches Verfahren auf Eignung für die Klassifikation von Sätzen hinsichtlich ihrer Polarität überprüft. Ein Klassifikator aus dem Bereich des maschinellen Lernens wird mit unterschiedlichen Datensätzen und Einstellungen getestet und anschließend prototypisch in ein bestehendes Informationsextraktions-System integriert.

Weigl, Elisabeth. 2008. Emotionen in deutschen Texten. Ein quantitativer Ansatz mit GATE. URL: http://ebookbrowse.com/elisabeth-weigl-2008-emotionen-in-deutschen-texten-pdf-d55737635.

Schlagwörter: Text Mining, Emotion.

Abstract: Weigl untersucht in Ihrer Arbeit „Emotionen in deutschen Texten“ unter dem Kapitel  „Sentiment Analysis und Opinion Mining wie sich die Sentiment Analyse zum Opinion Mining verhält, wie hier die Beziehungen zwischen den Begrifflichkeiten sind und wo hier Unterschiede gesehen werden können. Dem deutschen Sprachgebrauch zufolge sieht Weigl in der Sentiment Analyse einen Oberbegriff und stellt das Opinion Mining als eine Kategorie der Sentiment Analyse dar. Jedoch sei es schwierig hier klare Differenzen zu sehen. Zudem geht die Autorin näher auf die Bedeutung des Opinion Mining im Internetzeitalter und Onlineshopping ein, verdeutlicht näher die Motivation der Hersteller als auch der Konsumenten und gibt einen Überblick aus der technischen Sicht in der Sie die Analyse auf Dokumenten- und Satzebene beschreibt. Sie drückt aber auch deutlich aus, das aktuelle Fakten eher in Richtung Untersuchungen tendieren und keinesfalls heute schon ausgereifte Techniken sind. 36 S.

Böhnke, Andreas. Opinion Mining in der Marktforschung. URL: http://www.cogsys.wiai.uni-bamberg.de/teaching/ss11/sem_m2/KogSys_Seminararbeit_Andreas_Boehnke.pdf.

Schlagwörter: Opinion Mining, Text Mining, Wirtschaftsinformatik.

Abstract: Die Ausarbeitung befasst sich mit den Funktionen, die der maschinellen Verarbeitung natürlichsprachiger Texte zu Grunde liegen und erläutert drei zentrale Vorgehensweisen zur Meinungsextraktion: Sentiment Classification, Feature-Based Opinion Mining und Sentiment Analysis of Comparative Sentences. Darauf aufbauend werden anhand eines Fallbeispiels mit einem realen Produkt die einzelnen Prozessschritte abgehandelt und Komplikationen bei der Verwendung des Tools aufgedeckt. Als Tool wird das Programm RapidMiner des Herstellers Rapid-I verwendet. Grundlage sind Produktbewertungen von amazon.de, die mit Hilfe von RapidMinder extrahiert werden..23 S.

Scholz, Thomas.2013.Opinion Mining für verschiedene Webinhalte. LIT Verlag. URL: http://books.google.de/books?hl=de&lr=&id=jVLPAQAAQBAJ&oi=fnd&pg=PA11&dq=Opinion+Mining+f%C3%BCr+verschiedene+Webinhalte&ots=yBSsFA-L74&sig=QWYsqXj_-2ifRXbPwn_Qqqpb6gc#v=onepage&q=Opinion%20Mining%20f%C3%BCr%20verschiedene%20Webinhalte&f=false.978-3-643-11367-2. In: Scherfer, Konrad; Volpers, Helmut. Schriftenreihe Webwissenschaft: Methoden der Webwissenschaft, Teil 1.

Schlagwörter: Web Mining, Opinion Extraction, Automation.

Abstract: In diesem Buchbeitrag konzentriert sich Thomas Scholz auf die Relevanz von Webinhalten beim Opinion Mining. Der Fokus liegt hierbei auf Rezensionen, Online-Nachrichten und Posts in Sozialen Netzwerken.Scholz schildert die Problematiken bei der Extraktion einzelner Merkmale und annotierter Daten der einzelnen Webinhalte. Daraus resultierend werden Unterschiede in der Arbeit mit Webinhalten aufgezeigt, wie zum Beispiel in der Bildung der Tonalität. Um dies genauer zu beleuchten, werden die vier Phasen einer automatischen Meinungsanalyse betrachtet und anhand von Anwendungsbeispielen in der Praxis aufgezeigt. Der Beitrag hält erste ausgereifte Ansätze für die Einsetzbarkeit von Opinion Mining und die automatische Erfassung von Trends fest und dokumentiert die unterschiedlichen Ergebnisse der Untersuchungen bei den drei behandelten Webinhalten. 20 S.

Nerbonne, John [u.a.].1993. A diagnostic tool for German syntax. Springer Netherlands.Volume 8, Issue 1-2, pp 85-107. URL: http://rd.springer.com/article/10.1007/BF00981246">http://rd.springer.com/article/10.1007/BF00981246.0922-6567.

Schlagwörter: Machine Translation. Text Mining, Natural Language Processing, NLP, deutsche Sprache, Korpus.

Abstract: Nerbonne und Kollegen beschreiben in diesem Paper den fortdauernden Versuch einen Korpus zu erstellen, der die Deutsche Sprache korrekt in ihrer Syntax wiederspiegelt. Hinter dem Versuch steckt die Absicht, ein fehlerfreies NLP, Natural Language Processing, auch für deutsche Texte durchzuführen. Der Korpus enthält künstliche, wie systematische Ausdrücke und Phrasen, die in relationalen Datenbanken als annotierte Daten organisiert sind. Das Paper erklärt unteranderem die Notwendigkeit eines korrekten Korpus für den Prozess des NLP, nämlich zur Fehlerminimierung und beschreibt außerdem das Vorgehen bei der Erstellung des Korpus unter Bereitstellung von Beispielen. 22 S.

Osherenko, Alexander.2010.Opinion Mining and Lexical Affect Sensing. URL: http://scholar.google.de/scholar?q=opinion+mining+and+lexical+affect+sensing&btnG=&hl=de&as_sdt=0%2C5.

Schlagwörter: Emotionen, Text Mining, Opinion Mining, Korpus.

Abstract: Emotionen kontrollieren die menschliche Kommunikation - auf diesem Grundsatz untersucht Osherenko in seiner Doktorarbeit sogenannte „emotional Korpora“, Wortsammlungen, die vorwiegend Emotionsausdrücke und Phrasen enthalten, zur Verwendung für das Opinion Mining. Im Rahmen seiner Arbeit beschreibt er verschiedene Herangehensweisen um Texte als negativ bzw. positiv zu kategorisieren. Osherenko nennt neben einem statistischen Tool, welches unteranderem grammatikalische Informationen aus Texten extrahiert, auch eine semantische Methode, die in der Lage ist, tatsächliche Bedeutungen von Texten zu erschließen. Schließlich nennt er eine Kombination beider Werkzeuge, welches statistische und semantische Informationen auslesen kann. 273 S.

Scholz, Thomas; Conrad, Stefan.2013.Linguistic Sentiment Features for Newspaper Opinion Mining. Springer. URL: http://link.springer.com/chapter/10.1007/978-3-642-38824-8_24#page-1. ISBN: 978-3-642-38823-1. Natural Language Processing and Information Systems : Lecture Notes in Computer Science, Volume 7934.

Schlagwörter: Sentiment Analysis, Computerlinguistik.

Abstract: Der Artikel befasst sich mit verbreiteten Ansätzen der Sentiment Analyse. Es werden semantische Merkmale und deren Einfluss auf die Sentiment Analyse untersucht. Hierzu werden über 4000 deutsche Zeitungsartikel untersucht. Daran soll veranschaulicht werden, dass diese Analysetechnik den Prozess verbessern kann und linguistische Eigenschaften sehr nützlich für das Opinion Mining in Zeitungsartikeln sind. Für die Evaluation werden zwei verschiedene Datensätze genutzt: "pressrelations" und der "Finance"-Korpus. Die linguistischen Merkmale können in bereits bestehende Lösungen integriert werden und diese somit verbessern. 5 S.

Scholz, Thomas; Conrad, Stefan; Hillekamps, Lutz.2012.Opinion Mining on a German Corpus of a Media Response Analysis. Springer.URL: http://link.springer.com/chapter/10.1007/978-3-642-32790-2_4#page-1. Text, Speech and Dialogue : Lecture Notes in Computer Science, Volume 7499.

Schlagwörter: Sentiment Analysis, Meinungsextraktion.

Abstract: Mit Hilfe der Analyse von Medienechos in deutschen Zeitungsartikeln soll ein neuer Korpus erstellt werden: der "pressrelations"-Korpus. Um den "pressrelations"-Korpus zu erstellen, werden Zeitungsartikel durchsucht und je nach Relevanz in positive bzw. negative Tonalitäten oder Standpunkte eingeteilt. Der Korpus kann für verschiedene Bereiche des Opinion Mining genutzt werden: für die Sentimentanalyse, die Meinungsextraktion und zur Festlegung von Standpunkten. Zudem kann der Korpus für Sentiment-Wörterbücher verwendet werden.

Scholz, Thomas; Conrad, Stefan; Wolters, Isabel.2012.Comparing Different Methods for Opinion Mining in Newspaper Articles. Springer. URL: http://link.springer.com/chapter/10.1007/978-3-642-31178-9_31#page-1. ISBN: 978-3-642-31177-2. Bouma, Gosse; Ittoo, Ashwin; Métais, Elisabeth; Wortmann, Hans.

Schlagwörter: SentimentWortschatz, Sentiment Analysis, Opinion Mining, Meinungsextraktion.

Abstract: Wie der Titel schon verlauten lässt, handelt es sich in diesem Buchbeitrag um den Vergleich verschiedener Methoden zum Opinion Mining bei Zeitungsartikeln. Spezielle Verfahren des Opinion Mining werden mit der Sentimentanalyse von Produktbewertungen verglichen. Bei der Gegenüberstellung wird deutlich, dass die Methoden die auf Entropie und Informationsgewinnung basieren etwa 7 bis 9% bessere Ergebnisse liefern als SentiWS. Dies zeigt, dass spezielle Opinion-Mining-Verfahren wirkungsvoller für den Einsatz bei der Untersuchung von Zeitungsartikeln sind als wortbasierte Methoden und patterns. 6 S.

Shen, Chunze.2013. Korpus-basierte effiziente Informationsextraktion und Grammatikinduktion der natürlichen Sprachen. URL: http://geb.uni-giessen.de/geb/volltexte/2013/9925/pdf/ShenChunze_2013_07_11.pdf.

Schlagwörter: Computerlinguistik, Grammatik-Induktion, Korpus.

Abstract: Chunze Shen befasst sich in seiner Dissertation mit der zunehmenden Wichtigkeit von Grammatikinduktion (Erkennung syntaktischer Strukturen) in der Computerlinguistik. Zur Untersuchung von Texten wird versucht, kontextfreie Grammatik zu extrahieren und lokale Grammatik, die unmittelbar in der Nähe eines bestimmten Wortes oder einer Wortklasse vorkommt, zu induzieren. Diese lokale Grammatik kann für  Informationsextraktion, automatische Übersetzung und lexikalische Disambiguierung verwendet werden.

Für die Extraktion der lokalen Grammatik wird ein neuer Korpus-basierter Ansatz getestet, der EDSI-Ansatz (Effiziente Destillation Syntaktischer Informationen). Um den Erfolg dieser Methode genauer zu beleuchten, wird sie in zwei verschiedenen Sprachen getestet, Englisch und Deutsch. Verglichen mit klassischen Ansätzen wie dem ABL-Ansatz (Alignment-Based Learning), erweist sich der EDSI-Ansatz als effizienter und liefert bessere Ergebnisse. 260 S.

Waltinger, Ulli.2010.GermanPolarityClues: A Lexical Resource for German Sentiment Analysis. URL: http://lexitron.nectec.or.th/public/LREC-2010_Malta/pdf/91_Paper.pdf. LREC Conferences.

Schlagwörter: Lexikalische Ressourcen, Sentimentanalyse, Text Mining.

Abstract: In diesem Artikel werden vier verschiedene englische und drei verschiedene deutsche Sentimentressourcen vergleichend evaluiert. Das Hauptaugenmerk liegt auf GermanPolarityClues, eine öffentliche lexikalische Ressource für die Sentimentanalyse deutscher Sprache. Diese Ressource wurde erstellt, indem eine semi-automatische Übersetzungsmethode und die manuelle Bewertung und Erweiterung von Polaritätsbasierten Merkmalen kombiniert wurden. Die auf Polarität basierenden Terme wurden auf positive, negative und neutrale Merkmale überprüft und aus den Texten extrahiert. Es wird festgestellt, dass eine Selektion basierend auf Polarität in Kombination mit SVM-basierten (Support Vector Machine) Methoden für beide Sprachen am besten funktionieren. Dennoch kann diese Arbeit nur als Einführung gesehen werden, da der erarbeitete Datensatz mit Hilfe weiterer Ressourcen und Wörterbüchern erweitert und verbessert werden soll. 5 S.

Romacker, Martin.2002.Ebenen der Semantikintegration im Textverstehenssystem SynDiKATe. URL: http://www.freidok.uni-freiburg.de/volltexte/409/.

Schlagwörter: Medizininformatik, Medical Language Processing, Text Mining, Textverstehenssysteme, Computerlinguistik , Semantik, semantische Interpretation.

Abstract: Diese Doktorarbeit von Romacker, entstanden im Bereich Computerlinguistik an der Universität Freiburg, behandelt die Problematik der semantischen Interpretation von Textverstehenssystemen. Zunächst stellt Romacker einige Textverstehenssysteme vor. Hierbei konzentriert er sich auf Systeme der Medizininformatik und definiert den Begriff des Medical Language Processing.  Im Rahmen seiner Doktorarbeit legt er sich schließlich auf das System SynDiKATe fest, untersucht und evaluiert es. Im Verlauf der Arbeit geht er verstärkt auf die Probleme ein, die eine semantische Interpretation der Systeme mit sich bringt, so nennt er unteranderem die umfangreiche deutsche Grammatik als ausschlaggebenden Grund für ein geringfügiges semantisches Verständnis der Systeme von Texten, und die damit einhergehende schwache Performance. 292 S.

Schieber, Andreas; Heinrich, Kai; Hilbert, Andreas.2011.Analyse von Konsumentenmeinungen in Microblogs. URL: http://scholar.google.de/scholar?hl=de&q=Analyse+von+Konsumentenmeinungen+in+Microblogs&lr. Gesellschaft für Informatik. Impulse für die Forschung oder Impulse durch die Forschung: Entwicklungsperspektiven der BI-Forschung in Deutschland: S. 50 - 58.

Schlagwörter: Opinion Mining, Web 2.0, Microblogs.

Abstract: Dem Web 2.0 wird ein immer größer werdender Einfluss im 21. Jahrhundert zugesprochen. Viele Plattformen bilden eine hervorragende Fläche, um Meinungen zu Produkten und Dienstleistungen Kund zu tun und sogenanntes E-Commerce zu betreiben. Auf dieser These basiert das Paper von Schieber, Heinrich und Hilbert, die Kundenmeinungen in Microblogs mit Hilfe verschiedenster Verfahren analysieren, des Weiteren überprüft das Autorenteam die Übertragbarkeit auf Microblogs. Ziel ist hierbei, Meinungen zu identifizieren und zu clustern, um der Frage nach zu gehen, „was Konsumenten denken“. Als Datenquelle dient der Microblogdienst Twitter..

Schmidt, Anika.2014.Automatisierte Sentiment Analyse als betriebswirtschaftlicher Erfolgsfaktor. diploma...9,78384E+12.

Schlagwörter: Opinion Mining, Online Reputation, E-Commerce.

Abstract: In den vergangenen Jahren ist die Zahl der Onlinekäufe rapide angestiegen. Immer mehr Kunden informieren sich über das jeweilige Produkt und Onlinebewertungen sind für den Kauf bzw. Nichtkauf ausschlaggebend. Schmidt spricht in ihrer Diplomarbeit Onlinebewertungen eine hohe betriebswirtschaftliche Relevanz zu. Sie unterscheidet manuelle und automatisierte Verfahren zum Auslesen solcher Kundenmeinungen und legt Vorteile und Nachteile fest. Automatisierte Verfahren helfen Unternehmen schnell zu agieren und Nachteile, die ihnen beispielsweise durch negative Bewertungen entstehen, abzuwenden. Manuelle Verfahren hingegen kosten viel Zeit und Geld, sofern sie bei den immer größeren Datenmengen überhaupt möglich sind. Schmidt legt in ihrer Arbeit die automatische Sentiment Analyse als gewinnbringende Methode im betriebswirtschaftlichen Sektor fest, um z.B. Imageverlusten von Unternehmen vorzubeugen. 45 S.

Schmidt, Irina..SentiStrength. URL: http://www.uni-koblenz-landau.de/campus-koblenz/fb4/west/teaching/ss12/seminarir/material/ausarbeitung-sentistrength.pdf.

Schlagwörter: Opinion Mining, Sentiment Analyse, Emotionen, SentiStrength, Web 2.0, Social Media.

Abstract: Im Social Web werden verstärkt Nachrichten veröffentlicht, die Emotionen zum Ausdruck bringen. Das Filtern und Erkennen von emotionsgeladenen Beiträgen kann als erfolgreiche Grundlage für z.B. die sozialwissenschaftliche Forschung sein. Unteranderem kann sie zu der Erkenntnis führen, wie Geschlechter unterschiedlich agieren, wenn sie z.B. mit Verlusten umgehen müssen. Schmidt stellt in ihrer Arbeit verschiedene Ansätze vor, Emotionen aus Textdaten  zu extrahieren. Neben einen Machine-Learning-Ansatz richtet sie ihr Hauptaugenmerk auf das Verfahren SentiStrength. Hierbei handelt es sich um einen wörterbuchbasierten Ansatz, der negative, wie positive Äußerungen erkennt. Im Rahmen ihrer Arbeit stellt Schmidt fest, dass sich dieser Ansatz vor allem für die Analyse von kurzen Texten anbietet und demnach gut im Bereich Social Media einsetzbar ist. 14 S.

Kaiser, Carolin.2008.Produkt Mining im Web 2.0.Gito. URL: http://books.google.de/books?hl=de&lr=&id=gBsGSG_ZkX0C&oi=fnd&pg=PA51&dq=Produkt-Mining+im+Web+2.0&ots=yexub-hC2x&sig=gs6Ya74_AXho9qBIHG9gp1_jbhM#v=onepage&q=Produkt-Mining%20im%20Web%202.0&f=false. ISBN: 978-3-940019-34-9. Bichler, Martin; Hess, Thomas; Krcmar, Helmut; Lechner, Ulrike; Matthes, Florian; Picot, Arnold; Speitkamp, Benjamin; Wolf, Petra.Multikonferenz Wirtschaftinformatik 2008, S. 229-240.

Schlagwörter: Mining, Produkt-Mining, Opinion-Mining, Wirtschaftinformatik, Kongress.

Abstract: Carolin Kaisers „Produkt-Mining im Web 2.0“ stellt ein automatisches Verfahren dar, mit dem Unternehmen detaillierte Kenntnisse über Kundenwünschen erwerben können. Hierbei werden Text Mining Verfahren genutzt, um aus den unstrukturierten Daten der Produkt-Reviews, mit den von den Kunden beschriebenen expliziten Charakteristika, strukturierte Daten zu extrahieren. Zur Klassifizierung von Wörtern und Polarität wird die Stützvektormethode angewandt. Die gewonnen Daten werden in der Aggregrationsphase verknüpft und zusammengeführt. So können Bewertungen einzelnen Produkteigenschaften zugeordnet werden und über verschiedene Benutzer hinaus in einer grafischen Darstellungen zusammengefasst werden. Abhängigkeiten einzelner Eigenschaften sollen per Assoziationsregeln kenntlich gemacht werden. Die herausgefilterten Beziehungen erlauben es, festzulegen welche Eigenschaften ausschlaggebend für eine positive oder negative Bewertung sind. Diese sind ein Ansatzpunkt für Produktentwicklung und -verbesserungen. .12 S.

Kaiser, Carolin; Kröckel, Johannes.2011.Meinungsanalyse in Onlinenetzwerken mittels Schwarmintelligenz.Springer. URL: http://link.springer.com/article/10.1007%2Fs00287-010-0444-4. Bode, Arndt.Informatik-Spektrum Vol. 34, 4/2011, S. 355-363.

Schlagwörter: Informatik, Opinion Mining.

Abstract: Der Artikel „Meinungsanalyse in Onlinenetzwerken mittels Schwarmintelligenz“ von Kaiser und Kröckel befasst sich mit Meinungsentwicklung durch Online-Communities. Ziel ist mittels Text-Mining und Algorithmen die Meinungen eines Nutzers vorherzusehen. Dazu werden bestehende Meinungen extrahiert und nach Polarität sortiert. Anschließend werden die Beziehungen des betrachteten Users analysiert. Als Beispiel dient die deutschsprachige Online-Gaming- Community GameStar.de. Die Ergebnisse zeigen, dass sich die verschiedenen Meinungen gegenseitig beeinflussen. Näher stehende Personen haben dabei einen größeren Einfluss als weiter Entfernte. Dabei tritt das Phänomen auf, dass bei eindeutig positiver Community - Einstellung das Individuum dazu neigt, die Gegenposition einzunehmen. .9 S.

Kaiser, Carolin.2011.Entscheidungsunterstützung zur Meinungsbeeinflussung in Webcommunitys.Gabler. URL: http://link.springer.com/article/10.1007%2FBF03340608. Print ISSN: 1436-3011, Online ISSN: 2198-2775. Fröschle, Hans-Peter.HMD Praxis der Wirtschaftsinformatik, 2011 Vol. 48, Nr. 4, S. 83-93.

Schlagwörter: Marketing, Computerwissenschaft, Opinion Mining.

Abstract: In „Entscheidungsunterstützung zur Meinungsbeeinflussung in Webcommunitys“ stellt Kaiser ein Frühwarnsystem für Marketingmanager vor. Die Meinungsentwicklung in Onlinenetzwerken soll beobachtet werden und daraus Vorschläge für Marketingmaßnahmen abgeleitet werden, um mit Stealth-Marketing-Methoden, wie die aktive Empfehlung von Produkten in Foren, anzuwenden. Mittels statistisch-linguistischer Analyse werden typische Attribute aufgedeckt, die eine Meinung als positiv, negativ oder neutral kennzeichnen. Dieser Vorgang geschieht vor und nach Durchführung eine empfohlenen Maßnahme, um deren Wirksamkeit zu testen. Die Maßnahmenempfehlung selbst wird durch Data Mining auf Grundlage von früher eingesetzten Methoden prognostiziert. Entscheidungsbäume stellen für jede Maßnahme das erwartete Ergebnis dar und jene mit positiven Output werden empfohlen. In einem Fallbeispiel zu Smartphones zeigte sich, dass Beeinflussung bei sachlichen Diskussionen erfolgreicher sind, als bei emotional geprägten. Die Grundstimmung der Diskussionsteilnehmer bestimmt das Ergebnis. Zuvor negativ gestimmte Teilnehmer waren nach der Maßnahme positiv gestimmter. Zuvor neutral oder positiv Eingestellte haben danach eher eine negative Meinung .11 S.

Kartal, Aliye; Doerfel, Stephan; Roßnagel, Alexander; Stumme, Gerd.2011.Privatsphären- und Datenschutz in Community-Plattformen. Gestaltung von Online-Bewertungsportalen.GI (Gesellschaft für Informatik). URL: http://www.user.tu-berlin.de/komm/CD/paper/090222.pdf

 ISBN: 978-88579-286-4. Heiß, Hans-Ulrich; Pepper, Peter; Schlingloff, Holger, Schneider, Jörg. Informatik 2011.

Schlagwörter: Bewertungsportale, Community, Web 2.0 - Anwendungen, Datenschutzrecht, Meinungsfreiheit, Persönlichkeitsrecht.

Abstract: Die Projektgruppe Verfassungsverträgliche Technikgestaltung des IteG beschäftigt sich in diesem Werk mit rechtlichen Grundlagen in Bezug auf Informationsverarbeitung und Informationsdarstellung in Bewertungsportalen. Im Mittelpunkt steht das ineinandergreifende Gefüge aus Meinungsfreiheit, Persönlichkeitsrecht und Datenschutzrecht. Die untersuchten Portale forderten meist eine Anmeldung mit E-Mail Verifizierung, um eine Bewertung abgeben zu können. Für bestimmte Bewertungen ist eine fachliche Kompetenz notwendig. Mittels eines vorher festgelegten Kriterienkatalogs soll diese sichergestellt werden. Diese umzusetzen gestaltet sich als schwierig. Für die Bewertungen selbst gibt es verschiedene Designs in Form von Skalen, z.B. Sterne, oder Freitext. Bei einem skalenbasierten Bewertungssystem wird meist das arithmetische Mittel sichtbar angezeigt. Das erschwert die objektive Beurteilung der Bewertungen, weil sie je nach Verfasser unterschiedliche Gewichtungen haben sollten. Das erfordert wiederum personenbezogene Daten. Das rasant wachsende Angebot der Online-Communities macht eine fortwährende Anpassung der rechtlichen Rahmenbestimmungen nötig. 15 S.

Li, Hong;  Cheng, Xiwen; Adson, Kristina; Kirshboim, Tal; Xu, Feiyu.2012.Annotating Opinions in German Political News. URL: http://www.lrec-conf.org/proceedings/lrec2012/pdf/640_Paper.pdf. LREC 2012, Istanbul.

Schlagwörter: Deutsche Politik, Opinion Mining, Nachrichten.

Abstract: In diesem Projekt ist ein annotierter Korpus für das Opinion Mining entstanden, bei dessen Dokumenten es sich um deutschsprachige Presseartikel zu politischen Themen handelt. Die Annotationen enthalten

-Subjekt der Meinungsäußerung

-Meinungsäußerung

-Englische Übersetzung der Meinungsäußerung

-Polarität

-Typ (context-dependent | context-independent)

-Intensität.

6 S.

Momtazi, Saeedeh.2012.Fine-grained German Sentiment Analysis on Social Media. URL: http://www.lrec-conf.org/proceedings/lrec2012/pdf/999_Paper.pdf. LREC 2012, Istanbul.

Schlagwörter: Opinion Mining, Deutsche Sprache, Social Media.

Abstract: In  diesem  Projekt  ist  ein  Sentiment Lexicon  für  die deutsche  Sprache  entstanden , das 1864 Sentiment words  enthält .  Dafür  wurde  SentiStrength  ( Thelwall  et al .  2010 ) mit einer  Übersetzungssoftware in die deutsche Sprache übersetzt und danach  manuell von zwei Muttersprachlern nachbearbeitet..6 S.

Remus, Robert; Quasthoff, Uwe; Heyer, Gerhard.2010.SentiWS - a Publicly Available German-language Resource for Sentiment Analysis. URL: http://asv.informatik.uni-leipzig.de/publication/file/155/490_Paper.pdf. LREC 2010, Malta.

Schlagwörter: Opinion Mining, Deutsche Sprache.

Abstract:  In  diesem  Projekt  wurde  SentimentWortschatz  entwickelt ,  ein  Sentiment Lexicon  für  die deutsche  Sprache , das  eine  Liste  von  Termen ,  deren  Polarität , POS und  Flektionen  enthält .  Bei  den  Termen  handelt  es  sich  nicht  nur  um  Adjektive  und  Adverbien ,  sondern  auch  um  Nomen  und  Verben , die  eine  Polarität  enthalten .  Als  Quellen  für  das  Lexikon  wurde  eine  deutsche  Übersetzung  des General Inquirer (Stone et al. 1966),  eine  Kookkurrenz-Analyse  einer  Liste  von  manuell  annotierten  Kundenrezensionen  und der German Collocation Dictionary ( Quasthoff  2010)  genutzt. 4 S.

Schmid, Helmut.1995.Improvements in Part-of-Speech Tagging with an Application to German. URL: http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger2.pdf. ACL SIGDAT-Workshop 1995, Dublin.

Schlagwörter: Opinion Mining, Deutsche Sprache, POS Tagging.

Abstract: Schmid  stellt  seinen  POS Tagger  TreeTagger  vor , der auf  dem  M arkov Modell  basiert .  Durch  spezifische  Erweiterungen  schaffte  er  es ,  ihn  für  die deutsche  Sprache  einzusetzen ,  ohne  eine  Vielzahl  an  Parametern  oder  eine  extrem  große  Anzahl  an  Trainigsdaten  zu  benötigen, wie dies bei ähnlichen Markov Modell-Adaptionen für die deutsche Sprache bisher üblich war,  und  dennoch  zu  guten  Ergebnissen  zu  kommen. 9 S.

Kalisch, Florian.2012.Opinion Mining. Eine Einführung in den Themenkomplex. URL: http://www.floriankalisch.de/projects/om/Paper-Opinion-Mining.pdf.

Schlagwörter: Data Mining, Text Mining, Opinion Mining

Abstract: Kalisch beschreibt in seiner Einführung in das Thema Opinion Mining grundsätzliche Methoden und gibt einen glossarartigen Überblick über die wichtigsten Begriffe. Die Verzahnung der angrenzenden Themengebiete der Computerlinguistik, des Text Mining und des Data Mining werden hervorgehoben. Der Hauptteil befasst sich mit der Sentiment Analyse. Folgend wird ein selbsterstellter, englischsprachiger Prototyp für ein Opinion Mining - Tool vorgestellt, welcher die angesprochenen Theoriegrundlagen am Beispiel verdeutlichen sollen. XI, 33 S.

Schönhalz, David.2010.Opinion Mining und Sentiment-Analyse im Web 2.0 : Interview mit dem Informationswissenschaftler David Schönhalz. Social Media Verlag. URL: http://www.social-media-magazin.de/index.php/inhalt/opinion-mining-und-sentiment-analyse-im-web-20.html. Social Media Magazin, Nr. 2010-03.

Schlagwörter: Opinion Mining, Sentimentanalyse, Social Media, Marktforschung, Trendanalyse.

Abstract: Im Interview berichtet David Schönhalz von der Wichtigkeit des Opinion Mining im Bereich Social Media. Unter anderem geht er auf den Einfluss und die Wichtigkeit von Social Networks für Unternehmen und Marktforschung mittels Trendanalysen ein. Im Fokus steht die automatische Sentimentanalyse, die noch immer eine Herausforderung bei der Ermittlung von Meinungen darstellt. Es werden Definitionen zu diesen Aspekten geliefert und Fortschritte im Bereich der Sentimentanalyse erläutert, die die Unverzichtbarkeit von intellektuellen Auswertungen aufzeigen..

Kasper, Harriet; Dausinger, Moritz; Kett, Holger; Renner, Thomas.2010. Marktstudie Social Media Monitoring Tools, IT -Lösungen zur Beobachtung und Analyse unternehmensstrategisch relevanter Informationen im Internet. Fraunhofer Verlag, Fraunhofer-Informationszentrum Raum und Bau IRB. URL: http://wiki.iao.fraunhofer.de/index.php/Marktstudie:_Social_Media_Monitoring_Tools.978-3-8396-0194-5. Fraunhofer-Institut für Arbeitswirtschaft und Organisation.

Schlagwörter: Social Media Monitoring, Tonalitätsanalyse, Opinion Mining.

Abstract: Die vom Fraunhofer-Institut für Arbeitswirtschaft und Organisation (IAO) durchgeführte Marktstudie für Social Media Monitoring Tools stammt aus dem Jahr 2010. Ziel der Studie ist die Schaffung eines Überblicks über das zu diesem Zeitpunkt bestehende Angebot an IT-gestützten Lösungen zur Identifikation, zum Monitoring und zur Analyse unternehmensbezogener Daten im (Social) Web. Neben einer fundierten Einführung in die Anwendungsfelder von Social Media Monitoring Tools sowie deren grundsätzliche Merkmale werden 20 am Markt verfügbare Software-Lösungen in ausführlichen Produktprofilen vorgestellt. Dabei werden sowohl kostenpflichtige als auch kostenfreie Tools berücksichtigt. Aus den Produktprofilen gehen neben detaillierten Herstellerinformationen insbesondere Informationen über den Funktionsumfang der jeweiligen Software-Produkte hervor. Betrachtet werden u. a. Möglichkeiten zur Anbindung von relevanten Datenquellen, Such- und Speicherfunktionen, Analysemöglichkeiten, Filterfunktionen, Möglichkeiten zur Relevanzbewertung, Funktionen für Häufigkeits-, Demographie-/Profiling- und Tonalitätsanalyse sowie Integrationsmöglichkeiten mit anderen Softwareprodukten. 146 S.

Klinger, Roman, Cimiano, Phillip.2014.The USAGE review corpus for fine-grained, multi-lingual opinion analysis. URL: http://pub.uni-bielefeld.de/download/2664218/2669583

Schlagwörter: Corpora, Opinion Mining, Sentimentanalyse, Produktreviews.

Abstract: Cimiano und Klinger stellen in dem Paper den am Center of Excellence Cognitive Interaction Technology (CITEC) in der Arbeitsgruppe Semantische Datenbanken und Wissensverarbeitung entwickelten Bielefeld University Sentiment Analysis Corpus for German and English (USAGE) vor. Der Corpus basiert auf 622 englisch- und 611 deutschsprachigen Produktbewertungen acht verschiedener Produktkategorien der Verkaufsplattform Amazon. Das Paper erläutert zum einen die im Rahmen der Corpus-Erstellung angewendete Methodik zur manuellen Annotation der insgesamt 1233 Produktreviews. Zum anderen werden statistische Auswertungen bezüglich der genutzten Entitäten „aspects“ (Aspekte) und „evaluative (subjective) phrases“ (Sentimentausdrücke) bereitgestellt. Der Corpus USAGE steht der wissenschaftlichen Öffentlichkeit zur Verfügung. 8 S.

Steinberger, Josef et. al; Vazquez, Silivia.2012.Creating Sentiment Dictionaries via Triangulation. URL: http://publications.jrc.ec.europa.eu/repository/handle/111111111/26852. 0167-9236 (ISSN). Elsevier Science BV.

Schlagwörter: Opinion Mining, Corpora, Sentimentanalyse.

Abstract: Im Zentrum des Papers steht die Erstellung vergleichbarer, multilingualer Sentiment-Wörterbücher unter Nutzung von Triangulationsmethoden mit dem Ziel, die Verfolgung und Analyse von im Internet verfügbaren Nachrichten aus Sicht des Opinion Mining über Sprachgrenzen hinweg zu ermöglichen. Die Autoren adressieren mit ihrer Arbeit den Umstand, dass zum aktuellen Zeitpunkt nur für die englische Sprache umfassende Sentiment-Wörterbücher verfügbar sind. Basierend auf den englischsprachigen Wörterbüchern MicroWNOp (Cerini et al., 2007) sowie JRC Tonality Dictionary (Balahur 2009) wurde daher ein neues englischsprachiges Dictionary entwickelt, ins Spanische übertragen und manuell weiterbearbeitet. Eine Erweiterung der Sentiment-Termzahl wurde durch Einsatz des sprachunabhängig einsetzbaren Algorithmus zur Termextraktion, Ontopopulis, erreicht. Durch weitere Triangulationsprozesse und manuelle Weiterbearbeitungen wurden Wörterbücher in Tchechisch, Französisch, Deutsch, Italienisch und Russisch erstellt, deren Qualität analysiert wurde..9 S.

Clematide, Simon; Gindl, Stefan; Klenner, Manfred; Petrakis, Stefanus; Remus, Robert.; Ruppenhofer, Josef; Waltinger, Ulli; Wiegand, Michael. 2012. MLSA – A Multi-layered Reference Corpus for German Sentiment Analysis. URL: http://www.lrec-conf.org/proceedings/lrec2012/pdf/125_Paper.pdf. ISBN: 978-2-9517408-7-7. European Language Resources Association.

Schlagwörter: Sentimentanalyse, Opinion Mining, Corpus.

Abstract: In dem Paper wird das deutschsprachige Sentiment-Wörterbuch MLSA vorgestellt. Das Wörterbuch basiert auf insgesamt 270 deutschen Sätzen, die dem DeWaC Corpus (Baroni et al., 2009) unter Nutzung des Polaritätslexikons von Clematide und Klenner (2010) entnommen wurden. Die ausgewählten Sätze wurden von den Autoren auf drei unterschiedlichen Ebenen (Satz, Wort/Phrase und Ausdruck) manuell annotiert. Das Verfahren zur Erstellung des Corpus wird anhand vieler Beispiele ausführlich dargestellt. Der MLSA-Corpus wurde der wissenschaftlichen Öffentlichkeit zur Verfügung gestellt. 6 S.

Declerck, Thierry; Krieger, Hans Ulrich. 2014. Harmonization of German Lexical Resources for Opinion Mining. URL: http://www.lrec-conf.org/proceedings/lrec2014/index.html ISBN: 978-2-9517408-8-4.

Schlagwörter: Sentimentanalyse, Corpora.

Abstract: Das Paper stellt einen Teilbereich des europäischen Projekts TrendMiner vor, der sich mit der Zusammenführung und Vereinheitlichung von vier bereits existierenden, deutschsprachigen Sentiment-Wörterbüchern beschäftigt. Ziel in diesem ersten Schritt des Vorhabens ist die Schaffung einer einheitlichen, deutschsprachigen Sentiment-Lexikonressource. Das Vorgehen bei der Zusammenführung der verschiedenen Datenbestände wird anhand von Beispielen anschaulich beschrieben. In einem weiteren Projektschritt ist die Integration zweier deutschsprachiger Sentiment-Corpora vorgesehen. 5 S.

Jakob, Niklas. 2011 .Extracting Opinion Targets from User-Generated Discourse with an Application to Recommendation Systems, Dissertation. URL: http://tuprints.ulb.tu-darmstadt.de/2609/1/Diss.pdf">http://tuprints.ulb.tu-darmstadt.de/2609/1/Diss.pdf.

Schlagwörter: Opinion Mining, Sentimentanalyse.

Abstract: Jakob analysiert in seiner Dissertation zunächst den Stand der Forschung im Bereich des Opinion Mining. Die Darstellung der Vorgehensweise und Ergebnisse einer vergleichenden Studie zu den unüberwachten Verfahren Association Mining sowie Likelihood Ratio Test zur Extraktion von Meinungszielen aus Kundenrezensionen unterschiedlicher Produkttypen sowie die Evaluation des überwachten als State-of-the-Art-Algorithmus eingestuften Algorithmus von Zhuang stellen zentrale Themen der Arbeit dar. Weiterhin wird ein auf Conditional Random Fields (CRF)-basierender Algorithmus vorgestellt und evaluiert. Ein Ansatz zur Integration eines Anaphernalgorithmus in ein überwachtes System zur Extraktion von Meinungen wird außerdem vorgestellt. Die Arbeit schließt mit einer Darlegung möglicher Optimierungen von Anwendungen wie Empfehlungssystemen durch Integration von meinungsextrahierenden Systemen..152 S.

Brester, Christina; Minker, Wolfgang; Semenkin, Eugene; Sidorov, Maxim. 2014. Speech-Based Emotion Recognition: Feature Selection by Self-Adaptive Multi-Criteria Genetic Algorithm. URL: http://www.lrec-conf.org/proceedings/lrec2014/pdf/341_Paper.pdf. ISBN: 978-2-9517408-8-4.

Schlagwörter: Sprachanalyse, Sentimentanalyse, Opinion Mining.

Abstract: Das Paper beschäftigt sich mit einem besonderen Anwendungsfall des Opinion Mining. Kern ist die Analyse gesprochener Worte hinsichtlich menschlicher Emotionen. Mit Hilfe geeigneter Verfahren zur Erkennung von Gefühlen in gesprochenen Texten sehen die Autoren des Papers die Chance zur Verbesserung von zum Beispiel Spoken Dialogue Systems (SDS) oder von Call Center-Applikationen. Das Paper stellt einen MOGA (multi-objective genetic algorithm)-basierten Ansatz zur Optimierung der Erkennung von Emotionen vor. Als Corpora dienten insgesamt drei Sprachdatenbanken mit Texten in englischer und deutscher Sprache. Für die deutsche Sprache wurden die Datenbasen Berlin und VAM genutzt, für englische Texte der Corpus SAVEE. Die Corpora stellten zusammen sowohl Sprachaufzeichnungen aus realen Situationen als auch künstlich erzeugte Aufnahmen bereit. Mit Hilfe des MOGA-Ansatzes konnte eine Verbesserung der Emotionserkennung in gesprochenen Texten belegt werden..5 S.

Boland, Katarina; Wira-Alam, Andias; Messerschmidt, Reinhard. 2013. Creating an Annotated Corpus for Sentiment Analysis of German Product Reviews. URL: http://www.ssoar.info/ssoar/bitstream/handle/document/33939/ssoar-2013-boland_et_al-Creating_an_Annotated_Corpus_for.pdf?sequence. GESIS - Leibniz-Institut für Sozialwissenschaften.

Schlagwörter: Opinion Mining, Sentiment Lexikon, Sentimentanalyse.

Abstract: Die Autoren des Forschungsberichts legen das Vorgehen bei der Erstellung eines annotierten Corpus zur Sentiment-Analyse von deutschsprachigen Produktbewertungen dar. Angestrebt wurde ein Corpus, der Produkttyp-übergreifend (domänenunabhängig) ist. Ausgangspunkt war dabei die Erkenntnis, dass die Art der Emotionsäußerungen in Produktbewertungen zwischen verschiedenen Produkttypen erheblich abweicht. Darin sehen die Autoren für die Entwicklung und Optimierung von Algorithmen zur Sentiment-Analyse eine Herausforderung. Zur Erstellung eines Produkttyp-übergreifenden Corpus wurden insgesamt 63.067 Sätze aus deutschsprachigen Produktbewertungen sechs verschiedener Produkttypen bei Amazon extrahiert und von Annotatoren auf Basis einheitlicher Richtlinien bearbeitet. Der resultierende Corpus soll zum Beispiel dem Vergleich von Eigenheiten bei emotionalen Äußerungen in Produktbewertungen unterschiedlicher Produktarten sowie der Bewertung von Algorithmen bei Einsatz in unterschiedlichen Domänen (Produkttyp-Bewertungen) dienen. 16 S.

Balahur, Alexandra; Turchi, Marco; Steinberger, Ralf; Perea-Ortega Jose-Manuel; Jacquet, Guillaume; Kücük, Dilek; Zavarella, Vanni; El Ghali, Adil. 2014. Resource Creation and Evaluation for Multilingual Sentiment Analysis in Social Media Texts. URL: http://www.lrec-conf.org/proceedings/lrec2014/pdf/965_Paper.pdf.

Schlagwörter: Opinion Mining, Sentimentanalyse.

Abstract: Das Paper beschäftigt sich mit der Bewertung des Einsatzes automatischer Sprachübersetzungsverfahren zur Generierung von Testdaten zum Training multilingualer Sentiment-Classifier. Untersuchungsgegenstand waren die Sprachen Türkisch, Italienisch, Spanisch, Deutsch und Französisch. Die Evaluation zeigt, dass maschinelle und manuelle Übersetzungen von Originaltexten bei der Sentiment-Klassifizierung ähnliche Ergebnisse liefern. Weiterhin wird deutlich, dass schon die Nutzung geringer Anteile von annotierten Originaltexten zusätzlich zu übersetzten Daten zu einer weiteren Steigerung der Güte der Sentiment-Klassifizierung führt. 5 S.