Visual Sentiment and Opinion Analysis
Die Analyse von Stimmungen und Meinungen in Textdaten hat in jüngster Zeit zunehmend an Interesse gewonnen. Der Hauptgrund dafür ist, dass die Menge an meinungsbehafteten, nutzergenerierten Inhalten im Web 2.0 rasant wächst. Menschen äußern ihre Meinungen und Stimmungen zu Produkten, Fotos, Politikern, Filmen, Hotels usw. Folglich ist eine merkmals- oder zielbasierte Sentiment Analysis erforderlich, um solche Daten zu analysieren, d. h. die Analyse beschränkt sich nicht auf die Bestimmung der Polarität (positiv/negativ) einer Stimmung, sondern bewertet auch, worauf sich die Stimmung bezieht. Die Unsicherheit, die mit einer solchen automatisierten Analyse mehrdeutiger natürlichsprachlicher Texte verbunden ist, sowie die große Anzahl potenziell interessanter Meinungsmuster erfordern fortschrittliche visuelle Schnittstellen für die interaktive Exploration. Unsere Forschung zielt auf die Entwicklung solcher Systeme ab, die geeignete automatische und visuelle Methoden integrieren. Ein weiteres besonderes Interesse gilt der visuellen Exploration der Entwicklung von Meinungen über die Zeit, sowohl in historischen Analysen als auch in Echtzeit. Die folgenden Absätze geben einen Überblick über vergangene und laufende Forschungsarbeiten.
Visuelle Analyse von Produktmerkmalen
Beim Erkunden von Kundenfeedback zu Produkten genügt es nicht zu sehen, ob ein Produkt allgemein gut oder schlecht bewertet wird. Viel wichtiger ist es zu erkunden, welche Aspekte oder Merkmale des Produkts den Kunden gefallen oder missfallen, zu sehen, welche Merkmale häufig kommentiert werden oder einen hohen Grad an Mehrdeutigkeit aufweisen, und verschiedene Produkte hinsichtlich ihrer Merkmale zu vergleichen. Abbildung 1 zeigt solche Details in einer einzigen Ansicht, die automatisch aus einer großen Menge von Kundenrezensionen generiert wurde.
Zielabhängige Trennung von Stimmungen und Meinungen
Eine zielbasierte Sentiment Analysis ist in manchen Fällen sogar dann relevant, wenn die Polarität eines gesamten Textes von Interesse ist. In Filmrezensionen schreiben Menschen beispielsweise sowohl über die Handlung als auch über die Qualität eines Films. Wenn jedoch innerhalb der Handlung des Films schlimme Dinge geschehen, bedeutet das nicht, dass es ein schlechter Film ist. Nur jene Stimmungswörter, die sich auf die Filmqualität beziehen, sollten berücksichtigt werden. Ein ähnlicher Fall liegt in der Domäne der Fotokommentare vor, wo Leute kommentieren könnten, dass etwas ein großartiges Foto eines schrecklichen Ortes sei. In einem ersten Versuch ist es uns gelungen, Meinungen zur Fotoqualität von allgemeinen Stimmungen zu den im Foto abgebildeten Objekten zu trennen. Das Ergebnis wurde als Eingabe für eine Visualisierung verwendet, die zeigt, welche geografischen Gebiete Orte und Objekte mit einer allgemein positiven oder negativen Assoziation enthalten.
Zeitabhängige Stimmungs- und Meinungsanalyse
Nicht nur die Stimmung gegenüber einem Ziel zu einem bestimmten Zeitpunkt ist von Interesse, sondern auch, wie sich diese Stimmung über die Zeit entwickelt. Dies ist beispielsweise interessant beim Verfolgen von Nachrichten über Politiker während eines Wahlkampfs, wie in Abbildung 2 gezeigt. Die Visualisierung ermöglicht es zu erkunden, welche Aussagen oder Handlungen von Politikern stark meinungsbehaftete Kommentare in den Nachrichten auslösen. Derzeit arbeiten wir auch an Visualisierungen, die eine Echtzeiterkennung interessanter Themen ermöglichen.
Weitere visuelle Kodierungen werden auf der linken Seite erläutert, und mehr Details finden sich im entsprechenden Paper.
Weitere Informationen zu dieser und verwandten Arbeiten finden sich in den folgenden Publikationen.