Subspace Clustering
Steuerbares Subspace Clustering mit Visual Analytics
Das Hauptziel dieses Projekts ist die enge Integration von Visual Analytics in den Prozess der Erzeugung und Analyse von Subspace-Clustern.
Interessante Muster können sich in Subspaces eines großen Eingabe-Merkmalsraums befinden. Während bereits umfangreiche Forschungsarbeiten zur Entwicklung von Subspace Clustering-Algorithmen durchgeführt wurden, wurde der Entwicklung effektiver Visualisierungswerkzeuge zur Unterstützung der Analyse der Clustering-Ergebnisse erstaunlich wenig Aufmerksamkeit geschenkt. Geeignete Visualisierungstechniken könnten nicht nur dabei helfen, den Clustering-Prozess zu überwachen, sondern sie ermöglichen es dem Domänenexperten auch, den Subspace Clustering-Prozess anzuleiten und sogar zu steuern, um die interessierenden Muster aufzudecken. Zu diesem Zweck entwerfen wir ein Konzept, das skalierbare Subspace Clustering-Algorithmen mit interaktiven, skalierbaren Techniken zur visuellen Exploration kombiniert. Diese Arbeit wird die Aufgabe der vergleichenden Visualisierung und der durch Feedback gesteuerten Berechnung mehrerer alternativer Clusterings umfassen.
Im Folgenden führen wir eine Reihe von Systemen auf, die sich mit diesen Problemen befassen:
Subspace Search und Visualisierung zur Erschließung alternativer Clusterings in hochdimensionalen Daten
Eine systematische Methodik zur visuellen Analyse hochdimensionaler Daten, bei der ein durch Interessantheit geleiteter Subspace-Suchalgorithmus interessante Subspaces erkennt. Auf der Grundlage geeignet definierter Subspace-Ähnlichkeitsfunktionen visualisieren wir die Subspaces und stellen Navigationsmöglichkeiten bereit, um große Mengen von Subspaces interaktiv zu erkunden. Unser Ansatz ermöglicht es Nutzern, Subspaces hinsichtlich der beteiligten Dimensionen und Objektcluster effektiv zu vergleichen und in Beziehung zu setzen.
ClustNails: Visuelle Analyse von Subspace-Clustern
Subspace Clustering behandelt ein wichtiges Problem beim Clustering multidimensionaler Daten. In dünn besetzten multidimensionalen Daten sind viele Dimensionen irrelevant und verdecken die Clustergrenzen. Subspace Clustering hilft, indem es die Cluster ermittelt, die nur in lokal relevanten Teilmengen von Dimensionen vorhanden sind. Das Ergebnis des Subspace Clusterings durch Analysten zu verstehen, ist jedoch nicht trivial. Zusätzlich zu den Gruppierungsinformationen müssen relevante Dimensionsmengen sowie Überlappungen zwischen Gruppen analysiert werden, sowohl im Hinblick auf Dimensionen als auch auf Datensätze.
Wir präsentieren ein interaktives Visualisierungssystem namens ClustNails, um Subspace Clustering-Ergebnisse zu analysieren, zu navigieren, in Beziehung zu setzen und zu verstehen.
Weitere Informationen zu diesem und verwandten Arbeiten finden sich in den folgenden Publikationen.