Exploratory pipeline for analysis and visualization of large information spaces

Chakrabarti, Arnab; Jarke, Matthias (Thesis advisor); Quix, Christoph (Thesis advisor); Lakemeyer, Gerhard (Thesis advisor)

Aachen : RWTH Aachen University (2023)
Doktorarbeit

Dissertation, RWTH Aachen University, 2023

Kurzfassung

Das Aufkommen der vierten industriellen Revolution (Industrie 4.0) hat die Fähigkeit der heutigen wissenschaftlichen und kommerziellen Anwendungen zur Erzeugung, Speicherung und Verarbeitung riesiger Datenmengen vorangetrieben. Die visuelle Exploration von sehr großen Datensätzen mit vielen Attributen führt zu großen Diagrammen und visueller Unübersichtlichkeit, was zu einem Verlust der Interpretierbarkeit führt. Dieses Problem wird im Bereich der hochdimensionalen Datenexploration als "visuelles Rauschen" bezeichnet. In dieser Arbeit geht es um die Reduktion des visuellen Rauschens und die Verbesserung der Interpretierbarkeit von Daten, um interessante Muster in hochdimensionalen Datensätzen zu finden. Diese Aufgabe wird durch den sogenannten "Fluch der Dimensionalität" erschwert, der die visuelle Exploration behindert, da eine hohe Anzahl von Datendimensionen auf einem zweidimensionalen Bildschirm dargestellt werden muss. In dieser Arbeit stellen wir eine umfassende und flexible Datenexplorationspipeline für den Umgang mit hochdimensionalen Daten vor, um solche Herausforderungen zu entschärfen. Wir haben die vorgeschlagene Pipeline in den Prototyp "VizExplore" integriert, der als automatisiertes Explorationswerkzeug für die Überwachung von Prozessen in der Produktionstechnik dient. Für die verschiedenen Stufen der Pipeline schlagen wir zunächst Methoden zur Dimensionalitätsreduktion vor, um effektive Visualisierungen zu erzeugen. Damit adressieren wir das offene Forschungsproblem, eine optimale Lösung zur Maximierung der Datenreduktion bei gleichzeitiger Minimierung des Informationsverlustes zu finden. Zweitens schlagen wir ein Visualisierungs-Ranking-Modell vor. Wir entwickeln neuartige Methoden zur Extraktion visueller Merkmale aus Bildern und entwerfen einen generischen Bewertungsrahmen, der den Vergleich verschiedener visueller Strukturen auf einer einheitlichen Plattform ermöglicht. Schließlich nehmen wir das Wissen aus den ersten beiden Ebenen auf und schlagen ein Empfehlungssystem für Visualisierungen vor, das daten-spezifische Merkmale und die vom Benutzer beabsichtigten Explorationsaufgaben berücksichtigt. Wir entwerfen Empfehlungssysteme, die sowohl regelbasierte als auch wissensbasierte Ansätze verwenden, und zeigen die Wirksamkeit solcher Empfehlungssysteme bei der Verbesserung der Funktionalitäten des Explorationsprozesses auf, insbesondere im Bereich der hochdimensionalen Datenvisualisierung. Wir haben unser Explorationswerkzeug in verschiedenen Umgebungen evaluiert, darunter auch Daten, die aus Produktionsprozessen im Internet of Production (IoP) stammen. In dieser Arbeit zeigen wir die Anwendbarkeit unseres Modells im IoP für den Umgang mit hochdimensionalen Daten und die Generierung effektiver Visualisierungsempfehlungen, was wiederum die Entscheidungsfähigkeit für Produktionssysteme verbessert.

Einrichtungen

  • Fachgruppe Informatik [120000]
  • Lehrstuhl für Informatik 5 (Informationssysteme und Datenbanken) [121810]

Identifikationsnummern

Downloads