Using hardware performance footprints of HPC benchmarks for job embedding
- Job Embedding mithilfe von Hardware Performance Charakteristika verschiedener HPC Benchmarks
Eckhardt, Jonas; Müller, Matthias S. (Thesis advisor); Schulz, Martin (Thesis advisor); Schürhoff, Daniel (Consultant)
Aachen : RWTH Aachen University (2023)
Masterarbeit
Masterarbeit, RWTH Aachen University, 2022
Kurzfassung
Während Hardware-Leistungsindikatoren bereits in modernen Hochleistungsrechnersystemen gesammelt werden, können sie derzeit nur manuell und von Experten in einem meistens zeitaufwändigen Prozess ausgewertet werden. Die automatische Auswertung von Leistungsindikatoren würde die Möglichkeit bieten, diesen Prozess zu beschleunigen und ermöglicht neue Anwendungen wie Jobklassifizierung, automatisches Benutzerfeedback, Überwachung des Systemzustands, automatische Jobkennzeichnung und vieles mehr. Eine automatische Auswertung ist erschwert, weil die gesammelte Daten keine Kennzeichnung (Labelling) besitzen und Klassifizierungsregeln schwer zu definieren sind. Des Weiteren ist die automatische Auswertung beschränkt durch die hohe zeitliche Dimensionalität trotz einer geringen Auflösung, sowie einer hohen Dimensionalität durch die Anzahl der Kerne, Knoten und der gesammelten Hardware-Leistungsindikatoren. Dafür werden in dieser Arbeit gekennzeichnete Daten gesammelt und auf diesen verschiedene statistische Methoden, sowie Autoencoder, Hauptkomponentenanalyse und Feature Agglomeration, zur Reduzierung der Dimensionalität angewandt. Die Qualität wird durch eine überwachten Lernaufgabe bewertet und verglichen, was zu einer begründeten besten Reduzierung der Dimensionalität der gesammelten Daten führt. Das Ziel der Aufgabe besteht darin, anhand der gemessenen Hardware-Leistungsindikatoren mithilfe von neuronalen Netzen, naiven Bayes-Klassifikatoren, Entscheidungsbäumen und Support-Vektor-Maschinen vorherzusagen, welcher von einer Auswahl an Benchmarks ausgeführt wurde. Weil die Dimensionsreduktion abhängig von der zugrunde liegenden Hardware ist, wird ein Framework vorgestellten, dass die beste Reduktion auf zukünftigen Architekturen und für andere Aufgaben findet. Die beste Einbettung reduziert die Dimensionalität mit statistischen Methoden und Feature Agglomeration auf eine Dimension von 20 und ist dennoch in der Lage, die ausgeführte Anwendung mit einer Präzision, Genauigkeit und einem Recall von über 99\% vorherzusagen. Eine Präzision von über 90\% kann durch Einbetten in einen 5-dimensionalen Raum erreicht werden. Darüber hinaus belegen die Ergebnisse, dass die dadurch gewählte Einbettung die k-Means Clustering Qualität um den Faktor sieben bis zwölf verbessert.
Identifikationsnummern
- DOI: 10.18154/RWTH-2022-10349
- RWTH PUBLICATIONS: RWTH-2022-10349