Multi-object tracking and person analysis from mobile robot platforms

Düren / Shaker Verlag (2020) [Buch, Doktorarbeit]

Seite(n): 1 Online-Ressource (viii, 130 Seiten) : Illustrationen, Diagramme

Kurzfassung

Multi-Objekt-Tracking ist ein breites und sehr aktives Forschungsgebiet im Bereich der Computer-Vision. Das Auffinden der Trajektorien mehrerer Personen in einer Szene ist eine wichtige Schlüsselkomponente in der Videoanalyse, der Überwachung, dem autonomen Fahren sowie der mobilen Robotik. Letztere Anwendung hat zu mehreren internationalen Forschungsprojekten geführt, die z.B. soziale Dienstplattformen entwickeln, auf deren Ergebnissen diese Arbeit basiert. Zunächst werden gängige Ansätze für bildbasiertes 2D Multi-Objekt-Tracking untersucht und exemplarische Methoden hinsichtlich ihrer Fehler analysiert. Wir schlagen einen Klassifikator vor, der Situationen lernt, in denen falschpositive Tracks auftreten, basierend auf Bounding Box Kontext Merkmalen. Die einzelnen Charakteristika ermöglichen eine Kombination der Ausgabe der Tracker und wir zeigen, dass dies zu einem verbesserten Gesamtergebnis führt. Dies zeigt nicht nur, dass es noch Verbesserungspotenzial für einzelne Methoden gibt, sondern auch, dass Multi-Objekt-Tracker unterschiedliche Stärken haben und wir immer alle Bewertungsmaßnahmen in Betracht ziehen müssen. Bei der Analyse der Ergebnisse dieser Tracker ist es daher wichtig, das Anwendungsszenario im Auge zu behalten. Wie bereits erwähnt, werfen wir einen Blick auf Roboterplattformen und untersuchen, wie gut aktuelle Multi-Objekt-Tracking Ansätze in diesen 3D-Welt Situationen funktionieren. Hierfür stellen wir eine hochgradig modulare Detektions-Tracking-Pipeline vor. Wir diskutieren wichtige Designentscheidungen unter Berücksichtigung der gewählten Datenassoziation oder des Einsatzes multimodaler Detektoren, bei denen eine komplexe Methode bzw. mehr Eingangsdaten nicht immer zu einer besseren Tracking-Performance führen. Wir erweitern dann die oben genannte Pipeline, um auch Personenanalysemodule als weitere modulare Komponente zu integrieren. Durch die Verwendung der eindeutigen Trajektorien können wir eine zeitliche Filterung auf die Analyseausgabe jeder getrackten Person anwenden. Am Beispiel der Schätzung von Kopf- und Körperhaltung zeigen wir, dass wir auf diese Weise ein geglättetes, verbessertes Ergebnis dieser Attribute erhalten. Darüber hinaus ist es möglich, diese Filter mit einem gewissen Schrittwert auszuführen, was zu einem enormen Leistungsschub im Umgang mit diesen teuren Deep Learning Methoden führt. Schließlich untersuchen wir auch einen neuen Multi-Objekt-Tracking Ansatz, der auf diesem erfolgreichen Deep-Learning-Framework aufbaut. Während bestehende Methoden oft tiefe Erscheinungs- oder Bewegungsmodelle verwenden, um die Datenassoziation zu unterstützen, versuchen wir, die Abhängigkeit von einem Detektor und damit die Notwendigkeit der Datenassoziation vollständig zu umgehen. Dazu nutzen wir ein starkes Re-Identifikationsmodell, das auf triplet loss basiert, innerhalb eines optimalen Bayes-Filter, welcher die theoretische Grundlage für viele Tracking Methoden bildet. Durch die Modellierung von Track Zuständen als vollständige Wahrscheinlichkeitsverteilungen können wir direkt auf den Eingangsbildern arbeiten und einen Schritt in Richtung eines Ende-zu-Ende Bild-zu-Track-Ansatzes machen.

Autorinnen und Autoren

Autorinnen und Autoren

Breuers, Stefan

Gutachterinnen und Gutachter

Leibe, Bastian
Groß, Horst-Michael

Identifikationsnummern

  • ISBN: 978-3-8440-7283-9
  • REPORT NUMBER: RWTH-2020-03423

Downloads