Learned fingerprinting-based models for reliable localization in large buildings
Laska, Marius; Blankenbach, Jörg (Thesis advisor); Krisp, Jukka (Thesis advisor)
Aachen : RWTH Aachen University (2023)
Doktorarbeit
Dissertation, Rheinisch-Westfälische Technische Hochschule Aachen, 2023
Kurzfassung
Standortbezogene Dienste (LBS) wie die Navigation oder die ortsbezogene Suche sind in unserem Alltag allgegenwärtig. Doch wie lässt sich erklären, dass LBS in Innenräumen kaum verfügbar sind, obwohl wir Menschen einen großen Teil unserer Zeit in Gebäuden verbringen? Der Hauptgrund dafür liegt darin, dass bestehende Technologien wie globale Satellitennavigationssysteme (GNSS) dort nicht zuverlässig funktionieren, da die auftretende Signaldämpfung und Mehrwegeausbreitung die Positionsbestimmung verfälschen. Die Suche nach alternativen technologischen Lösungen stellt nach wie vor ein aktives Forschungsfeld dar. In den letzten Jahren hat eine als Fingerprinting bezeichnete Technik den Weg zur massenmarktfähigen Personenlokalisierung in Innenräumen geebnet. Dabei wird davon ausgegangen, dass je nach Position im Gebäude ein charakteristischer Fingerabdruck beobachtet werden kann, der sich üblicherweise aus den Signalstärken (RSS) der empfangbaren Sendestationen (z.B. WLAN-Access Points) zusammensetzt. Der Zusammenhang zwischen Fingerabdrücken und ihren Aufzeichnungsorten kann überwacht erlernt und anschließend zur Positionierung genutzt werden. Daraus resultierte ein verstärktes Interesse, die aktuelle Dynamik im Bereich des Deep Learnings auf die Problemstellung zu übertragen. Es gibt jedoch einige theoretische und praktische Herausforderungen, die sich im Zusammenhang mit RSS-basierten Fingerabdrücken ergeben. Aus theoretischer Sicht ist RSS aufgrund von Effekten wie Mehrwegeausbreitung instabil. Selbst kleine Positionsänderungen oder geringfügige Veränderungen der Umgebung können dazu führen, dass sich die RSS stark unterscheidet. Künstliche Neuronale Netze (KNN) sind in der Lage, Approximationen der komplexe Lokalisierungsfunktion trotz verrauschter Merkmale wie RSS zu erlernen. Die theoretisch erreichbare Positionierungsgenauigkeit wird allerdings durch die Instationarität der RSS begrenzt. Aus praktischer Sicht erhöht die Notwendigkeit eines gelabelten Datensatzes den Aufwand für die Einrichtung von Fingerprinting-basierten Systemen. Zusätzlich müssen trainierte Modelle für den Einsatz auf Endnutzergeräten mit der verfügbaren Hardware und Software kompatibel sein. In diesem Zusammenhang ergeben sich die folgenden Forschungsfragen, welche in der vorliegenden kumulativen Dissertation behandelt werden: Wie kann die Zuverlässigkeit der Indoor-Lokalisierung mittels KNN trotz der Einschränkungen von RSS-Fingerprinting erhöht werden? Wie kann das digitale Gebäudemodell beim Training des KNN genutzt werden? Wie können Modelle entworfen werden, die eine effiziente Positionierung auf Endgeräten selbst für große, mehrstöckige Gebäude ermöglichen? Wie lässt sich die Erfassung von gelabelten Fingerabdrücken vereinfachen, ohne dass die für das Training erforderliche Labeling-Genauigkeit beeinträchtigt wird? Um die Zuverlässigkeit der Standortbestimmung zu erhöhen, wird der aktuelle Aufenthaltsbereich geschätzt, anstatt die genaue Position der benutzenden Person zu bestimmen. Die Annahme ist, dass eine gröbere Positionsschätzung mit höherer Zuverlässigkeit möglich ist. Als Alternative zur Bereichsklassifizierung anhand einer vorab bestimmten Grundrisssegmentierung wird eine neuartige Modellfamilie eingeführt, die lernt, den Bereich der nutzenden Person nur auf der Grundlage eines gegebenen Fingerabdrucks zu schätzen. Durch die Integration des Gebäudemodells in die Lernphase des Modells stimmen die vorhergesagten Bereiche mit der zugrundeliegenden Gebäudestruktur überein, während ihre individuellen Geometrien gelernt und nicht durch eine Vorsegmentierung festgelegt werden. Standardmetriken wie die Klassifizierungsgenauigkeit reichen nicht für die Evaluierung von Modellen zur Bereichslokalisierung aus, da die Granularität der geschätzten Flächen und ihre Kongruenz mit dem zugrundeliegenden digitalen Gebäudemodell den Informationsgewinn der benutzenden Person beeinflussen. Daher wird unter Berücksichtigung der identifizierten Qualitätsdimensionen eine Metrik eingeführt, welche Interpretierbarkeit für klassische Punktschätzungsmodelle beibehält und dadurch einen Vergleich ermöglicht. Aufgrund der durchgeführten Evaluierung lässt sich folgern, dass mit den vorgestellten Modellen zur Bereichslokalisierung die Zuverlässigkeit der Standortschätzung erhöht werden kann. Die entwickelten Modelle können effizient für große, mehrstöckige Gebäude skaliert werden, während stets ein einziger Forward-Pass eines einzigen KNN zur vollständigen Positionsbestimmung benötigt wird. Hierdurch kann die komplexe Wartung mehrerer Modelle vermieden und der Einsatz auf Smartphones erleichtert werden. Darüber hinaus wird die Lokalisierung in großen Gebäuden mittels Multi-Task-Learning (simultane Gebäude- und Stockwerkbestimmung sowie Koordinatenschätzung) explizit angegangen. Das vorgeschlagene Modell führt eine grobe Gitterzellenklassifizierung durch und schätzt gleichzeitig die Koordinaten innerhalb des lokalen Koordinatensystems der gewählten Gitterzelle. Um große Fehler im Falle einer Gitterzellen-Fehlklassifizierung zu vermeiden, wird die Technik des Multi-Cell-Encoding-Learnings (m-CEL) vorgeschlagen, bei der das Modell mehrere redundante Positionsrepräsentationen innerhalb einer leicht überlappenden Gitterzellenkodierung erlernt. Es wird gezeigt, dass dieses Modell aktuelle Multitasking-Lernmodelle in mehreren öffentlichen Benchmark-Datensätzen übertrifft. Eine Einschränkung des Fingerprintings ist die Abhängigkeit von zuvor gesammelten gelabelten Daten. Um den erforderlichen Aufwand für die Datenerfassung zu reduzieren, wird eine Pipeline für die automatische Kennzeichnung der gesammelten Fingerabdrücke vorgestellt. Basierend auf der visuellen inertialen simultanen Lokalisierung und Kartierung (VI-SLAM) wird eine Smartphone-Anwendung entwickelt, die ihre Positionen während der Fingerabdruckerfassung aufzeichnet. In einer anschließenden Fallstudie wird gezeigt, dass die vorgestellten Positionierungsmodelle mit der entwickelten Pipeline effizient in einem mehrstöckigen Universitätsgebäude bereitgestellt werden können. Alle Modelle sowie die Datenerfassungspipeline sind als Open-Source verfügbar, um zukünftige Forschungen im Bereich der Indoor-Positionierung zu fördern und als Black-Box-Input für die angewandte Forschung im Bereich der Indoor-LBS zu dienen.
Einrichtungen
- Lehrstuhl für Bauinformatik und Geoinformationssysteme und Geodätisches Institut [316210]
Identifikationsnummern
- DOI: 10.18154/RWTH-2023-07372
- RWTH PUBLICATIONS: RWTH-2023-07372
Downloads
Verwandte Publikationen
- [RWTH-2020-05726] Adaptive Indoor Area Localization for Perpetual Crowdsourced Data Collection
- [RWTH-2021-05105] DeepLocBox: Reliable Fingerprinting-Based Indoor Area Localization
- [RWTH-2022-04656] DeepLocBIM : Learning Indoor Area Localization Guided by Digital Building Models
- [RWTH-2022-01551] Topology Preserving Input Image for Convolutional Neural Network Based Indoor Localization
- [RWTH-2022-03260] Multi-Task Neural Network for Position Estimation in Large-Scale Indoor Environments
- [RWTH-2023-01052] VI-SLAM2tag: Low-Effort Labeled Dataset Collection for Fingerprinting-Based Indoor Localization