News
Perfect Labelling in der Erdbeobachtung – oder: Wie optimiere ich Referenzdaten?

Neue Publikation aus dem ForschungsForum beleuchtet Schlüsselrolle von Referenzdaten für dynamische Erdbeobachtungsanwendungen
14/04/2025
Das präzise Annotieren von Objekten in Bilddaten – das sogenannte „Labelling“ – ist essenziell für die Leistungsfähigkeit von KI (Künstliche Intelligenz) und ML (Machine Learning) - Modellen in der Erdbeobachtung. Doch was bedeutet perfekte Annotation in dynamischen Anwendungen wirklich? Die aktuelle Publikation aus dem ForschungsForum um Sarah Hauser und Andreas Schmitt an der Fakultät für Geoinformation zeigt: Gute Labels entstehen nicht zufällig – sie sind das Ergebnis strukturierter, oft komplexer Vorverarbeitungsprozesse. Wie also werden Referenzdaten in dynamischen EO-Anwendungen so optimiert, dass sie den hohen Anforderungen moderner KI/ML-Modelle gerecht werden?
Wissenschaft trifft Lehre
Ein besonderer Beitrag zur Publikation stammt von Lena Augner, Masterstudentin im Studiengang Geomatik. Sie hat sich im Rahmen ihres Masterseminars intensiv und sehr erfolgreich mit der Thematik auseinandergesetzt und ist nun Mitautorin des veröffentlichten Artikels. Ihr Engagement zeigt eindrucksvoll, wie eng an der Hochschule München Forschung und Lehre miteinander verknüpft sind. Sie steht exemplarisch auch dafür, wie Studierende frühzeitig aktiv an laufenden Studien mitwirken und somit bereits während des Studiums wertvolle Erfahrungen in Wissenschaft und Forschung sammeln können.
Referenzdaten im Fokus
Trotz rasanter Fortschritte bei Machine-Learning- und Deep-Learning-Architekturen bleibt die Aufbereitung und Harmonisierung von Referenzdaten eine zentrale Herausforderung. Ohne sorgfältige Vorverarbeitung können fehlerhafte oder inkonsistente Labels zu Verzerrungen in der Prädiktion führen, mit negativen Auswirkungen auf die Modellgüte und vor allem die Übertragbarkeit. Die Open-Access-Publikation „Perfect Labelling: A Review and Outlook of Label Optimization Techniques in Dynamic Earth Observation“ bietet einen umfassenden Überblick über aktuelle Herausforderungen und Lösungsansätze im Umgang mit Referenzdaten für dynamische Erdbeobachtungsanwendungen. Im Fokus stehen dabei vier zentrale Themenbereiche:
Zum einen werden grundlegende Schritte erläutert, mit denen konsistente und qualitativ hochwertige Referenzdatensätze erstellt werden können, eine Voraussetzung für zuverlässige KI/ML-gestützte Analysen. Darüber hinaus stellt die Publikation bewährte Verfahren und Empfehlungen vor, wie sich Preprocessing-Workflows effizient skalieren und automatisieren lassen. Ein weiterer Schwerpunkt liegt auf dem neu entwickelten HELIX-Framework, das einen standardisierten Ansatz zur Vereinheitlichung und Automatisierung von Label-Prozessen bietet. Abschließend wirft das Autorenteam einen Blick in die Zukunft und diskutiert, welche Entwicklungen in der Referenzdatenverarbeitung künftig zu erwarten sind, insbesondere im Hinblick auf die Integration dynamischer EO-Daten.
Labels im Wandel der Zeit: Was bin ich – und wann?
Am Beispiel eines klassifizierten Waldszenarios (Abbildung 1) wird deutlich, wie entscheidend präzise und zeitlich dynamische Labels für den Erfolg von KI- und ML-Modellen in der Erdbeobachtung sind. Verschiedene Entwicklungsstadien der Fichte – von der jungen über die mittelalte bis hin zur alten Fichte – sowie stehendes und liegendes Totholz zu einem gewissen Aufnahmezeitpunkt sind detailliert beschriftet. In der Praxis müssen diese Daten aber mit Satellitenaufnahmen zu anderen Zeitpunkten verschnitten werden, um verlässliche Annotationen für die Bilder aus dem All zu generieren. Dieses visuelle Beispiel macht klar: nur wenn sich die zeitliche Veränderung von Objekten in den Referenzdaten widerspiegelt, können KI/ML-Modelle lernen, diese Dynamik korrekt anhand von Satellitenbildern zu interpretieren. Kontextbezogene und feingranulare Annotationen sind daher unverzichtbar für belastbare Analysen und verlässliche Vorhersagen.
