Abschlussarbeit
Erkennung von Waldschäden anhand von Satellitenbildern mittels (un)überwachter Klassifikatoren

Details
- Extern/e Autor:in
- Andreas Wagner (Geoinformatik und Navigation),
Simon Köfferlein (Kartographie|Geomedientechnik) - Intern/e Betreuer:in
- Prof. Dr.-Ing. Andreas Schmitt , Sarah Hauser
- Abschluss
- Bachelor
- Jahr
- 2025
- Fakultät
- Fakultät für Geoinformation
- Status
- abgeschlossen
- Themengruppe
- Photogrammetrie_Fernerkundung
Motivation
Die deutschen Wälder stehen infolge des Klimawandels vor erheblichen Herausforderungen. Geschwächte Forstbestände sind zunehmend anfällig für biotische Stressfaktoren wie den Borkenkäferbefall. Laut der Waldzustandserhebung 2023 [1] des Bundesministeriums für Ernährung und Landwirtschaft (BMEL) bleibt der Kronenzustand der Bäume besorgniserregend – insbesondere, da die Wälder, anders als noch bis 2017, nicht mehr zuverlässig als Kohlenstoffsenken funktionieren. Dabei gilt ihre Fähigkeit zur Kohlenstoffspeicherung als zentrales Element im Kampf gegen den Klimawandel.
Gemäß der Forstinventur 2017 [2] stellen kleine Privatwälder mit einem Flächenanteil von 24,2 % die zweitgrößte Eigentumsform dar. Mit einer durchschnittlichen Kohlenstoffspeicherung von 1,53 Tonnen pro Hektar und Jahr sind sie zudem die effizientesten Kohlenstoffspeicher unter den Waldtypen. Diese Zahlen unterstreichen die hohe Bedeutung kleiner Privatwälder für den Klimaschutz. Da diese Flächen jedoch weniger intensiv überwacht werden als staatliche Wälder und ihre wirtschaftliche Nutzung oft eingeschränkt ist, besteht besonderer Handlungsbedarf. Um ihre Funktion als Kohlenstoffspeicher langfristig zu sichern, ist eine flächendeckende und kosteneffiziente Erfassung biotischer Schäden notwendig. Automatisierte Fernerkundungsverfahren bieten hier großes Potenzial für eine kontinuierliche und skalierbare Überwachung und können somit wesentlich zum Erhalt der Wälder beitragen.
Maschinelles Lernen zur Waldschadendetektion
Die frühzeitige Erkennung von Waldschäden ist angesichts des Klimawandels eine zentrale Herausforderung. Besonders der stark zunehmende Borkenkäferbefall der letzten Jahre erfordert effiziente und skalierbare Monitoring-Methoden. Dabei stellt sich die Frage, inwieweit maschinelle Lernverfahren, sowohl überwachte als auch unüberwachte, in der Lage sind, Waldschäden auf Basis von Satellitendaten zuverlässig zu identifizieren.
Im Rahmen dieses Projekts werden zwei zentrale Datensätze verwendet. Für die Durchführung und Bewertung der Klassifikation sind Referenzdaten erforderlich, die von der Nationalparkverwaltung Bayerischer Wald im Rahmen der Datapool-Initiative [3] bereitgestellt werden. Die verwendeten Satellitenaufnahmen stammen aus dem Analysis Ready Data Cube des Projekts „Wald5Dplus“ [4]. Dieser frei zugängliche Open Access Benchmark-Datensatz umfasst kalibrierte und fusionierte Sentinel-1- und Sentinel-2-Daten, begleitende Waldparameter als Label sowie Software-Tools zur Übertragung der Methodik auf andere Regionen. Genutzt werden Sentinel-2-Aufnahmen aus den Jahren 2020 und 2021 im sichtbaren sowie im nahen Infrarot-Bereich, ergänzt durch sogenannte Kennaugh-like-Elemente. Diese vielfältige Datengrundlage ermöglicht eine fundierte und belastbare Klassifikation von Waldschäden mittels maschinellen Lernens.
Überwachte Klassifikation/Regression mit Random Forest
Die überwachte Klassifikation nutzt für das maschinelle Lernen annotierte Daten. Diese werden als Trainingsdaten für die Parameterbestimmung verwendet. Der Algorithmus nutzt die Labels, um mehrere sogenannte Entscheidungsbäume zu erstellen. Damit können unbekannte Daten mithilfe der Mehrheit (Classifier) oder aufgrund des Verhältnisses (Regressor) zugeordnet werden.
Die Modelle sind damit in der Lage auf Grundlage dementsprechender Trainingsdaten Kalamitäten zu identifizieren. Hierbei liegt der Aufwand im Erheben solcher Datensätze. Für die Schadflächen liegen diese bereits vor. Für gesunden Wald gibt es allerdings keine Referenz. Die Erhebung von Waldzustandsdaten fokussiert sich auf Anomalien und liefert daher wenig Aussagekraft zu möglichst gesunden Waldflächen. Die Erstellung dieses Datensatzes erfolgt daher auf Grundlage der Abwesenheit von Störflächen wie Freiflächen, Verkehrsflächen und zurückliegende Kalamitäten.
Die Klassifikation erfolgte auf Basis von Sentinel-2-Daten des Wald5Dplus-Projekts. Dabei konnte eine hohe Präzision von bis zu 97 % bei guten Klassifikationsergebnissen (Kappa-Wert bis 0,83) erzielt werden. Vor allem großflächige Schadflächen wurden zuverlässig erfasst (Abbildung 1). Neben bekannten Totholzflächen, welche Teil der Trainingsdaten waren, konnten auch weitere Störfaktoren wie Wege und Gewässer detektiert werden.
Der primäre Unterschied zwischen dem Klassifikator und dem Regressor zeigte sich insbesondere bei sich derzeit regenerierenden Flächen (Abbildung 2). Diese Schadflächen, die deutlich vor dem Zeitraum der Trainingsdaten entstanden waren, wurden durch den Regressor wesentlich detaillierter erfasst. So konnten innerhalb dieser Flächen Störungen wie Arbeitswege und Schneisen detektiert werden.
Unüberwachte Klassifikation mit Isolation-Forest
Im Rahmen dieses Teilprojekts wird der Isolation Forest als unüberwachtes Verfahren eingesetzt, um potenzielle Waldschäden automatisch zu erkennen. Dabei kommen lückenlose Satellitenzeitreihen von Sentinel-2 aus dem Wald5Dplus-Datensatz zum Einsatz, die umfassende multispektrale und multi-temporale Informationen enthalten. Anders als bei überwachten Methoden, bei denen vorab bekannte Schadensmuster als Trainingsdaten dienen, arbeitet der Isolation Forest ohne explizite Annotationen. Der Algorithmus teilt die Daten zufällig in Entscheidungsbäume auf und identifiziert jene Datenpunkte, die in weniger dichten Regionen des Merkmalsraums liegen: typischerweise Anomalien, wie etwa ungewöhnliche Ansammlungen von Totholz, die auf beginnende Schäden hindeuten könnten (Abbildung 3).
Zur Optimierung der Modellparameter wurde insbesondere der Kontaminationsparameter im Rahmen einer Grid-Optimiziation schrittweise variiert. Die Ergebnisse zeigen, dass ein Wert von etwa 0,4 den besten Kompromiss bietet (Abbildung 4). So werden möglichst viele relevante Anomalien (Schadensbereiche) erkannt, während gleichzeitig Fehlalarme minimiert werden. Darüber hinaus ergaben Simulationen, bei denen künstlich fehlende Daten eingeführt wurden, dass der Isolation Forest auch unter suboptimalen Datenbedingungen (z.B. Datenlücken durch Wolkenbedeckung in den Zeitreihen) stabile und konsistente Ergebnisse liefert (Abbildung 5).
Ein solches System könnte künftig eine kontinuierliche und flächendeckende Überwachung des Waldzustands ermöglichen und so potenzielle Schäden frühzeitig erkennbar machen. Dies würde nicht nur den Aufwand für manuelle Inspektionen deutlich verringern, sondern auch die Grundlage für schnelle, gezielte Maßnahmen zur Schadensbegrenzung und Wiederaufforstung schaffen. Insgesamt zeigt sich der unüberwachte Ansatz mit dem Isolation Forest als vielversprechende Komponente für eine automatisierte und skalierbare Waldschadendetektion.
Abbildungen
Quellen
[1] Bundesministerium für Ernährung und Landwirtschaft (BMEL). (2024). Waldzustandserhebung 2023. Berlin. Verfügbar unter: https://www.bmel.de/SharedDocs/Downloads/DE/Broschueren/waldzustandserhebung-2023.pdf
[2] Riedel, T., Stürmer, W., Hennig, P., Dunger, K. & Bolte, A. (2017). Wälder in Deutschland sind eine wichtige Kohlenstoffsenke. AFZ-DerWald, 14, 14–18. Verfügbar unter: https://www.thuenen.de/media/institute/wo/Waldmonitoring/THG/Projekt/CI2017/AFZ_14_19_Kohlenstoff_Artikel_2_Riedel.pdf
[3] Latifi, H., Holzwarth, S., Skidmore, A., Brůna, J., Červenka, J., Darvishzadeh, R., Hais, M., Heiden, U., Homolová, L., Krzystek, P., Schneider, T., Starý, M., Wang, T., Müller, J. & Heurich, M. (2021). A laboratory for conceiving Essential Biodiversity Variables (EBVs)—The ‘Data pool initiative for the Bohemian Forest Ecosystem’. Methods in Ecology and Evolution, 12(11), 2073–2083. Verfügbar unter: https://doi.org/10.1111/2041-210X.13695 (Zugriff am 10.12.2024).
[4] Hauser, S., Ruhhammer, M., Schmitt, A., & Krzystek, P. (2024). An Open Benchmark Dataset for Forest Characterization from Sentinel-1 and -2 Time Series. Remote Sensing, 16(3), 488. https://doi.org/10.3390/rs16030488
[5] ESRI Satellite (ArcGIS/World_Imagery) (2017). Available at: https://qms.nextgis.com/geoservices/1300/ (Zugriff am 01.12.2024)