WaterDetect : une méthode non supervisée pour la détection automatisée des surfaces en eau par imagerie optique
La surveillance des surfaces en eaux est une information essentielle pour la gestion des ressources en eau. C’est également une information de base pour le traitement automatisé des images satellite en vue de l’inversion du signal pour cartographier des paramètres d’intérêts comme la qualité des eaux. C’est à cette fin que l’équipe du GET, au sein du CES Couleur des Eaux continentales et en collaboration avec le CES Cartographie et suivi des surfaces en eau, a développé un algorithme automatique non paramétrique non supervisé pour l’identification des pixels des eaux intérieures dans des images satellites individuelles. Bien qu’il existe une assez grande quantité de travaux disponibles sur le sujet, il n’y a pas de consensus de la communauté sur un algorithme permettant une détection robuste des eaux, sans information a priori sur la scène et permettant d’analyser des images uniques venant d’être acquises.
L’article qui vient d’être publié dans Remote Sensing of Environment propose une approche originale en utilisant un regroupement multidimensionnel et un sous-échantillonnage hautement performant pour le traitement rapide de scènes entières Sentinel-2 (moins de 2 minutes), le tout regroupé au sein de l’algorithme « SurfWater ».
WaterDetect se base sur une technique de clustering pour identifier des échantillons similaires dans un espace de données multidimensionnel et permet de s’affranchir de l’attribution de seuils toujours difficile à paramétrer lors d’une utilisation globale. L’algorithme WaterDetect exploite les informations spectrales et les indices dérivés pour caractériser chaque pixel de scène individuellement. Une approche d’apprentissage automatique, avec sous-échantillonnage aléatoire et généralisation par un classificateur Naïve Bayes, a également été développée afin de rendre possible l’application de WaterDetect à de grandes scènes.
Une validation robuste
La précision a été évaluée à l’aide d’un ensemble de données indépendant construit par le CNES avec la méthodologie ALCD . Celle-ci fournit des plans d’eau sur 15 images Sentinel-2 au-dessus de la France, acquises à différentes saisons et couvrant une large gamme de types de plans d’eau et de couleurs de l’eau. L’ensemble des données de validation rassemble plus de 1 200 km2 de surface d’eau (environ 12 millions de pixels) sur 80 000 plans d’eau, assurant une validation robuste.
Les résultats de la classification des pixels d’eau ont été comparés à différentes autres méthodes et, notamment, aux produits fournis par trois des principales chaînes de production de niveau 2A (MAJA, Sen2Cor et FMask) ainsi qu’à deux des techniques de seuillage les plus courantes: Otsu et Canny-edge. La méthode WaterDetect a obtenu le score kappa moyen le plus élevé, de 0,874, dans toutes les scènes testées, avec un kappa par scène allant de 0,608 à 0,980 et un écart-type moyen inférieur de 0,091. En comparaison, pour les masques à eau fournis par des processeurs génériques, FMask a obtenu le meilleur résultat avec un kappa global de 0,764. Une analyse approfondie montre une baisse rapide des performances pour toutes les méthodes considérant les plans d’eau dont la surface est inférieure à 0,5 ha, mais l’algorithme WaterDetect s’est révélé être encore le meilleur pour les plus petits plans d’eaux, améliorant de 34 % la précision de la cartographie.
Le code est actuellement transféré à THEIA pour des tests à grande échelle dans les produits « Surfwater » et « Obs2Co » et fait partie du test comparatif d’algorithmes initié par l’ESA (initiative WorldWater – Round Robin comparison).
Référence
Contact
Jean-Michel Martinez
UMR GET – Directeur de Recherche IRD
Mauricio Cordeiro
Santiago Peña-Luque
Cesbio