1. Trang chủ
  2. » Ngoại Ngữ

Cartographie de caracteritiques de la surface du sol par traitement de donnees sentinel 2

80 53 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 80
Dung lượng 3,3 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Réalisée en lien avec une activité de recherche au sein de l’unité mixte derecherche UMR du laboratoire d’études des interactions entre sols agrosystème ethydrosystème LISAH, cette étude

Trang 1

UNIVERSITE NATIONALE DU VIETNAM, HANOI INSTITUT FRANCOPHONE INTERNATIONAL

TSHIBANDA NKOLONGO Franck

Sentinel-2"

" Lập bản đồ đặc tính mặt đất bằng xử lý dữ liệu SENTINEL-2"

MÉMOIRE DE FIN D’ÉTUDES DU MASTER INFORMATIQUE

HANOI – 2019

Trang 2

UNIVERSITE NATIONALE DU VIETNAM, HANOI INSTITUT FRANCOPHONE INTERNATIONAL

TSHIBANDA NKOLONGO Franck

Sous la direction de :

Mme GOMEZ Cécile , Chargée de recherche à l’IRD

M BAILLY Jean-Stéphane, Enseignant chercheur à AgroParisTech

HANOI – 2019

Trang 3

UNIVERSITÉ NATIONALE DU VIETNAM À HANỌ INSTITUT FRANCOPHONE INTERNATIONAL

MÉMOIRE DE FIN D’ÉTUDES DE MASTER INFORMATIQUE

Cartographie des caractéristiques de la surface du sol par

traitement de données Sentinel-2

TSHIBANDA NKOLONGO Franck

Trang 4

ATTESTATION SUR L’HONNEUR

J’atteste sur l’honneur que ce mémoire a été réalisé par moi-même et que les données

et les résultats qui y sont présentés sont exacts et n’ont jamais été publiés ailleurs Lasource des informations citées dans ce mémoire a été bien précisée

LỜI CAM ĐOAN

Tôi cam đoan đây là công trình nghiên cứu của riêng tôi

Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được aicông bố trong bất kỳ công trình nào khác Các thông tin trích dẫn trong Luận văn đãđược chỉ rõ nguồn gốc

TSHIBANDA NKOLONGO

Trang 5

Table des matières

Introduction 1

1 Enjeux et objectifs de l’étude 1

1.1 Enjeux de l’étude 1

a) Lien entre EDS et Infiltrabilité 1

1.2 La Télédétection 3

1.2.1 Éléments de contexte 3

1.2.2 Télédétection Multispectrale 3

a) Principes généraux 3

b) Spectroscopie 5

c) Télédétection en milieu agricole 6

1.2.3 Télédétection Multispectrale et Multi Temporelle: Sentinel-2 8

1.3 Objectif de l’étude 10

1.4 Approches adoptées 10

2 Contexte Administratif du stage 11

2.1 Situation au sein de l’UMR LISAH 11

2.2 Situation dans le projet TOSCA A-MUSE 11

Matériels et Données 13

2.1 Site d’étude 13

2.1.1 Localisation géographique 13

2.1.2 Les parcelles observées 14

2.2 Présentation des données disponibles 14

2.2.1 Données satellitaires 15

2.2.1.1 Caractéristiques brutes 15

2.2.2 Données terrain 18

Méthodologie d’analyse de profils temporels spectraux 26

3.1 Contexte 26

3.1.1 Introduction à la classification 26

3.1.2 Données Fonctionnelles et Analyse fonctionnelle 27

3.2 Méthode de Classification Kmeans 29

3.2.1 Algorithme 30

3.2.2 Choix du nombre K de classes 31

3.2.3 Implémentation KMeans 33

3.2.4 Critères de qualité de classification 33

3.3 Méthode de Classification Funcy 34

3.3.1 Préparation des données 34

3.3.2 Classification fonctionnelle basée sur le modèle de mélange EM 35

3.3.3 Implémentation de la classification fonctionnelle 37

3.3.4 Mesure de qualité 40

3.4 Implémentation selon les approches 40

Résultats 45

4 1 Approche univariée 45

4 1.1 Classification sur indice de végétation (NDVI) 45

4 1.2 Classification de la végétation verte Observée sur le terrain 49

4 2 Approche multivariée 53

4 2 1 Classification sur Sentinel-2 multispectrale 53

4 2.2 Classification sur les variables observées au sol 58

4.3 Comparaison des méthodes 61

4.3.1 Kmeans, funHDDC et Funcy : Univariée 62

Trang 6

4.3.2 Kmeans, funHDDC et Funcy : multivariée 63 Conclusion 65 Bibliographie 67

Trang 7

Index des illustrations

Trang 9

Réalisée en lien avec une activité de recherche au sein de l’unité mixte derecherche (UMR) du laboratoire d’études des interactions entre sols agrosystème ethydrosystème (LISAH), cette étude porte sur l’analyse de la forte variabilité des états

de surfaces au cours d’une année culturale, notamment des cycles de développementdes cultures, liée aux différentes pratiques agricoles ainsi qu'aux conditionsmétéorologiques changeants, qui rendent difficile l'utilisation de méthodes classiques

de cartographie d'occupation du sol Nous proposons de développer puis de tester denouvelles méthodes plus automatiques et robustes, permettant d'exploiter le potentieloffert par les séries temporelles d’images satellites à haute résolution visible selondeux approches : univariée (NDVI) et multivariée (10 bandes de réflectance), baséssur des algorithmes d’apprentissage non supervisés dans le bassin versant deKamech, en Tunisie Une méthode permettant de reconstituer les successions decultures a pu être mise en œuvre et testée à l'aide d'analyse de données satellitairesSentinel-2, couplée à des observations de terrain Une approche base de données estutilisée pour identifier les différents cycles de développement culturaux à partir duprofil temporel NDVI de chaque pixel Les résultats obtenus démontrent la pertinence

de l'approche innovante ici testée

Mots clés : agriculture, classification fonctionnelle, télédétection, occupation

du sol, série temporelle, NDVI, algorithme, États de surfaces

Trang 10

Conducted in connection with a research activity within the Joint ResearchUnit (UMR) of the Agrosystem and Hydrosystem Soil Interactions Laboratory(LISAH), this study focuses on analyses the high variability of surface conditionsduring a crop year, particularly crop development cycles, linked to differentagricultural practices and changing weather conditions, which make it difficult to useconventional land use mapping methods We propose to develop and test new, moreautomatic and robust methods to exploit the potential offered by time series of high-resolution visible satellite images using two approaches: univariate (NDVI) andmultivariate (10 reflectance bands), based on unsupervised learning algorithms in theKamech watershed in Tunisia A method for reconstructing crop successions could beimplemented and tested using Sentinel-2 satellite data analysis, coupled with fieldobservations A database approach is used to identify the different crop developmentcycles based on the NDVI time profile of each pixel The results obtaineddemonstrate the relevance of the innovative approach tested here

Keywords: agriculture, functional classification, remote sensing, Tunisia, land cover,

time series, NDVI, algorithm

Trang 11

Tous mes remerciements s’adressent aux responsables et corps scientifiques

de l’Institut Francophone International M Ngô Tự Lập, Directeur, et son adjoint, M

Hồ Tường Vinh qui ont contribué à ce que ce travail devienne réalité et qui y ont,pendant ces deux années, apporté leur contribution Mes remerciements s'adressentégalement à mes superviseurs de stage : Cécile Gomez (IRD, UMR LISAH) et Jean-Stéphane Bailly (AgroParisTech, UMR LISAH) Leur temps qu’ils ont consacrés, leurpatience, leur aide et leur disponibilité ont permis une collaboration enrichissante,autant sur le plan professionnel que personnel En outre, je leur suis trèsreconnaissant pour m’avoir fait participer dans un projet d’envergure à savoir leprojet A-MUSE qui porte sur la surveillance de de caractéristiques observables de lasurface du sol en lien avec l’infiltrabilité J’associe toute l’UMR LISAH qui m'a faitdécouvrir le milieu de la recherche et m'a donné l'envie de continuer à le faire Ungrand merci à tous ceux qui ont participé aux différents comités de suivi de ce travail,

Je remercie Monsieur Jérôme MOLENAT, Directeur du LISAH pour m’avoiraccueilli dans sa structure Je remercie également les agents du laboratoire avec quij’ai collaboré durant ce stage

Trang 12

Chapitre 1

Introduction

1 Enjeux et objectifs de l’étude

1.1 Enjeux de l’étude

Les sols agricoles cultivés en pluvial représentent 80% des terres cultivées dans

le monde et assurent 70% des ressources alimentaires mondiales, jouant ainsi un rơlecrucial sur la sécurité alimentaire mondiale Cornelius Senf et al [2] Ainsi dans lespays sud méditerranéens, ils occupent entre 15% et 20% du territoire, emploieenviron le quart de la population et consomment entre 70 % et 80% des ressources eneau [5] La gestion non optimisée de consommation croissante en eau, pose denombreux problèmes dans la société Les tensions entre différents usagersconcurrents (domestique et industriel) subsistent, les inégalités sociales s’aggraventlorsque l’accès à l’eau devient difficile, de nombreuses dégradationsenvironnementales s’observent (salinisation des terres, …) Joanna Roussillon [4]

Nous nous intéressons particulièrement dans notre étude au bassin-versant deKamech, de la région agricole du cap bon, situé au nord de la Tunisie Dans cettezone on y observe une activité agricole régulière aux grands enjeux économiques : enTunisie, l’agriculture génère entre 8.5 % et 11.5 % du PIB national (2012) si l’onajoute l’agroalimentaire et assure 16% d’emplois de la population active[www.statistiques-mondiales.com] [1] En climat semi-aride, les conditionsmétéorologiques sont peu favorables à la production faisant face aux aléasclimatiques et au déficit de la balance agricole alimentaire On observepériodiquement des chutes de rendements agricoles liées aux irrégularités despériodes pluviales, si ce n’est parfois la perte totale des récoltes

a) Lien entre EDS et Infiltrabilité

La formation des ruissellements dans les sols cultivés semi-arides ouméditerranéens en régime permanent sont fortement influencée par l’état structural de

la surface La structure du sol en surface se dégrade sous l’effet des précipitations cequi se traduit par la formation de différents types morphologiques de crỏte de

Trang 13

battance contrôlant ainsi la partition ruissellement/infiltration (Bresson et Boiffin,1990; Valentin et Bresson, 1992; Le Bissonnais et al., 1995; Léonard et Andrieux,1998) Ces auteurs ont fait émerger le concept d’état de surface du sol [EDS](Boiffin, 1984; Auzet, 2000) Il désigne l’état hydrique et structural, la couvertureéventuelle du sol Les EDS jouent sur les processus hydrologiques de la surface dusol : l’interception, l’infiltration, le stockage dans les dépressions ainsi quel’arrachement et le transport des particules de terre Leur variabilité spatio-temporelleest un des facteurs permettant d’expliquer la récurrence des dégâts liés auruissellement dans des secteurs caractérisés par des conditions climatiques ettopographiques modérés Plusieurs travaux ont montré les interactions existant entreles pratiques agricoles et la dégradation structurale de la surface (Monnier et al.,1986; Van Dijk et al., 1996; Martin et al., 2004) De ce fait, les EDS présentent unevariabilité spatiale et temporelle forte, largement contrôlée par les interactions entrecalendriers climatique et cultural En intégrant ces interactions, les EDS constituentdes indicateurs permettant de tenir compte de la variabilité spatiale des processushydrodynamiques de surface Auzet et al., 2005b [24] et, de ce fait, sont utilisés dansdes démarches expertes afin d’estimer le volume d’eau ruisselé (modèle hydrologiqueSTREAM Cerdan et al., 2002b [25].

L’UMR LISAH de Montpellier travaille notamment grâce à la télédétection surl’apport de solutions à ce type des problèmes Avec des travaux qui s’inscrivent dans

un cadre général de modélisation intégrée du bassin versant de Kamech et consistant

en une méthode générique de prédiction des états de surface connaissant un ensemble

de facteurs explicatifs comme la pluviométrie ou les pratiques culturales Cependantcette méthode nécessite une régularité dans l’observation spatio-temporelle descaractéristiques d’occupation du sol

L’utilisation des séries temporelles d’images satellitaires peuvent être unmoyen efficace permettant le suivi du développement des pratiques culturales, despratiques d’irrigation, C’est dans ce cadre que s’inscrit ce travail de fin d’études.Les modèles développés au LISAH n’intègrent pour l’instant qu’une informationassez globale concernant les données satellites Afin d’affiner l’étude du modèle duLISAH, il devient primordial de connaître plus précisément la nature des imagessatellites des parcelles agricoles et de saisir l’information contenue dans leurordonnancement temporel Les progrès observés dans le monde de l’imagerie spatialesatellitaire offrent de nombreuses possibilités d’améliorations du suivi de ces cultures

Trang 14

en continu, notamment avec une grande fréquence d’acquisition des images associée

à une haute résolution spatiale

1.2 La Télédétection

1.2.1 Éléments de contexte

L'objectif principal de l'agriculture de précision est d'optimiser laproductivité des cultures tout en tenant compte de la protection environnementale,ceci dans une logique de développement durable [14] Utiliser l'agriculture deprécision permet une meilleure conservation des enregistrements des actions oupratiques menées sur les parcelles Ces informations enregistrées peuvent par la suiteêtre utilisées pour des comparaisons sur différentes saisons agricoles La possibilitéd'analyse sur l'ensemble des informations ainsi produites permet une meilleureconnaissance des changements spatiaux temporelles des parcelles Ces connaissancespermettent une meilleure gestion des cultures avec comme conséquence, l’évolution

du rendement [14]

L'obtention d'informations à l'aide de méthodes traditionnelles d'acquisition dedonnées (avec contact directe avec les objets) pour la gestion des cultures est moinsaisée et financièrement plus cỏteuse D’ó l’intérêt de l’utilisation de latélédétection fournissant une grande masse d'information sur les variations spatiales

et spectrales résultant des caractéristiques du sol et des cultures à l'intérieur de laparcelle Un avantage potentiel de ce type de méthode est qu'elle n'est limitée ni parl'intervalle d'échantillonnage ni par les interpolations géostatistiques qu'on pourraitfaire si on utilisait des données échantillonnées de manière ponctuelle au sol

1.2.2 Télédétection Multispectrale

a) Principes généraux

La télédétection est une technique qui, par l'acquisition d'images, permetd'obtenir de l'information sur la surface de la Terre sans contact direct avec celle-ci enutilisant des dispositifs embarqués à bord de plateformes (Satellite, Avion ou drone).Les capteurs enregistrent le rayonnement électromagnétique émis et réfléchi par unobservable (surface de la terre) Il s’agit ensuite de traiter et analyser cetteinformation

Trang 15

Dans la plupart des cas, la télédétection implique une interaction entrel'énergie incidente et les objets, en utilisant des capteurs imageurs (passifs) Elle

comporte 6 étapes , dont le processus est décrit ci-dessous (figure 1.1):

La présence d’une source d'énergie est une étape primordiale en télédétection pourilluminer la cible ou l’objet se trouvant sur la zone d’étude Dans ce cas de capteurs

de télédétection dit «actifs», la source d’énergie utilisée provient du capteur detélédétection lui-même Dans ce cas de capteurs de télédétection dit « passifs », lasource d’énergie utilisée est celle provenant du Soleil

Dans notre travail de stage, nous utilisons uniquement des données provenant d’uncapteur passif

Le rayonnement électromagnétique (soit du capteur dans le cas de la télédétectionactive, soit du soleil dans le cas de la télédétection passive) interagit deux fois avecl'atmosphère dans ce processus de télédétection : premièrement durant son parcoursentre la source d'énergie et l’objet observable, le rayonnement entre en interactionpermanente avec l'atmosphère, et une seconde interaction se produit lors du trajetentre la cible et le capteur

Figure 1.1 : Processus d’acquisition image en télédétection

Trang 16

Interaction avec l’objet

Une fois parvenue à l’objet, l'énergie interagit avec la surface de celle-ci La nature

de cette interaction dépend des caractéristiques du rayonnement et des propriétés de

la surface

Une fois l'énergie diffusée ou émise par la cible, elle doit être captée à distance (par

un capteur qui n'est pas en contact avec la cible) pour être enfin enregistrée

L'énergie enregistrée par le capteur est transmise, souvent par des moyensélectroniques, à une station de réception ó l'information est transformée en images(numériques ou photographiques)

Une interprétation visuelle et/ou numérique de l'image traitée est ensuite nécessairepour l’extraction de l'information de l'image afin de mieux comprendre la cible, aveccomme but la découverte de nouveaux aspects pour aider à résoudre un problèmeparticulier

Ainsi les capteurs de télédétection mesurent des valeurs quantitatives des propriétésphysiques des surfaces ciblées telles que la réflectance, la température, ou larétrodiffusion pour les capteurs actifs Un des axes principaux de la télédétection est

la conversion de ces valeurs en informations spatialement et temporellementcomparables

b) Spectroscopie

Le spectre électromagnétique

Le spectre électromagnétique c’est la description de l’ensemble desrayonnements électromagnétiques classés: par fréquence, longueur d’onde ou énergie,

Trang 17

il s'étend des courtes longueurs d'onde (dont font partie les rayons gamma et lesrayons X) aux grandes longueurs d'onde (micro-ondes et ondes radio) Ainsi latélédétection utilise plusieurs régions du spectre électromagnétique (figure 1.2).

Les plus petites longueurs d'onde utilisées pour la télédétection se situent dansl'ultraviolet Ce rayonnement se situe au-delà du violet de la partie du spectre visible.Certains matériaux de la surface terrestre, surtout des roches et minéraux, entrent enfluorescence ou émettent de la lumière visible quand ils sont illuminés par unrayonnement ultraviolet

Dans le cadre de notre étude, la gamme du spectre utilisée s’étend du visible soit 400

nm jusqu’au proche infrarouge à 2400 nm

Figure 1.2 : Gamme de spectre électromagnétique longueur d’onde et fréquence.

c) Télédétection en milieu agricole

Le rayonnement électromagnétique interagit deux fois avec l’atmosphère,premièrement avant d'atteindre la surface de la Terre, il traverse une certaineépaisseur atmosphérique et deuxièmement après avec touché la surface de la terre

Les particules et les gaz dans l'atmosphère peuvent dévier ou bloquer lerayonnement incident Ces effets sont causés par les mécanismes de diffusion et

Trang 18

d'absorption L'atmosphère ne laisse passer le rayonnement solaire que dans unnombre limité de bandes spectrales appelées fenêtres atmosphériques Si l'atmosphèreest relativement transparente dans le visible et présente une large fenêtreatmosphérique dans l'infrarouge (de 8 à 14μm), elle est opaque de 22μm à 1mm, cem), elle est opaque de 22μm), elle est opaque de 22μm à 1mm, cem à 1mm, cequi explique la non utilisation de cette portion de spectre en télédétection

Une correction de l'absorption atmosphérique est appliquée sur les images enestimant la quantité de vapeur d'eau dans la colonne d'air traversée par l'observation,puis on passe à la correction de l'absorption gazeuse Cette phase est réalisée par desmodèles de corrections atmosphériques tels que les modèles ATCOR, MAJA(MACCS ATCOR Joint Algorithm, prononcer « maya ») ou encore Sen2Cor

Du proche infrarouge (750 à 1500 nm) à l'infrarouge thermique (3000 nm) , lavapeur d'eau est principalement responsable de l'absorption du spectre Elle absorbedavantage les grandes longueurs d'onde du rayonnement visible (380 à 780 nm) et duproche infrarouge (750 à 1500 nm) Ainsi, l'eau paraît généralement bleue ou bleu-vert car elle réfléchit davantage les petites longueurs d'onde, elle paraît encore plusfoncée si elle est observée sous les longueurs d'onde du rouge ou du procheinfrarouge Lorsque les couches supérieures de l'eau contiennent des sédiments ensuspension, la transmission diminue, la réflexion augmente et l'eau paraît plusbrillante

Dans le sol, deux éléments chimiques majeurs affectent majoritairement lespectre : les minéraux (argileux, ferriques et carbonatés) et la matière organique [19]

A titre d’exemple, la présence de carbonate de calcium dans les sols entraîne unebande d’absorption autour de 2340 nm, due aux vibrations d’ions CO3 Lescaractéristiques physiques du sol, liées à la granulométrie, la géométrie del’échantillon, l’angle de vue de la source lumineuse (angle incident et angle azimut)influencent quant à eux la forme générale du spectre à travers un changementd’intensité des bandes d’absorption spectrale et de hauteur de ligne de base [20], maisn’affectent généralement pas la position des bandes d’absorption [20] L’effet de lagranulométrie des sols (taille des particules) joue ainsi un rôle sur l’intensité duspectre Plus la granulométrie est fine, plus l’intensité du spectre est forte Ainsi, lessols sableux ont logiquement les bandes d’absorption de l’eau les moins marquées

Trang 19

Interactions avec la végétation sèche

En automne, les feuilles contiennent moins de chlorophylle et plus de cellulose(végétation sèche) Elles absorbent alors moins de rouge, et paraissent donc rouges

ou jaunes (le jaune est une combinaison des longueurs d'onde du vert et du rouge)

Dû à la cellulose, le spectre de réflectance de végétaux secs est absorbé autour de

2100 nm Cette caractéristique peut être utilisée pour distinguer les déchets végétaux

du sol en calculant une variable spectrale appelée indice d’absorption de la cellulose(CAI), qui décrit la profondeur de la caractéristique d’absorption de la lignocellulosedans la région de l’infrarouge à ondes courtes (2000 à 2200 nm)

Les feuilles, qui contiennent un maximum de chlorophylle en été, sont doncplus vertes pendant cette saison La structure interne des feuilles en santé agit comme

un excellent réflecteur diffus pour les longueurs d'onde de l'infrarouge Si nos yeuxpouvaient percevoir l'infrarouge, les feuilles paraîtraient très éclatantes sous ceslongueurs d'onde Les scientifiques utilisent d'ailleurs les bandes infrarouge et rougepour déterminer l'état de santé de la végétation par le calcul de l’indice de végétationNDVI (Normalized Difference Vegetation Index)

1.2.3 Télédétection Multispectrale et Multi Temporelle : Sentinel-2

L'un des grands avantages de la télédétection satellitaire est sa capacité àacquérir périodiquement de l'information d'une même région de la Terre Lescaractéristiques spectrales de la région observée peuvent changer avec le temps Lacomparaison d'images multi-temporelles permet de détecter ces changements Parexemple, durant la période de croissance de la végétation, de nombreuses espèces setransforment continuellement et notre capacité à détecter ces changements dépend de

la fréquence avec laquelle les données sont recueillies En acquèrant des donnéespériodiquement et de façon continue, il est possible de suivre les changements quisurviennent à la surface de la Terre, qu'ils soient naturels (comme le développement

de la végétation ou l'évolution d'une inondation) ou de source humaine (comme ledéveloppement des milieux urbains ou la déforestation)

Les systèmes modernes d'observation de la Terre fournissent des données detélédétection à différentes résolutions spatiales et temporelles Parmi les capteurs

Trang 20

optiques, aujourd'hui Sentinel-2 qui est un satellite d’observation de la terre del’Agence Spatiale Européenne, fournit des données à haute résolution temporelle(tous les 5 jours) et haute résolution spatiale (10 m) dans 13 bandes spectrales , quipeuvent être utiles pour surveiller la dynamique de la couverture terrestre

Figure 1.3 : longueur d'onde et largeur de bande Sentinel-2

Des travaux utilisant la télédétection multispectrale et temporelle, pour le suivides éléments de surfaces et l’identification des natures de culture à partir de leursséries temporelles ont été démontré à plusieurs reprises Furlan et al [23] proposentune méthode de classification qui exploite la très haute résolution temporelle desimages SPOT végétation en utilisant comme vecteurs caractéristiques les profilsNDVI des images Un profil temporel NDVI annuel est calculé pour chaque classe enmoyennant les valeurs NDVI des zones d’entraînement, puis est utilisé comme basepour le processus de classification Le profil NDVI lissé de chacun des pixels estcomparé grâce à une distance de mesure (Coefficient de Jaccard et DTW) pour ceuxdisponibles pour chaque classe L’utilisation d’une structure hiérarchique des classesbasée sur le coefficient de Jaccard permet d’en regrouper certaines lorsque leursimilitude limite leur distinction Wardlow et Egbert [22] proposent une méthode decombinaison d’analyses graphiques et statistiques sur des données NDVI issues d’unesérie temporelle MODIS sur une année civile, avec une résolution spatiale de 250 m

et temporelle de 16 jours, pour quelques 2000 champs cultivés Il en découle desrésultats obtenus, la possibilité de détecter pour chacune des cultures majoritairesassociées à certaines pratiques agricoles (cultures doubles, jachères, irrigation) une

Trang 21

unique signature multi-temporelle Ces signatures sont cohérentes vis-à-vis de leurscaractéristiques phénologiques, et la plupart des classes sont spectralement séparables

à un certain point de la période de croissance Joanna Roussillon [4], propose à l’aidedes valeurs NDVI d’une série temporelle SPOT, une méthode permettant desurmonter la difficulté liée à la forte disparité des dates de développements.S’appuyant sur une classification alternative basée sur une approche base dedonnées : qui permet de pouvoir introduire un maximum d’expertise en intégrant desdonnées relatives à différentes situations passées Afin d’arriver à identifier pourchaque pixel ses différentes successions culturales

1.3 Objectif de l’étude

Dans ce contexte, ce travail vise, à l’aide d’une série temporelle Sentinel-2, à tester et

à développer de nouvelles méthodes de classification d’occupation du sol adaptées ànotre zone d’étude, caractérisant l’évolution spatio-temporelle des états de surface(EDS) En effet, les méthodes actuelles s’avèrent peu efficaces en zone semi-aride dufait de la forte variabilité des cycles de développement des cultures, liées auxconditions climatiques et aux pratiques agricoles employées Il devient nécessaire deproposer des méthodes robustes, adaptées à ce contexte, qui puissent rendre comptedes différentes successions culturales observées sur les parcelles agricoles, et ce entemps quasi réel et continu Enfin, l’enjeu reste également de parvenir à des méthodesaussi automatiques que possible, dont on souhaite limiter le recours aux observations

de terrains

1.4 Approches adoptées

Afin de pouvoir carter les trajectoires d’états de surface, ainsi arriver à faire

le suivi des pratiques culturales sur une année dans chaque parcelle cultivée de lazone de kamech, deux approches ont étés retenues et utilisées Il s’agit :

Approche multi-date ordonnée univariée

L’objectif de cette approche est de cartographier lors d’ une année culturale, latrajectoire de l’évolution spatio-temporelle de la zone d’étude, en ne

Trang 22

considérant que l’indice de végétation (NDVI) pour les données satellitairesSentinel-2, la variable de végétation verte et la classe d’états de surface (EDS)pour les données d’observation de terrain (vérité de terrain) Elle est traitée àl’échelle pixellaire et ensuite agrégée à la classe majoritaire pour le NDVI et àl’échelle parcellaire pour la variable de végétation verte.

Approche multi-date ordonnée multivariée

L’objectif de cette approche est de cartographier lors d’ une année culturale, latrajectoire de l’évolution spatio-temporelle de la zone d’étude, en considérantchaque variable observée sur le terrain et toutes les bandes spectrales enSentinel-2 Elle est traitée à l’échelle pixellaire et ensuite agrégée à la classemajoritaire pour le multi-bande spectrales Sentinel-2 et à l’échelle parcellairepour l’ensemble des variables observées au sol

Des méthodes de classification non-supervisées classiques et fonctionnelles, sontutilisées pour le test de ces deux approches, et sont décrites en Chapitre 3

2 Contexte Administratif du stage

2.1 Situation au sein de l’UMR LISAH

Ce travail de stage a été réalisé au sein du laboratoire d’Étude des Interactionsentre Sol-Agrosystème-Hydrosystème (LISAH) de Montpellier, dans l’équipeOrganisation spatiale et dynamique des sols et des paysages cultivés, du 01 Avril au

30 Septembre 2019, sous la supervision et les orientations de Mme Gomez Cécilechargée de recherche à l’IRD et M Jean-Stéphane Bailly enseignant chercheur àAgroParisTech de Montpellier

2.2 Situation dans le projet TOSCA A-MUSE

Le stage est associé au projet TOSCA A-Muse (Analyse Multi-temporelle dedonnées SENTINEL 2 et 1 pour le monitoring de caractéristiques observables de lasurface du sol, en lien avec l’infiltrabilité, 2018-2019), projet multidisciplinairecoordonné par le laboratoire LISAH (SupAgro) en partenariat avec plusieurslaboratoires dont l'UMR TETIS et financé par le CNES Une analyse des données

Trang 23

Sentinel-2 acquises sur le Bassin Versant de Kamech entre Aỏt 2016 et Décembre

2016 a été préalablement menée dans l’objectif d’identifier le changement du couvertvégétal de cette zone Cette analyse s’est focalisée sur l’étude du NDVI (NormalizedDifference Vegetation Index) comme prédicteur du processus de changements decouvert végétal vert (Vgtv) et de déterminer la classe d’infiltrabilité de chaqueparcelle de la zone d’étude, autrement dit, calculer le volume d’eau qui sera infiltré/ruisselé dans le sol après une pluie C’est dans la continuité de cette analyse que sesitue notre stage sur une plus longue période d’Aỏt 2016 et Septembre 2017

Trang 24

Chapitre 2

Matériels et Données

2.1 Site d’étude

2.1.1 Localisation géographique

Figure 2.1 : Localisation, modèle numérique de terrain et vue satellitaire (image

Quickbird) du bassin versant de Kamech.

Le bassin versant de Kamech (2,63 km²) est situé dans une région agricole

du Nord du Cap Bon, à la limite entre les climats sub-humide et semi-arideméditerranéens en Tunisie (Figure 2.1) et sur le flanc sud-est de l'anticlinal, en rivegauche de l'oued el Ouidiane Ce bassin présente une nette dissymétrie entre ces deuxrives, avec un versant gauche sillonné par les alignements de crêts formés par lesminces bancs de grès ferruginisés armant les marnes en dépression et un versant droit

en revers de côte, abondamment raviné vers la mi-versant au dépens des marnes etargilites Kamech est représentatif d'une terre très cultivée avec 80 et 90% de sa

Trang 25

superficie cultivée comprenant près de 400 parcelles ayant une superficie médiane de0,5 ha Le parcellaire et les occupations du sol apparaissent fortement liés au relief et

à la qualité des sols [17]

2.1.2 Les parcelles observées

Les pratiques culturales sur le bassin versant de Kamech sont représentatives

de l’agriculture traditionnelle en zone de relief du Cap Bon (céréaliculture dominante,polyculture-élevage) Le suivi de ces pratiques et des conditions de surface, a étéréalisé sur un échantillon de parcelles cultivées L’objectif de ce suivi est de mettre aupoint un modèle d’évolution pour la prédiction des états de surface connaissant unensemble de facteurs

Figure 2.2 : Parcellaire du Bassin Versant de Kamech (2,63km2, en noire) sur laquelle est délimité le contour des

39 parcelles-tests associées aux observations de terrain (en rouge).

2.2 Présentation des données disponibles

Les données que nous utiliserons au cours de notre étude sont:

● les Images obtenues par satellite Sentinel-2, elles sont représentées à l’échellepixellaire et à l’échelle parcellaire

● les observations de terrain (constitue la vérité terrain), qui sont des données dereconnaissance de terrain du bassin-versant de Kamech à l’échelle parcellaire

Trang 26

2.2.1 Données satellitaires

2.2.1.1 Caractéristiques brutes

La série temporelle utilisée pour la validation de la méthode est constituée

de 14 images acquises par Sentinel-2 entre Septembre 2016 et juillet 2017 (Figure2.3) Les images ont un champ de vue de 290 km de large, et une résolution de 10m,20m ou 60m en fonction des bandes spectrales, ainsi dans cette étude toutes lesbandes ont étés ré-échantillonnées à une spatiale de 10 m

Figure 2.3: Répartition temporelle des images de la série

En fonction de la date d’observation de la zone d’étude par le satellite, unmême objet peut présenter des valeurs radiométriques différentes due à la présence degaz et de poussières dans l’atmosphère Ainsi il est indispensable de procéder à descorrections radiométriques sur chacune des images acquises, afin de pouvoircomparer entre elles les différentes informations qu’elles contiennent Sur Sentinel-2,cette correction d’absorption atmosphérique est réalisée avec l’utilisation du modèleMAJA (MACCS ATCOR Joint Algorithm) Une fois l'épaisseur optique connue, lesréflectances de surface sont calculées pour mettre à jour l'image composite

Trang 27

Dans le cadre de notre étude nous utiliserons en premier lieu commeprédicteurs, les indices de végétation (NDVI) et en deuxième lieu toutes les bandes

de réflectances Sentinel-2 Ainsi, la résolution spatiale de 10 m est suffisante pourproduire une carte d’occupation du sol pertinente connaissant la superficie médiane

de nos parcelles (0,5 ha)

L’intérêt de l’utilisation des données NDVI multi-temporelles pour lacartographie d’occupation du sol a été démontré à plusieurs reprises Pour rappel, leNDVI (Normalized Difference Vegetation Index) est un indice de végétation construit

à partir des bandes rouge et NIR (proche infrarouge) d’une image Il exploite lescaractéristiques en réflectance des végétaux, qui absorbent les longueurs d’ondesautour de 650 nm et réfléchissent plus ou moins celles dans le proche infrarouge(entre 700 et 900 nm) en fonction de leur activité chlorophyllienne L’indice se définitpar :

NDVI = ρir − ρr/ρir + ρrir − ρir − ρr/ρir + ρrr/ρir + ρrρir − ρr/ρir + ρrir + ρir − ρr/ρir + ρrr

Avec : uir la réflectance dans la bande proche infrarouge (bande 8) et ur la réflectance dans la bande rouge (bande 4).

Les valeurs du NDVI sont comprises entre -1 et +1 Les valeurs négativescorrespondent aux surfaces autres que les végétaux (neige, eau, nuages), et les valeursavoisinant 0 correspondent aux sols nus pour lesquels les réflectances dans le rouge et

le proche infrarouge sont du même ordre de grandeur Les formations végétalesprésentent des valeurs positives, proportionnelles à la densité du couvert et à l’activitéchlorophyllienne À partir d’une série temporelle d’images optiques, les valeursNDVI d’un même pixel pour différentes dates peuvent être tracées en fonction dutemps et permettre ainsi de rendre compte de l’évolution de la végétation

Trang 28

Figure 2.4: histogrammes NDVI 14 images

Nous pouvons observer sur ces différentes histogrammes (Fig 2.4) :

➢ Une faible proportion de la végétation entre aỏt et novembre 2016, cettepériode correspond à la préparation des cultures ;

➢ En fin du mois de novembre 2016 jusqu’à janvier 2017, une certaineaugmentation de la végétation correspondant à la période de semence ;

➢ De fin janvier 2017 jusqu’à la troisième semaine du mois d’avril 2017, fortedensité de la végétation (croissance de la culture) ;

Trang 29

➢ De fin Avril jusqu’à la fin de l’année culturale (fin juillet), une faibleproportion de la végétation (période de récolte).

2.2.2 Données terrain

Des campagnes de terrain menées par Zakia JENHAOUI, dans le cadre de l’ORE OMERE sur le bassin versant de Kamech, ont lieu durant la période couvertepar nos images Elles permettent de récolter des informations de références pourvalider nos algorithmes On dispose d’un fichier de polygones de type shapefile(QGIS, *.shp) par campagne, qui contient entre autres, pour chaque parcelle enquêtée: un identifiant, la nature de la culture, des observations complémentaires telles que :

le pourcentage de couverture des végétations chlorophylliennes et mortes sur la zoned’étude , ainsi que la hauteur de végétation Les différentes campagnes sont menéessur 39 parcelles de la zone d’étude (figure 2.5) dans le but d’intégrer une certainevariabilité spatiale et temporelle sur 14 dates (Fig 2.5)

Figure 2.5: Exemple de fichier d’Observation des états de surface (EDS) 39 parcelles observées de Kamech

Trang 30

pratiques culturales appliquées sur nos différentes parcelles Enfin une sixièmevariable de classe d’états de surface (EDS) agrégeant toutes les 5 premières variablesest exploitée de manière individuelle

La végétation verte : représentant le taux de couverture végétale (végétation

naturelle, et culture) du sol Elle est constituée de six classes :

—Vgtv_0% (végétation 0%) ;

—Vgtv_0-5% (végétation verte entre 0 et 5%) ;

—Vgtv_5-25% (végétation verte entre 5 et 25%) ;

—Vgtv_25-50% (végétation verte entre 25 et 50%) ;

—Vgtv_50-75% (végétation verte entre 50 et 75%) ;

—Vgtv_75-100% (végétation verte entre 75 et 100%)

Nous remarquons sur la figure 2.6, une évolution temporelle de la variablevégétation verte observée par Zakia sur l’année culturale, ce qui nous permettra demieux cartographier cette variable La faible représentation de cette variable enseptembre correspond à une période de préparation de culture pour un nouveau semis

et en fin juin et juillet, elle correspond à la période de récolte À l’inverse sa forteprésence entre fin novembre et fin avril, correspond à la période du démarrage et decroissance de la culture

Figure 2.6: histogrammes végétation verte 14 dates

Trang 31

La végétation sèche : représentant la combinaison de la litière et des chaumes.

Les chaumes sont constituées des tiges de céréales ou de fèves qui restentdressées à la surface du sol après la récolte des céréales ou des fèves vertes Lalitière est constituée des résidus végétaux coupés et étendus à la surface du sol.Cette variable est constituée de six classes :

—Vgts_0% (végétation sèche à 0%),

—Vgts_0-5% (végétation sèche entre 0 et 5%),

—Vgts_5-25% (végétation sèche entre 5 et 25%),

—Vgts_25-50% (végétation sèche entre 25 et 50%),

—Vgts_50-75% (végétation sèche entre 50 et 75%),

—Vgts_75-100% (végétation sèche entre 75 et 100%)

L’observation de la figure 2.7 nous permet de remarquer une évolution temporelle septembre de la variable variable végétation sèche En effet le mois deseptembre correspond à la période de transition après la récolte ó on retrouve lesdébris des arbres et de la litière avant les premiers labours Par contre, la période denovembre à mars ó l’on remarque une faible représentation de cette variable seretrouve correspond à la période de la poussée et de la croissance de la végétationnaturelle et des cultures La forte représentation entre fin avril et fin juillet correspond

-à la période de récolte

Figure 2.7: histogrammes végétation sèche 14 dates

Trang 32

Le travail du sol : il représente l’état de labour d’un sol, c’est-à-dire si un sol a

été labouré ou non Cette variable permet de préciser à partir de ce qui est visible à uninstant donné si un travail du sol a eu lieu récemment ou non et si possible décrire letype d'outil utilisé Elle est constituée de trois classes TR, TA, NT :

— TR (Travail Récent) : Travail très récent sans évolution de la surface[h=houe

rotative; d= dents; c= charrue]; Les mottes sont bien visibles Aucune pluie ou autre opération culturale n'a fait évoluer la surface du sol ;

— TA (Travail Ancien) : Travail ancien ou récent avec évolution de la surface

[h= houe rotative; d= dents; c= charrue] les mottes sont partiellement visibles: elles ont plus ou moins fondu; l'effet d'un travail du sol est visible de façon plus ou moins nette suivant le délai et le nombre de pluies séparant l'observation et le travail du sol ;

— NT (Non Travaillé) : aucun travail du sol ne peut clairement être identifié

sur la parcelle observée

La figure 2.8 présente la distribution de cette variable A travers cette figure,nous remarquons qu’au mois de septembre aucun travail n’a été observé, à partir dumois de novembre nous observons la présence d’un travail du sol et jusqu’à la fin del’année culturale cette variable varie assez peu au cours des différentes campagnesmenées sur terrain Ainsi deux autres variables ont étés ajoutées dans le but de mieuxcaractériser le travail du sol Il s’agit donc de la Rugosité et du Faciès qui sont liées

au travail du sol

Figure 2.8: histogrammes travail du sol 14 dates

Trang 33

La rugosité : Il s'agit de décrire globalement le dénivelé topographique moyen

selon trois classes (micro topographie) en incluant les éléments minéraux(cailloux) reposant sur la surface du sol :

Figure 2.9: histogrammes rugosité 14 dates

Le faciès : correspond à l’ouverture de la surface du sol Elle donc est très liée

à la variable du travail du sol Elle est constituée de six classes :

— F0 : surface totalement ouverte ; pas de pluie depuis le dernier travail

du sol ; pas de crỏte, agrégats ou mottes très nets

— F1 : surface "finement" fermée ; il y a eu au moins une pluie depuis le

dernier travail ; une crỏte structurale fine et continue recouvre la surface du sol mais les mottes ou agrégats restent parfaitement visibles

— F2 : surface du sol fermée de façon continue et consolidée sur plusieurs

centimètre de profondeur ; plusieurs pluies sont tombées et le sol est franchement crỏté Le pied ne s’enfonce pas dans le sol qui

est compact

Trang 34

— F0/F1 (état transitoire) : la surface du sol est partiellement fermée, on

note clairement des espaces largement ouverts (macroporosité)

— F1/F2 : (état transitoire) : la surface du sol est totalement fermée et

largement consolidée mais il subsiste des zonesfoisonnées

— Saturé : la surface du sol est hermétiquement fermée et largement

consolidée

Figure 2.10: histogrammes faciès 14 dates

L’observation de la figure 2.10 permet de constater une variabilité assez continue decette variable sur toutes les périodes combinée au deux variables précédentes (travail

du sol et rugosité), elle permet de mieux carter les trajectoires d’états du sol

La classe d’états de surface : Il s'agit de faire la synthèse de l'ensemble des

caractéristiques des EdS mentionnées ci-dessus en se rapportant à la classification (encours d'évolution) des EdS des sols cultivés méditerranéens [21]

— T : Travail du sol ;

— Tcst : Travail du sol avec fine crỏte structurale ;

— Cst : Sol nu ;

Trang 35

— Vcst : Sol avec végétation herbacée > 50 %;

— Lcst : Sol avec litière > 50 %

Figure 2.11 : Carte d’occupation de sol Parcellaire Kamech.

La figure 2.11, représente le type des cultures que nous rencontrons sur la zone deKamech, dans le cadre de notre étude 3 grandes familles ont étés retenues :

Trang 36

Date d’acquisition images S-2 Date d’observation terrains Nombre de jours

Tableau 2.1: différentes dates d’acquisition image et d’observation terrain

Le tableau 2.1 ci dessus, présente les différentes dates d’acquisition images

Sentinel-2 et de campagne des champs (observation terrain), ainsi que leurs écarts en nombre

de jours

Trang 37

Chapitre 3

Méthodologie d’analyse de profils temporels spectraux

Dans ce chapitre, nous introduisons les différentes méthodes declassification non supervisée des séries temporelles sélectionnées, en présentant endétails les approches de partitionnement adoptées et utilisées Nous abordons cesméthodes en étudiant leurs paramétrages et leurs limites Nous commençons parexposer en section 3.1 les notations et définitions nécessaires à la compréhension duchapitre La première famille de classification présentée est celle de Kmeans (section3.2) Suivront ensuite les classifications non supervisées fonctionnelles ‘‘Funcy’’(section 3.3) Nous terminons ce chapitre en section 3.4, avec les implémentationsrelatives aux différentes approches

3.1 Contexte

3.1.1 Introduction à la classification

En télédétection, la classification non-supervisée consiste à effectuer lacorrespondance entre les éléments d’une scène de l’image (espace géographique)matérialisés par leurs valeurs radiométriques (espace des signatures spectrales), et desclasses non connues a priori par un utilisateur Une classe se définit par un ensembled’éléments (pixels ou objets) dont les caractéristiques ont été jugées similaires,humainement ou mathématiquement La correspondance est réalisée à l’aide d’un

«classifieur» : il s’agit d’une fonction ou de règles de décision permettant detransformer un ensemble de données en des classes discrètes Ces classifieurs sontnombreux et variés

Lors d’une classification non supervisée, le classifieur détermineautomatiquement les différentes classes de l’image à partir des caractéristiquesspectrales des pixels L’utilisateur n’influence pas la classification, si ce n’estéventuellement pour définir le nombre de classes ou pour choisir d’en regroupercertaines en se référant aux données observées sur le terrain (vérité terrain) et laisseparler les données par elles-mêmes Contrairement à une classification supervisée ól’utilisateur intervient pour imposer une typologie existante au travers d’une phased’apprentissage Celle-ci nécessite des pixels étiquetés dits «d’entraỵnement», dontles couples spectre-classes sont disponibles grâce à des campagnes de terrains Ilspermettent «d’entraỵner» le classifieur, à savoir de déterminer certains de ses

Trang 38

paramètres pour obtenir une fonction de décision à l’aide de laquelle seront classéstous les autres pixels de l’image dont la nature est inconnue.

Dans la littérature deux grandes familles d’algorithmes classiques declassification non supervisée sont utilisées dans la catégorisation des imagessatellitaires, à savoir l’algorithme Kmeans et l’algorithme de classificationascendante hiérarchique (CAH) Les catégorisations des images de télédétection nontemporelles avec ces deux familles d’algorithme sont assez efficaces R Gaudin et N.Nicolayannis [26], cependant elles sont moins optimales dans la discriminations leséléments de surface lorsqu’il s’agit des séries temporelles d’images de télédétection

3.1.2 Données Fonctionnelles et Analyse fonctionnelle

Les séries temporelles forment une catégorie de données fonctionnellescontenant des valeurs quantitatives ordonnées (dans le temps) et cet ordonnancement

a une signification que l’on ne peut ignorer L’analyse fonctionnelle de ce type dedonnées ou «analyse de données avec des courbes» lorsque l’ordonnancement est en1D est un sujet actif de la statistique avec une large gamme d'applications Lesnouvelles technologies permettent l’enregistrement avec précision et haute fréquence(dans le temps ou dans l’ espace), ainsi qu’une génération d’un volume important dedonnées ordonnées Ainsi, l’application des méthodes de fouille de donnéesclassiques pose un problème de perte d’information importantes dans l’estimation ducentre des classes, suite à la temporalité des données Plusieurs travaux présentent desméthodes spécialement adaptées, respectant la temporalité de ce type de donnée.Nous nous intéresserons ici uniquement à l’apprentissage non supervisé à partir desséries temporelles En médecine, ce type de donnée représente des courbes decroissance l’évolution de l’état des patients, en climatologie ce sont des sériesclimatiques sur plusieurs décennies De même, les courbes chimio-métriques sontanalysées en chimie et physique (spectroscopie) Voir Julien Jacques, Cristian Preda[10] pour plus de détails Nous nous focalisons par la suite sur des donnéesfonctionnelles 1D (courbes)

Le modèle statistique sous-jacent aux données représentées par des courbes

est un processus stochastique à valeurs réelles en temps continu, X = {Xt}t [0, T]∈ [0, T] Dans

Trang 39

le cas univarié (1D), une donnée fonctionnelle X est représentée par une uniquecourbe, c’est-à-dire que :

X t ∈ R, ∀ t [0, T]

Avec la croissance de corrélation entre objets, de plus en plus de donnéessont collectées pour un même individu[11] Dans ce cas, un chemin d’un individu Xest représenté par un ensemble de p courbes La dépendance entre ces p mesuresfournit la structure de X

Xt = (X 1 (t), , X p (t)) R p , p ≥ 2

Dans cette étude, nous examinons le problème de classification de donnéesfonctionnelles multi et univariées La principale difficulté dans la classification desdonnées fonctionnelles se pose en raison de la dimensionnalité infinie des donnéesdans l'espace Par conséquent, la plupart des algorithmes de classification de donnéesfonctionnelles, consiste dans une première étape de transformation du problème dedimension infinie en un problème de dimension finie et dans une deuxième étaped'utilisation d'une méthode de classification basée sur un modèle conçu pour lesdonnées dimensionnelles finies Dans notre étude nous n’appliquerons que ladeuxième étape, vu que nous nous trouvons dès le départ en dimensions finies desdonnées La plupart des travaux de classification de données fonctionnelles traitent

le cas univarié Abraham, et al [12] catégorisent les données fonctionnelles enappliquant l'algorithme k-means ajusté par la fonction de base B-spline, elle permet

de traiter le problème de dimensionnalité, en effet ce sont les paramètres de la spline(longueur du vecteur initial) qui deviennent les nouvelles variables (moinsnombreuses) Sangalli et al [13] utilisent également un algorithme k-means pourregrouper les courbes mal alignées C Bouveyron and J Jacques [5] introduisentdans leur travail, des techniques plus sophistiquées fondées sur un modèle : afin dedéfinir une approche efficace pour les données fonctionnelles à faibleéchantillonnage, ils étendent l'algorithme de regroupement de données hautedimension (HDDC) au cas fonctionnel Le cas des données fonctionnellesmultivariées est plus rarement considéré dans la littérature : A Singhal and D.E.Seborg[8] utilisent un algorithme k-means basé sur des distances spécifiques (facteurs

de similarité) entre les données fonctionnelles multivariées, tandis que M Kayano, K.Dozono, and S Konishi [7] considèrent une classe de réseau de neurones artificielsdes cartes auto-organisées de kohonen sur la base de coefficients de courbesmultivariées, elles permettent d’étudier la répartition de données dans un espace àgrande dimension

Trang 40

Notre étude étant menée sur une série chronologique des données Sentinel-2(multispectrale) à dimension limitée, se basera sur les travaux menés par C.Bouveyron and J Jacques[5], Julien Jacques and Cristian Preda [10], qui sontorientés vers la classification des données fonctionnelles mulivariées en utilisant uneapproche basée sur un modèle de mélange et d’estimation des paramètres à l'aide d'unalgorithme de maximisation de l’espérance (EM).

Dans la suite, deux méthodes de classification non supervisée seront décritespuis exploitées sur les séries temporelles choisies dans le cadre de notre étude :

non supervisées des données non temporelles ;

Funcy : qui regroupe 7 différentes méthodes adaptées aux données

fonctionnelles (temporelles), tout en explorant leurs caractéristiques, avantages

et limites respectives In fine La fonction Funcy sélectionne une classification,pour laquelle la majorité des méthodes ont voté (agrégation des différentesméthodes)

Nous analyserons ces différentes méthodes afin de s’en inspirer pour une appréciationdes résultats dans le cadre de notre contexte d’étude

3.2 Méthode de Classification Kmeans

La méthode KMeans est une méthode de classification avec apprentissagenon supervisé L'objectif de cet algorithme est de trouver K classes dans les données.L'algorithme fonctionne de manière itérative pour affecter chaque pixel à l'un des Kgroupes en fonction des paramètres fournis (distance spectrale) Les pixels sontregroupés en fonction de la similarité des fonctionnalités Les sorties de l' algorithme

de classification KMeans sont les suivantes:

● Les centres des K classes, qui peuvent être utilisés pour étiqueter denouvelles données ; Chaque centre d'une classe est un point de données(barycentre) qui permet de caractériser la classe L'examen des poids desentités centres peut être utilisé pour interpréter qualitativement le type degroupe représenté par chaque classe

Ngày đăng: 28/08/2020, 17:05

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w