15
1 TD ANALYSE SPATIALE Octobre 2013 Université Bordeaux 1 Description du projet : Durant une nuit de l’automne 2011, des étudiants de Bordeaux 1 ont observé l’étrange comportement de laraignée dahut (Araneida dahutensis) sur le campus de Bordeaux 1. Inféodé au milieu aquatique, ce petit arachnide exploite les détritus accumulés le long des berges pour construire des radeaux. Ces embarcations sont utilisées comme lieu de vie mais également comme moyen de transport durant la nuit. A partir de 23h, les radeaux s’animent et, telles des auto-tamponneuses, les araignées cherchent par tous les moyens à entrer en collision les unes avec les autres. Durant la journée, les embarcations sont ancrées aux végétaux qui parsèment la surface de l’étang et les arthropodes s’attachent à réparer les nombreux dégâts subits durant la nuit. Afin de mieux comprendre le comportement de laraignée dahut, une étude spatiale a été mise place. A cet effet, un échantillon a été défini de 35m de long et 20m de large. A l’intérieur de ce cadre, la position spatiale des radeaux est mesurée durant la journée via un tachéomètre laser. Les coordonnées étant définies localement, quatre points sont positionnés par GPS afin d’effectuer une reprojection. La taille des radeaux (mm) est estimée par photogrammétrie tandis que la profondeur du lac résulte de mesure par sondage manuel. Enfin, l’âge et/ou le sexe des individus (males, femelles et juvéniles) sont déterminés visuellement sur la base du dimorphisme entre les individus. Fichiers mis à disposition : 1) Points_references_georeferences.xls : Localisation des 4 points géoréférencés en WGS 84 World Mercator. Champs : identifiant, x, y. 2) Localisation_radeaux.shp Localisation des radeaux. Champs : identifiant, x local, y local. 3) Data_radeaux.xls Description des radeaux. Champs : identifiant, age et sexe des individus, taille des radeaux (mm). 4) Point_profondeur.shp Profondeur de l’étang. Champs : identifiant, Z (cm).

Octobre 2013 Université Bordeaux 1 2013. 11. 9. · - Démonstration des opérations avec Openstat. Mise en œuv e d’un test de student su les oodonnées X et Y des a yentres à

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • 1

    TD ANALYSE SPATIALE

    Octobre 2013 – Université Bordeaux 1

    Description du projet :

    Durant une nuit de l’automne 2011, des étudiants

    de Bordeaux 1 ont observé l’étrange comportement

    de l’araignée dahut (Araneida dahutensis) sur le

    campus de Bordeaux 1. Inféodé au milieu

    aquatique, ce petit arachnide exploite les détritus

    accumulés le long des berges pour construire des

    radeaux. Ces embarcations sont utilisées comme

    lieu de vie mais également comme moyen de

    transport durant la nuit. A partir de 23h, les radeaux

    s’animent et, telles des auto-tamponneuses, les

    araignées cherchent par tous les moyens à entrer

    en collision les unes avec les autres. Durant la

    journée, les embarcations sont ancrées aux

    végétaux qui parsèment la surface de l’étang et les

    arthropodes s’attachent à réparer les nombreux

    dégâts subits durant la nuit.

    Afin de mieux comprendre le comportement de l’araignée dahut, une étude spatiale a été mise

    place. A cet effet, un échantillon a été défini de 35m de long et 20m de large. A l’intérieur de ce

    cadre, la position spatiale des radeaux est mesurée durant la journée via un tachéomètre laser. Les

    coordonnées étant définies localement, quatre points sont positionnés par GPS afin d’effectuer une

    reprojection. La taille des radeaux (mm) est estimée par photogrammétrie tandis que la profondeur

    du lac résulte de mesure par sondage manuel. Enfin, l’âge et/ou le sexe des individus (males,

    femelles et juvéniles) sont déterminés visuellement sur la base du dimorphisme entre les individus.

    Fichiers mis à disposition :

    1) Points_references_georeferences.xls : Localisation des 4 points géoréférencés en WGS 84 World Mercator. Champs : identifiant, x, y.

    2) Localisation_radeaux.shp Localisation des radeaux. Champs : identifiant, x local, y local.

    3) Data_radeaux.xls Description des radeaux. Champs : identifiant, age et sexe des individus, taille des radeaux (mm).

    4) Point_profondeur.shp Profondeur de l’étang. Champs : identifiant, Z (cm).

  • 2

    Etapes du projet :

    1 – PREPARATION DES DONNEES

    1.0 – Ouverture du projet:

    - Créer un répertoire « projet_statistique_spatiale ».

    Créer un sous-répertoire « trash ».

    Créer un sous-répertoire « data_brute » et copier le jeu de données dans ce répertoire.

    Créer un sous-répertoire « point_references_georéférencement » et faire une copie du

    fichier excel « point_references_georéférencement.xls » situé dans « data_brute ».

    - Ouvrir ArcMap et créer un nouveau document. Définir la projection du bloc de données

    (WGS 1984 World Mercator.prj). Enregistrer le document à la racine du répertoire

    « projet_statistique_spatiale ».

    1.1 – Création des points de géoréferencement.

    - Faire une copie du fichier « Points_references_georeferences.xls » et ajouter cette copie au

    projet.

    - Afficher les points de ce fichier (2013-1000 ; 2013-1001 ; 2013-1002 ; 2013-1003) via la

    fonction « afficher les données XY ». Utiliser la projection WGS 1984 World Mercator.prj.

    - Convertir le fichier en fichier de forme : clic droit > données > Exporter les données.

    Placer le fichier dans le sous-répertoire « point_references_georéférencement ».

    - Vérifier la projection en affichant un fond de carte topographique et/ou vos données

    topographiques acquises préalablement.

    - Affichez ce fichier de forme et fermer les deux fichiers précédemment créés.

    1.2 – Géoréférencement des points « radeaux ».

    - Créer un sous-répertoire « radeaux » et copier à l’intérieur l’ensemble des fichiers

    « localisation_radeaux.* » depuis le répertoire « data_brutes ».

    - Ajouter le fichier de forme « radeaux.shp » au document.

  • 3

    - Les radeaux ayant été coordonnés dans un système local, il est nécessaire de recaler

    l’ensemble des points dans un système géodésique. Nous utiliserons l’outil « ajustement

    spatial » pour effectuer cette opération.

    - Ouvrir une session de mise à jour pour la couche « localisation_radeaux ».

    - Définir les données à ajuster.

    - Créer des nouveaux liens de déplacement entre les 4 points de géoréférencement des

    couches « localisation_radeaux » et « points_references_georeferences ». Jouer avec

    l’étiquetage, « la capture » et le « zoom sur la couche ».

    - Afficher l’aperçu de l’ajustement et vérifier les erreurs résiduelles dans la table des liens puis

    effectuer l’ajustement.

    - Ajouter les coordonnées X et Y en WGS 1984 World mercator.

    1.3 – Jointure des données sur les radeaux.

    - Faire une copie du fichier « data_radeaux.xls » et l’ajouter au projet.

    - Joindre les données au fichier « localisation_radeaux » via le champ « ID ».

    - Effectuer une analyse thématique sur le champ Type.

  • 4

    1.4 – Création de la distribution des trois populations

    (Males adultes, Femelles adultes, juvéniles)

    - Dans la couche « localisation_radeaux » sélectionner toutes les entités « Male_adulte ».

    Créer une nouvelle couche à partir de cette sélection puis la convertir en fichier de forme.

    Enregistrer la couche dans le sous-répertoire « « radeaux ».

    - Répéter l’opération pour les « Femelles_adultes » et les « Juveniles ».

    - Supprimer les fichiers inutiles.

    2 – TENDANCE CENTRALE DE LA DISTRIBUTION GEOGRAPHIQUE

    2.1 - Barycentre

    - Créer un sous-répertoire « Tendance_centrale ».

    - Créer, pour les 3 populations, le barycentre (± moyenne du semis) de la distribution spatiale.

    ArcToolbox > Outils de statistiques spatiales > Mesure de distributions géographiques >

    Mean center

    - Créer le nouveau fichier de forme dans le sous-répertoire « Tendance_centrale ».

    - Comparer et discuter la position des trois barycentres.

  • 5

    2.2 – Ellipse de déviation

    - Créer, pour les 3 populations, l’ellipse de déviation standard (± ecartype) de la distribution

    spatiale.

    ArcToolbox > Outils de statistiques spatiales > Mesure de distributions géographiques >

    Standard Distance.

    Enregistrer le fichier *.shp dans le sous-répertoire «Tendance centrale.

    - Comparer et discuter les trois ellipses en terme de dispersion des valeurs autour du

    barycentre.

    2.3 – Comparaison statistique des distributions géographiques

    - Démonstration des opérations avec Openstat.

    Mise en œuvre d’un test de student sur les coordonnées X et Y des barycentres à comparer

    (1). Le rayon de l’ellipse de déviation donne l’ecart-type (2) et la taille de l’échantillon (3)

    correspond au nombre de points dans le semis.

    Si P

  • 6

    3 – DESCRIPTION ET ANALYSE DE LA DISPERSION SPATIALE DES RADEAUX

    3.1 – Approche visuelle

    a) Décompte par carroyage

    - Créer un sous-répertoire « analyse_carroyage ». - Définir une maille pour le décompte et créer une grille sur l’emprise de l’échantillon.

    ArcToolbox > Outils de gestion de données > Classe d’entités > Créer un quadrillage.

    Enregistrer le fichier *.shp dans le répertoire « analyse carroyage ».

    Repositionner manuellement la grille si nécessaire.

    - Pour les trois populations, décompter le nombre d’individus par maille. Clic droit sur la grille >Jointures et relations > joindre

    - Enregistrer le résultat de la jointure dans le sous-répertoire « analyse_carroyage ». - Effectuer des analyses thématiques sur le champ « count » et commenter les cartes

    obtenues.

    3

  • 7

    b) Cartographie de la densité par interpolation

    - Créer un sous-répertoire « interpolation_densite ». - Créer une carte de densité de la distribution des trois populations via une fonction de noyau.

    ArcToolbox > Outils Spatial analyst > densité > densité de noyau. Tester différents rayons de recherche (entre 15 m et 1m) et comparer les résultats. Enregistrer les différents essais dans le sous-répertoire « trash » et enregistrer uniquement les fichiers finaux dans le sous-répertoire « interpolation_densité ». Ajuster au besoin la discretisation. Utiliser la même symbologie/ classement pour les 3 échantillons ( via importer la symbologie).

    3.2 – Approche statistique.

    L’approche statistique permet de déterminer, avec un seuil de probabilité, si la distribution d’un

    semis de points est aléatoire, agrégée ou dispersée.

    - Créer un sous répertoire « Ripley ». - Simuler une distribution aléatoire sur la zone échantillonnée.

    ArcToolbox >Outil de gestion de données > Classe d’entités > Créer des points aléatoires. Enregistrer le fichier *.shp dans le répertoire « Ripley ».

    a) Distance au voisin le plus proche.

    - Effectuer sur les trois populations un rapport du voisin le plus proche. Analyser et comparer. ArcToolbox > Outils de statistiques spatiales > Analyse de modeles > Average Nearest

    Neighbor.

  • 8

    La méthode de la distance au voisin le plus proche compare (1) la distance moyenne observée de chaque point avec son voisin le plus proche avec (2) une distance moyenne théorique dans un semis de point aléatoire de même densité. Si le rapport du voisin du plus proche (3) est inférieur à 1 alors la distribution tend vers l’agrégation et s’il est supérieur à 1 alors la distribution tend à se disperser. Un test du Z (4) permet de juger de la significativité de la différence entre la valeur théorique et observée : si la probabilité est inférieure à 0,05 alors la différence est significativement différente d’une distribution aléatoire :

    b) Fonction de Ripley.

    - La méthode dite de Ripley permet, contrairement à la méthode précédente, de donner une échelle aux structures spatiales observées.

    - Effectuer, sur les trois populations, une fonction K de Ripley. Analyser et comparer.

    ArcToolbox > Outils de statistiques spatiales > Analyse des modèles > Analyse d’agregat spatial multi-distances. De manière schématique, la fonction de Ripley permet de mettre en évidence l’hétérogénéité de l’espace par des variations de densité à différentes échelles spatiales. Ce test procède à la comparaison d’une densité moyenne observée (1) avec une densité théorique (2) calculée pour un semis de points aléatoire de même densité. Le seuil de significativité est donné par des tirages de Monte-carlo sur n semis de points aléatoires (3) .

    1

    2

    3

    4

  • 9

    Si la courbe K attendue se trouve au dessus de l’enveloppe de confiance alors la distribution est concentrée. Si la courbe K attendue se trouve au dessous de l’enveloppe de confiance alors la distribution est dispersée. Le point de la courbe le plus éloigné de l’enveloppe de confiance donne une information sur la taille des agrégats / mises à distances (4).

    - Déterminer le nombre d’araignées males situés à moins de 2m du radeau d’un autre male et

    localiser ces individus.

    Créer un nouveau répertoire « tampon »

    Sélectionner la couche « Localisation_male_adulte ».

    Géotraitement > Tampon (distance 2m).

    Enregistrer le fichier *.shp dans le répertoire « tampon ».

    Se positionner sur la nouvelle couche créée et effectuer une jointure spatiale en choisissant

    comme couche à joindre « localisation_male_adulte ».

    Effectuer une sélection par attribut pour sélectionner les polygones ayant une valeur

    « count » supérieur ou égale à 2.

    1 2

    3

    4

    4

  • 10

    3.3 – Analyse locale : Recherche des agrégats spatiaux

    Si le K de Ripley permet de démontrer l’existence d’agrégats spatiaux, Arcgis n’offre pas la

    possibilité de localiser ces agrégats. On peut, pour cela, utiliser le logiciel crimestat.

    - Créer un répertoire « cluster ».

    - Aller dans le répertoire « data brute » et cliquer sur le fichier crimestat.exe.

    - Remplir les informations de l’onglet « Primary file » du « data setup » avec le fichier

    « localisation_femelle_adulte.dbf » (x,y, projection).

    - Refaire une fonction du K de Ripley.

    Spatial description > Distance Analysis I > Ripley’s statistic

    - Rechercher et localiser les hot spots.

    Spatial description > Hot spot Analysis I > Nearest Neighbor Hierachical Spatial Clustering.

    A partir du graphique du K de Ripley, définir la distance de recherche optimale (1).

    Vérifier la validité de cette mesure sur ArcMap.

    Définir un nombre minimal de points par cluster (2) et le nombre de simulations (3).

  • 11

    - Observer le nombre de clusters identifiés et déterminer leurs validités statistiques.

    Refaire la même opération en sauvant les ellipses dans le répertoire « Clusters ».

    Visualiser le résultat dans ArcMap.

    Obtenir les coordonnées des ellipses.

    1

    2

    3

    4

  • 12

    4 – ANALYSE DE LA DISTRUBUTION SPATIALE DES RADEAUX EN FONCTION DE

    LEUR DIMENSION.

    4.1 – Analyse des données

    a) Statistiques descriptives

    - Ouvrir la table attributaire. Clic droit sur l’entête des colonnes et sélectionner

    « statistiques ». Choisir le champ « Taille ». Comparer et interpréter les résultats (moyenne

    et ecartype) pour les trois populations.

    b) Statistique exploratoire des données spatiales

    - Affichage > Diagrammes > Créer

    Utiliser l’histogramme pour visualiser la répartition spatiale des radeaux en fonction de leur

    taille.

    4.2 - Approche statistique.

    - Le rapport du voisin au plus proche et le K de Ripley ne sont applicables qu’aux données

    ponctuelles (coordonnées X et Y). La question d’une structuration spatiale (homogène ou

    hétérogène) entre les valeurs d’un ponctuel peut être abordée via l’autocorrélation spatiale.

    Cette autocorrélation ne repose pas sur les distances entre les points mais sur une matrice de

    connection entre les points (cf jointure).

  • 13

    - Créer un sous-répertoire « autocorrélation ».

    - Effectuer un test global de l’autocorrélation de Moran I sur les trois populations.

    Comparer et interpréter les résultats.

    ArcToolbox > Outils de statistiques spatiales > Analyse des modèles >Spatial Autocorrelation.

    Si la probabilité P (1) est < 0,05 alors il y a une autocorrélation, c'est-à-dire que les valeurs

    (fortes ou faibles) des points voisins sont plus proches que celles des points éloignés.

    - Il est possible d’effectuer une analyse locale de l’autocorrélation via une analyse de Getis-Ord.

    Cette opération permet de mettre en évidence l’hétérogénéité /homogénéité des valeurs.

    Effectuer cette analyse pour les trois populations. Conclure.

    ArcToolbox > Outils de statistiques spatiales >Appariement d’agrégats > Hot Spot Analysis

    (Getis-Ord Gi). Enregistrer le fichier *.shp dans le sous-répertoire « autocorrelation ».

    - Afin de mieux visualiser les résultats, il est possible de créer des polygones de Thiessen

    autour de chaque ponctuel des trois populations.

    ArcToolbox > Outil d’analyse > Proximité > Créer des polygones de Thiessen.

    Enregistrer le fichier *.shp dans le répertoire « Autocorrélation».

    Effectuer ensuite une jointure spatiale pour joindre les valeurs de Getis-Ord aux polygones.

    Puis opérer une analyse thématique.

    1

  • 14

    - Une autre méthode consiste à créer une interpolation à partir des valeurs de Getis-Ord.

    ArcToolbox >Outil Spatial Analyst > Interpolation > IDW. Enregistrer le fichier *.shp dans le

    répertoire « autocorrelation ».

    - Afin d’analyser la répartition des araignées males, on souhaite étudier la relation entre la

    profondeur de l’étang et la taille des radeaux.

    Créer un sous-répertoire « corrélation ».

    Ajouter le fichier « Point profondeur.shp » au projet.

    Créer une surface à partir de ces ponctuels.

    ArcToolbox >Outil Spatial Analyst > Interpolation > IDW. Enregistrer le fichier *.shp dans le

    répertoire «corrélation ».

  • 15

    Récupérer la valeur Z pour chaque localisation des radeaux males adultes.

    ArcToolbox >Outil Spatial Analyst > Extraction > Extraction de valeurs vers des points.

    Enregistrer le fichier dans le sous-répertoire « correlation ».

    Exporter les données attributaires verts Excel. Effectuer un graphique XY (nuage de points)

    puis un coefficient de corrélation.