Spatial Autocorrelation (Global Moran's I) (Statistiques spatiales)
Récapitulatif
Mesure l'auto-corrélation spatiale selon l'emplacement des entités et leurs valeurs attributaires à l'aide de la statistique de l'indice global de Moran.
Vous pouvez accéder aux résultats de cet outil (fichier facultatif du rapport compris) par l'intermédiaire de la fenêtre Résultats. Si vous désactivez le traitement en arrière-plan, les résultats apparaissent également dans la boîte de dialogue Progression.
Pour en savoir plus sur le fonctionnement de l'outil Spatial Autocorrelation (Global Moran's I)
Illustration
Utilisation
-
L'outil d'auto-corrélation spatiale renvoie cinq valeurs : l'indice de Moran, l'indice attendu, la variance, le score z et la valeur p. Ces valeurs sont disponibles dans la fenêtre Résultats et sont transmises en tant que valeurs en sortie dérivées pour utilisation potentielle dans les modèles ou les scripts. Cet outil peut également créer un fichier HTML contenant un récapitulatif graphique des résultats. Double-cliquez sur le fichier HTML dans la fenêtre Résultats pour ouvrir le fichier HTML dans le navigateur Internet par défaut. Cliquez avec le bouton droit sur l'entrée Messages dans la fenêtre Résultats et sélectionnez Afficher pour consulter les résultats dans une boîte de dialogue de message. Si vous exécutez cet outil au premier plan, les valeurs en sortie sont également affichées dans la boîte de dialogue de progression.
Remarque :- Si cet outil fait partie d'un outil de modèle personnalisé, le lien HTML apparaît seulement dans la fenêtre Résultats s'il est défini en tant que paramètre du modèle avant l'exécution de l'outil.
- Pour un meilleur affichage des graphiques HTML, assurez-vous que la résolution définie pour votre moniteur est 96 PPP.
-
Etant donné un ensemble d'entités et un attribut associé, l'outil d'auto-corrélation spatiale évalue si le modèle exprimé est agrégé, dispersé, ou aléatoire. Lorsque le score z ou la valeur p représente la signification statistique, un indice de Moran positif indique une tendance à l'agrégation, alors qu'un indice de Moran négatif indique une tendance à la dispersion.
-
L'outil Spatial Autocorrelation (Global Moran's I) calcule un score z et une valeur p qui indiquent si l'hypothèse nulle peut être rejetée. L'hypothèse nulle suppose ici que les valeurs d'entité sont distribuées aléatoirement dans la zone d'étude.
-
Le score z est basé sur le calcul d'hypothèse nulle aléatoire. Pour plus d'informations sur les scores z, reportez-vous à la rubrique Qu'est-ce qu'un score z ? Qu'est-ce qu'une valeur p ?
-
Le Champ en entrée doit contenir différentes valeurs. Les formules mathématiques de cette statistique requièrent que la variable analysée fluctue quelque peu ; elle ne peut pas aboutir si toutes les valeurs en entrée sont égales à 1, par exemple. Si vous souhaitez utiliser cet outil pour analyser le modèle spatial de données d'incident, vous devrez peut-être agréger les données d'incident.
-
Les calculs basés sur la distance euclidienne ou la distance de Manhattan requièrent des données projetées afin de pouvoir mesurer les distances avec précision.
Cet outil peut également créer un fichier HTML récapitulant les résultats. Les fichiers HTML n'apparaissent pas automatiquement dans la fenêtre Catalogue. Si vous souhaitez afficher des fichiers HTML dans la fenêtre Catalogue, ouvrez l'application ArcCatalog, sélectionnez l'option de menu Personnaliser, cliquez sur Options ArcCatalog et sélectionnez l'onglet Types de fichiers. Cliquez sur le bouton Nouveau type et spécifiez HTML comme valeur du paramètre Extension de fichier.
-
Pour les entités linéaires et surfaciques, les centroïdes d'entité sont utilisés dans les calculs de distance. Pour les multi-points, les polylignes ou les polygones comprenant plusieurs parties, le centroïde est calculé à l'aide du centre moyen pondéré de toutes les parties d'entité. La pondération pour les entités ponctuelles est de 1 ; pour les entités linéaires, elle correspond à la longueur et pour les entités surfaciques, à la superficie.
-
Le choix du paramètre Conceptualisation de relations spatiales doit refléter les relations inhérentes entre les entités que vous analysez. Plus la modélisation de l'interaction des entités dans l'espace est réaliste, plus les résultats sont précis. Des recommandations sont présentées dans la section Sélection d'une conceptualisation de relations spatiales : meilleures pratiques. Voici quelques conseils supplémentaires :
- FIXED_DISTANCE_BAND
Point important, la valeur de Canal distance ou distance seuil par défaut garantie que chaque entité a un voisin au moins. Mais bien souvent, cette valeur par défaut n'est pas la distance la plus appropriée à l'analyse. Reportez-vous à la rubrique Sélection d'une valeur de canal de distance constante pour connaître les stratégies permettant de définir une valeur de canal de distance appropriée pour votre analyse.
- INVERSE_DISTANCE ou INVERSE_DISTANCE_SQUARED
Si une valeur égale à zéro est entrée pour le paramètre Canal distance ou distance seuil, toutes les entités sont considérées voisines de toutes les autres entités ; si aucune valeur n'est spécifiée pour ce paramètre, la distance par défaut est appliquée.
Les pondérations pour les distances inférieures à 1 deviennent instables lorsqu'elles sont inversées. Par conséquent, la pondération d'entités séparées par moins d'une unité de distance (courante avec les projections du système de coordonnées géographiques) se voit affecter la valeur 1.
Attention :L'analyse d'entités associées à une projection d'un système de coordonnées géographiques n'est pas recommandée lorsque vous sélectionnez une méthode de conceptualisation spatiale fondée sur l'inversion de la distance (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUARED ou ZONE_OF_INDIFFERENCE).
Pour les options d'inversion de la distance (INVERSE_DISTANCE, INVERSE_DISTANCE_SQUAREDou ZONE_OF_INDIFFERENCE), toute paire de points coïncidents se voit affecter une pondération de 1 pour éviter la division par zéro. Ainsi, aucune entité n'est exclue de l'analyse.
- FIXED_DISTANCE_BAND
-
Des options supplémentaires pour le paramètre Conceptualisation de relations spatiales (y compris les relations spatio-temporelles) sont proposées par les outils Générer la matrice de pondérations spatiales ou Générer les pondérations spatiales de réseau. Pour tirer parti de ces options, utilisez l'un de ces outils afin de créer le fichier de matrice de pondérations spatiales avant l'analyse ; sélectionnez GET_SPATIAL_WEIGHTS_FROM_FILE comme valeur du paramètre Conceptualisation de relations spatiales ; enfin, pour le paramètre Fichier de matrice de pondérations, spécifiez le chemin d'accès au fichier de matrice de pondérations spatiales que vous avez créé.
-
Les couches peuvent permettre de définir la Classe d'entités en entrée. Lors de l'utilisation d'une couche avec une sélection, seules les entités sélectionnées sont incluses dans l'analyse.
- Remarque :
- Si cet outil fait partie d'un outil de modèle personnalisé, le lien HTML apparaît seulement dans la fenêtre Résultats s'il est défini en tant que paramètre du modèle avant l'exécution de l'outil.
- Pour un meilleur affichage des graphiques HTML, assurez-vous que la résolution définie pour votre moniteur est 96 PPP.
Si vous utilisez un Fichier de matrice de pondérations portant une extension SWM, l'outil attend un fichier de matrice de pondérations spatiales créé à l'aide des outils Générer la matrice de pondérations spatiales ou Générer les pondérations spatiales de réseau ; dans le cas contraire, cet outil attend un fichier de matrice de pondérations spatiales au format ASCII. Dans certains cas, le comportement peut varier selon le type de fichier de matrice de pondérations spatiales que vous utilisez :
- Fichiers ASCII de matrice de pondérations spatiales :
- Les pondérations sont utilisées en l'état. Les relations entité à entité manquantes sont supposées nulles.
- Si les pondérations sont standardisées par lignes, le résultats des analyses portant sur les ensembles de sélection seront vraisemblablement incorrects. Si vous devez effectuer votre analyse sur un ensemble de sélection, convertissez le fichier ASCII de pondérations spatiales en fichier SWM. Pour ce faire, chargez les données ASCII dans une table, puis utilisez l'option CONVERT_TABLE de l'outil Générer la matrice de pondérations spatiales.
- Fichier SWM de matrice de pondérations spatiales :
- Si les pondérations sont standardisées par lignes, elles seront standardisées à nouveau pour les ensembles de sélection. Dans le cas contraire, les pondérations sont utilisées en l'état.
L'exécution de votre analyse avec un fichier de matrice de pondérations spatiales ASCII sollicite beaucoup de mémoire. Pour les analyses portant sur plus de 5 000 entités, envisagez de convertir votre fichier ASCII de matrice de pondérations spatiales en fichier au format SWM. En premier lieu, placez vos pondérations ASCII dans une table avec mise en forme (à l'aide d'Excel, par exemple). Exécutez ensuite l'outil Générer la matrice de pondérations spatiales en utilisant l'option CONVERT_TABLE comme valeur du paramètre Conceptualisation de relations spatiales. La sortie sera un fichier SWM de matrice de pondérations spatiales.
Pour les entités surfaciques, vous souhaiterez presque toujours choisir Ligne comme valeur du paramètre Standardisation par lignes. Standardisation par lignes atténue la tendance lorsque le nombre de voisins de chaque entité est une fonction du plan d'agrégation ou du processus d'échantillonnage, plutôt que de refléter la distribution spatiale réelle de la variable que vous analysez.
-
La rubrique d'aide Modélisation de relations spatiales fournit des informations supplémentaires à propos des paramètres de cet outil.
Dans ArcGIS 10, la sortie graphique optionnelle n'est plus affichée automatiquement. A la place, un fichier HTML récapitulant les résultats est créé. Pour afficher les résultats, double-cliquez sur le fichier HTML dans la fenêtre Résultats. Il se peut que les scripts personnalisés ou les outils de modèles créés à l'aide d'une version préalable à ArcGIS 10 et utilisant cet outil doivent être recréés. Pour recréer les outils personnalisés, ouvrez-les, supprimez le paramètre Afficher les résultats de manière graphique, puis enregistrez cette modification.
Vous risquez de manquer de mémoire lors de l'exécution de cet outil. Cela survient généralement lorsque vous sélectionnez une Conceptualisation de relations spatiales et/ou une valeur du paramètre Canal distance ou distance seuil qui résulte en une multitude de voisins par entité. Il vous arrivera rarement de vouloir définir des relations spatiales de sorte que chaque entité ait des milliers de voisins. Il suffit, d'ordinaire, que toutes les entités disposent d'au moins un voisin et que la plupart d'entre-elles en aient au moins huit.
Lorsque vous utilisez des fichiers de formes, n'oubliez pas qu'ils ne peuvent pas stocker de valeurs Null. Il se peut que des outils ou autres procédures qui créent des fichiers de formes à partir d'entrées autres que des fichiers de formes stockent ou interprètent des valeurs Null comme étant égales à zéro. Dans certains cas, les valeurs Null sont stockées sous forme de valeurs négatives très élevées dans les fichiers de formes. Cela peut aboutir à des résultats inattendus. Reportez-vous à la rubrique Remarques concernant le géotraitement pour la sortie de fichiers de formes pour plus d'informations.
Dans la version 9.2 d'ArcGIS, l'option de standardisation globale a été supprimée. La standardisation globale aboutit aux mêmes résultats que si aucune standardisation n'est appliquée. Les modèles créés avec les versions précédentes d'ArcGIS et qui utilisent l'option de standardisation globale devront peut-être être régénérés.
Syntaxe
Paramètre | Explication | Type de données |
Input_Feature_Class |
Classe d'entités pour laquelle l'autocorrélation spatiale est calculée. | Feature Layer |
Input_Field |
Champ numérique utilisé pour évaluer l'autocorrélation spatiale. | Field |
Generate_Report (Facultatif) |
| Boolean |
Conceptualization_of_Spatial_Relationships |
Indique la façon dont les relations spatiales sont conceptualisées parmi les entités.
| String |
Distance_Method |
Spécifie le mode de calcul des distances de chaque entité avec les entités voisines.
| String |
Standardization |
La standardisation par lignes est recommandée chaque fois que la répartition de vos entités est potentiellement influencée par la conception de l'échantillonnage ou un plan d'agrégation imposé.
| String |
Distance_Band_or_Threshold_Distance (Facultatif) |
Spécifie une distance limite pour les options Inverse Distance et Fixed Distance. Les entités se trouvant à l'extérieur de la limite spécifiée pour une entité cible ne sont pas prises en compte dans les analyses pour cette entité. Cependant, pour Zone of Indifference, l'influence des entités situées hors de la distance donnée est réduite avec la distance, tandis que les entités se trouvant dans le seuil de distance sont considérées à part égale. La valeur de distance entrée doit être identique à celle du système de coordonnées en sortie. Pour les conceptualisations basées sur l'inverse de la distance de relations spatiales, une valeur de 0 indique qu'aucune distance seuil n'est appliquée ; lorsque ce paramètre n'est pas défini, une valeur de seuil par défaut est calculée et appliquée. Cette valeur par défaut correspond à la distance euclidienne permettant de garantir que chaque entité présente au moins un voisin. Ce paramètre n'a aucun effet lorsque les conceptualisations spatiales de contiguïté polygonale ou d'extraction des pondérations spatiales à partir du fichier sont sélectionnées. | Double |
Weights_Matrix_File (Facultatif) |
Chemin d'accès à un fichier contenant des pondérations qui définissent les relations spatiales, et potentiellement les relations temporelles, entre des entités. | File |
Exemple de code
Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil SpatialAutocorrelation.
import arcpy
arcpy.env.workspace = r"c:\data"
arcpy.SpatialAutocorrelation_stats("olsResults.shp", "Residual","NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN DISTANCE", "NONE", "#","euclidean6Neighs.swm")
Le script Python autonome ci-dessous illustre l'utilisation de l'outil SpatialAutocorrelation.
# Analyze the growth of regional per capita incomes in US
# Counties from 1969 -- 2002 using Ordinary Least Squares Regression
# Import system modules
import arcpy
# Set the geoprocessor object property to overwrite existing outputs
arcpy.gp.overwriteOutput = True
# Local variables...
workspace = r"C:\Data"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.workspace = workspace
# Growth as a function of {log of starting income, dummy for South
# counties, interaction term for South counties, population density}
# Process: Ordinary Least Squares...
ols = arcpy.OrdinaryLeastSquares_stats("USCounties.shp", "MYID",
"olsResults.shp", "GROWTH",
"LOGPCR69;SOUTH;LPCR_SOUTH;PopDen69",
"olsCoefTab.dbf",
"olsDiagTab.dbf")
# Create Spatial Weights Matrix (Can be based off input or output FC)
# Process: Generate Spatial Weights Matrix...
swm = arcpy.GenerateSpatialWeightsMatrix_stats("USCounties.shp", "MYID",
"euclidean6Neighs.swm",
"K_NEAREST_NEIGHBORS",
"#", "#", "#", 6)
# Calculate Moran's I Index of Spatial Autocorrelation for
# OLS Residuals using a SWM File.
# Process: Spatial Autocorrelation (Morans I)...
moransI = arcpy.SpatialAutocorrelation_stats("olsResults.shp", "Residual",
"NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE",
"EUCLIDEAN_DISTANCE", "NONE", "#",
"euclidean6Neighs.swm")
except:
# If an error occurred when running the tool, print out the error message.
print arcpy.GetMessages()
Environnements
- Système de coordonnées en sortie
La géométrie de l'entité est projetée au système de coordonnées en sortie avant l'analyse. Tous les calculs mathématiques sont basés sur la référence spatiale du système de coordonnées en sortie.