Average Nearest Neighbor (Statistiques spatiales)
Récapitulatif
Calcule un index du voisin le plus proche en fonction de la distance moyenne de chaque entité par rapport à son entité avoisinante la plus proche.
Vous pouvez accéder aux résultats de cet outil (fichier facultatif du rapport compris) par l'intermédiaire de la fenêtre Résultats. Si vous désactivez le traitement en arrière-plan, les résultats apparaissent également dans la boîte de dialogue Progression.
Pour en savoir plus sur le fonctionnement de l'outil Average Nearest Neighbor Distance
Illustration
Utilisation
-
L'outil Average Nearest Neighbor renvoie cinq valeurs : distance moyenne observée, distance moyenne attendue, indice de voisin le plus proche, score z et valeur p. Ces valeurs sont disponibles dans la fenêtre Résultats et sont transmises en tant que valeurs en sortie dérivées pour utilisation potentielle dans les modèles ou les scripts. Cet outil peut également créer un fichier HTML contenant un récapitulatif graphique des résultats. Double-cliquez sur le fichier HTML dans la fenêtre Résultats pour ouvrir le fichier HTML dans le navigateur Internet par défaut. Cliquez avec le bouton droit sur l'entrée Messages dans la fenêtre Résultats et sélectionnez Afficher pour consulter les résultats dans une boîte de dialogue de message.
Remarque :- Si cet outil fait partie d'un outil de modèle personnalisé, un lien HTML apparaît dans la fenêtre Résultats s'il est défini comme paramètre de modèle avant l'exécution de l'outil.
- Pour un meilleur affichage des graphiques HTML, assurez-vous que la résolution définie pour votre moniteur est 96 PPP.
-
Les résultats de score z et de valeur p sont des mesures de signification statistique qui indiquent si l'on peut rejeter l'hypothèse nulle. Notez, toutefois, que la signification sur le plan statistique de cette méthode est fortement impactée par la taille de la zone d'étude (voir ci-après). Pour la statistique Average Nearest Neighbor, l'hypothèse nulle suppose que les entités sont distribuées aléatoirement.
-
L'indice de voisin le plus proche est exprimé en tant que rapport de la distance moyenne observée à la distance moyenne attendue. La distance attendue est la distance moyenne entre voisins dans une distribution aléatoire hypothétique. Si l'indice est inférieur à 1, le modèle présente un phénomène d'agrégation ; si l'indice est supérieur à 1, la tendance est à la dispersion ou à la concurrence.
-
La méthode de moyenne distance de voisin le plus proche est très sensible à la valeur Surface (d'infimes variations de la valeur du paramètre Surface peuvent provoquer des variations sensibles dans les résultats). Par conséquent, l'outil Moyenne du voisin le plus proche est plus efficace pour comparer des entités différentes dans une zone d'étude fixe. L'image suivante illustre la façon dont des distributions identiques d'entités peuvent être dispersées ou agrégées selon la zone d'étude spécifiée.
-
Si une valeur du paramètre Surface n'est pas spécifiée, c'est la superficie du rectangle d'encadrement minimum des entités en entrée qui est utilisée. Contrairement à l'étendue, un rectangle d'encadrement minimum ne s'aligne pas nécessairement sur les axes x et y.
Lorsque la Classe d'entités en entrée n'est pas projetée (c'est-à-dire, lorsque les coordonnées sont exprimées en degrés, minutes et secondes) ou lorsque le système de coordonnées en sortie est un Système de coordonnées géographiques, les distances sont calculées à l'aide des mesures à la corde. Les mesures de distance à la corde permettent de calculer rapidement et de fournir une bonne estimation de distance géodésiques réelles, du moins pour les points situés à environ trente degrés les uns des autres. Les distances à la corde s'appuient sur une sphère plutôt que sur la véritable forme d'ellipsoïde aplati de la Terre. Si l'on prend deux points sur la surface de la Terre, la distance à la corde qui les sépare est la longueur d'une ligne qui traverse la Terre en trois dimensions pour relier ces deux points. Les distances à la corde sont exprimées en mètres.
Attention :Veillez à projeter les données si votre zone d'étude s'étend au-delà de 30 degrés. Les distances à la corde ne constituent pas une bonne estimation des distance géodésiques au-delà de 30 degrés.
Lorsque vous utilisez des distances à la corde dans l'analyse, le paramètre Surface, s'il est spécifié, doit être exprimé en mètres.
Avant ArcGIS 10.2.1, un message d'avertissement s'affichait si les paramètres et les paramètres d'environnement sélectionnés devaient entraîner des calculs avec des coordonnées géographiques (degrés, minutes, secondes). Cet avertissement vous conseillait de projeter vos données dans un système de coordonnées projetées, de manière que les calculs de distance soient précis. Cependant, depuis la version 10.2.1, cet outil calcule les distances à la corde à chaque fois que des calculs de système de coordonnées géographiques sont nécessaires.
Attention :En raison de ce changement, il n'est pas exclus que vous deviez modifier les modèles qui incorporent cet outil si ceux-ci ont été créés avant ArcGIS 10.2.1 et s'ils contiennent des valeurs de paramètres de système de coordonnées géographiques codées en dur. Si, par exemple, un paramètre de distance est définie sur une valeur telle que 0,0025 degrés, vous devez convertir cette valeur constante de degrés en mètres et enregistrer à nouveau votre modèle.
-
Dans certains cas, des rectangles d'encadrement minimum non valides (superficie nulle) sont générés pour des entités en entrée. Pour y remédier, une petite valeur dérivée de la tolérance x,y de l'entité en entrée permet de créer le rectangle d'encadrement minimum. Par exemple, si toutes les entités sont coïncidentes (toutes ont exactement les mêmes coordonnées x et y), le système utilise, dans les calculs, la superficie d'un petit polygone carré autour de l'emplacement unique. Autre exemple : si toutes les entités sont parfaitement alignées (par exemple, 3 points sur une ligne droite), le système utilise la superficie d'un polygone rectangle qui laisse un petit espace autour des entités encadrées. Quoi qu'il en soit, il vaut toujours mieux fournir une valeur de Surface avec l'outil Moyenne du voisin le plus proche.
-
Bien que cet outil fonctionne avec des données surfaciques ou linéaires, il est plus adapté aux données d'événement, d'incident ou autres données d'entité ponctuelle fixe. Pour les entités linéaires et surfaciques, les calculs utilisent le centroïde géométrique vrai pour chaque entité. Pour les multi-points, les polylignes, ou les polygones comprenant plusieurs parties, le centroïde est calculé à l'aide du centre moyen pondéré de toutes les parties d'entité. La pondération pour les entités ponctuelles est de 1 ; pour les entités linéaires, elle correspond à la longueur et pour les entités surfaciques, à la superficie.
Cet outil peut également créer un fichier HTML récapitulant les résultats. Les fichiers HTML n'apparaissent pas automatiquement dans la fenêtre Catalogue. Si vous souhaitez afficher des fichiers HTML dans la fenêtre Catalogue, ouvrez l'application ArcCatalog, sélectionnez l'option de menu Personnaliser, cliquez sur Options ArcCatalog et sélectionnez l'onglet Types de fichiers. Cliquez sur le bouton Nouveau type et spécifiez HTML comme valeur du paramètre Extension de fichier.
-
Les couches peuvent permettre de définir la classe d'entités en entrée. Lorsque vous utilisez une couche avec une sélection, seules les entités sélectionnées sont comprises dans l'analyse.
Dans ArcGIS 10, la sortie graphique optionnelle n'est plus affichée automatiquement. En revanche, un fichier HTML récapitulant les résultats est créé. Pour afficher les résultats, double-cliquez sur le fichier HTML dans la fenêtre de résultats. Il se peut que les scripts personnalisés ou les outils de modèles créés à l'aide d'une version préalable à ArcGIS 10 et utilisant cet outil doivent être recréés. Pour recréer les outils personnalisés, ouvrez-les, supprimez le paramètre Afficher les résultats de manière graphique, puis enregistrez cette modification.
Lorsque vous utilisez des fichiers de formes, n'oubliez pas qu'ils ne peuvent pas stocker de valeurs Null. Il se peut que des outils ou autres procédures qui créent des fichiers de formes à partir d'entrées autres que des fichiers de formes stockent ou interprètent des valeurs Null comme étant égales à zéro. Dans certains cas, les valeurs Null sont stockées sous forme de valeurs négatives très élevées dans les fichiers de formes. Cela peut aboutir à des résultats inattendus. Reportez-vous à la rubrique Remarques concernant le géotraitement pour la sortie de fichiers de formes pour plus d'informations.
Syntaxe
Paramètre | Explication | Type de données |
Input_Feature_Class |
Classe d'entités, généralement une classe d'entités ponctuelles, pour laquelle la distance moyenne du voisin le plus proche est calculée. | Feature Layer |
Distance_Method |
Spécifie le mode de calcul des distances de chaque entité avec les entités voisines.
| String |
Generate_Report (Facultatif) |
| Boolean |
Area (Facultatif) |
Valeur numérique qui représente la taille de la zone d'étude. La valeur par défaut correspond à la superficie du rectangle d'encadrement minimum qui englobe toutes les entités (ou toutes les entités sélectionnées). Les unités doivent correspondre à celles du système de coordonnées en sortie. | Double |
Exemple de code
Le script de fenêtre Python ci-dessous illustre l'utilisation de l'outil AverageNearestNeighbor.
import arcpy
arcpy.env.workspace = r"C:\data"
arcpy.AverageNearestNeighbor_stats("burglaries.shp", "EUCLIDEAN_DISTANCE", "NO_REPORT", "#")
Le script Python autonome ci-dessous illustre l'utilisation de l'outil AverageNearestNeighbor.
# Analyze crime data to determine if spatial patterns are statistically significant
# Import system modules
import arcpy
# Local variables...
workspace = "C:/data"
crime_data = "burglaries.shp"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Obtain Nearest Neighbor Ratio and z-score
# Process: Average Nearest Neighbor...
nn_output = arcpy.AverageNearestNeighbor_stats(crime_data, "EUCLIDEAN_DISTANCE", "NO_REPORT", "#")
# Create list of Average Nearest Neighbor output values by splitting the result object
print "The nearest neighbor index is: " + nn_output[0]
print "The z-score of the nearest neighbor index is: " + nn_output[1]
print "The p-value of the nearest neighbor index is: " + nn_output[2]
print "The expected mean distance is: " + nn_output[3]
print "The observed mean distance is: " + nn_output[4]
print "The path of the HTML report: " + nn_output[5]
except:
# If an error occurred when running the tool, print out the error message.
print arcpy.GetMessages()
Environnements
- Système de coordonnées en sortie
La géométrie de l'entité est projetée au système de coordonnées en sortie avant l'analyse. Tous les calculs mathématiques sont basés sur la référence spatiale du système de coordonnées en sortie. Lorsque le système de coordonnées en sortie est exprimé en degrés, minutes et secondes, les distances géodésiques sont estimées à l'aide de distances à la corde.