Análisis de cluster y de valor atípico (I Anselin local de Moran) (Estadística espacial)

Nivel de licencia:BasicStandardAdvanced

Resumen

Dado un conjunto de entidades ponderadas, identifica puntos calientes, puntos fríos y valores atípicos espaciales estadísticamente significativos mediante la estadística de I Anselin local de Moran.

Más información acerca de cómo funciona el Análisis de cluster y de valor atípico (I Anselin local de Moran)

Ilustración

Ilustración del análisis cluster y de valor atípico

Uso

Sintaxis

ClustersOutliers_stats (Input_Feature_Class, Input_Field, Output_Feature_Class, Conceptualization_of_Spatial_Relationships, Distance_Method, Standardization, {Distance_Band_or_Threshold_Distance}, {Weights_Matrix_File}, {Apply_False_Discovery_Rate__FDR__Correction})
ParámetroExplicaciónTipo de datos
Input_Feature_Class

La clase de entidad para la que se realizará el análisis de cluster/valor atípico.

Feature Layer
Input_Field

El campo numérico que se evaluará.

Field
Output_Feature_Class

La clase de entidad de salida que recibirá los campos de resultados.

Feature Class
Conceptualization_of_Spatial_Relationships

Especifica cómo se conceptualizan las relaciones espaciales entre las entidades.

  • INVERSE_DISTANCELas entidades vecinas tienen mayor influencia sobre los cálculos de una entidad de destino que las entidades que están alejadas.
  • INVERSE_DISTANCE_SQUAREDEs igual que INVERSE_DISTANCE excepto que la pendiente es más nítida, de modo que la influencia cae de forma más rápida y solo los vecinos más cercanos de la entidad de destino ejercerán una influencia sustancial en los cálculos de esa entidad.
  • FIXED_DISTANCE_BANDCada entidad se analiza dentro del contexto de las entidades vecinas. Las entidades vecinas dentro de la distancia crítica especificada reciben un peso de 1, y ejercen influencia sobre los cálculos de la entidad de destino. Las entidades vecinas fuera de la distancia crítica reciben un peso de cero y no tienen influencia sobre los cálculos de una entidad de destino.
  • ZONE_OF_INDIFFERENCELas entidades dentro de la distancia crítica especificada de una entidad de destino reciben un peso de 1 y ejercen influencia sobre los cálculos de esa entidad. Una vez que se excede la distancia crítica, los pesos (y la influencia que una entidad vecina tiene sobre los cálculos de una entidad de destino) disminuyen con la distancia.
  • CONTIGUITY_EDGES_ONLYSolo las entidades de polígono vecinas que comparten un límite o que se superponen tendrán influencia sobre los cálculos de la entidad poligonal de destino.
  • CONTIGUITY_EDGES_CORNERSLas entidades poligonales que comparten un límite, comparten un nodo o se superponen tendrán influencia sobre los cálculos de la entidad poligonal de destino.
  • GET_SPATIAL_WEIGHTS_FROM_FILELas relaciones espaciales se definen en un archivo de ponderaciones espaciales. La ruta al archivo de ponderaciones espaciales se especifica en el parámetro Archivo de matriz de ponderaciones.
String
Distance_Method

Especifica cómo se calculan las distancias desde cada entidad hasta las entidades vecinas.

  • EUCLIDEAN_DISTANCELa distancia en línea recta entre dos puntos
  • MANHATTAN_DISTANCELa distancia entre dos puntos medida a lo largo de los ejes en ángulos rectos (manzana); se calcula al sumar la diferencia (absoluta) entre las coordenadas x e y
String
Standardization

Se recomienda la estandarización de filas siempre que la distribución de las entidades esté potencialmente influenciada debido al diseño de muestreo o a un esquema de agregación impuesto.

  • NONENo se aplica la estandarización de ponderaciones espaciales.
  • ROWLas ponderaciones espaciales se estandarizan; cada peso se divide por la suma de su fila (la suma de los pesos de todas las entidades vecinas).
String
Distance_Band_or_Threshold_Distance
(Opcional)

Especifica una distancia de valor límite para las opciones Distancia inversa y Distancia fija. Las entidades que están fuera del valor límite especificado para una entidad de destino se ignoran en el análisis de esa entidad. Sin embargo, para la Zona de indiferencia, la influencia de las entidades que están fuera de la distancia dada se reduce con la distancia, mientras que aquellas que están dentro del umbral de distancia se consideran por igual. El valor de distancia introducido debe coincidir con el del sistema de coordenadas de salida.

Para las conceptualizaciones de relaciones espaciales de la Distancia inversa, un valor de 0 indica que no se aplica una distancia de umbral; cuando este parámetro se deja en blanco, se calcula y se aplica un valor de umbral predeterminado. Este valor predeterminado es la distancia euclidiana que garantiza que cada entidad tenga como mínimo un vecino.

Este parámetro no tiene efecto cuando se seleccionan las conceptualizaciones espaciales Contigüidad de polígono u Obtener ponderaciones espaciales a partir del archivo.

Double
Weights_Matrix_File
(Opcional)

La ruta a un archivo que contenga los pesos que definen las relaciones espaciales, y potencialmente temporales entre las entidades.

File
Apply_False_Discovery_Rate__FDR__Correction
(Opcional)
  • APPLY_FDRLa importancia estadística se basará en la corrección del Índice de descubrimientos falsos (FDR) para un nivel de confianza del 95 por ciento.
  • NO_FDRLas entidades con valores p inferiores a 0,05 aparecerán en el campo COType para reflejar clusters o valores atípicos estadísticamente significativos para un nivel de confianza del 95 por ciento (valor predeterminado).
Boolean

Ejemplo de código

Ejemplo 1 de ClusterandOutlierAnalysis (ventana Python)

La siguiente secuencia de comandos de la ventana de Python muestra cómo utilizar la herramienta ClusterandOutlierAnalysis.

import arcpy
arcpy.env.workspace = "c:/data/911calls"
arcpy.ClustersOutliers_stats("911Count.shp", "ICOUNT","911ClusterOutlier.shp",
                             "GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN_DISTANCE", 
                             "NONE","#", "euclidean6Neighs.swm","NO_FDR")
Ejemplo 2 de ClusterandOutlierAnalysis (secuencia de comandos Python independiente)

La siguiente secuencia de comandos de Python independiente muestra cómo utilizar la herramienta ClusterandOutlierAnalysis.

# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the Cluster-Outlier Analysis Tool (Anselin's Local Moran's I)

# Import system modules
import arcpy

# Set geoprocessor object property to overwrite outputs if they already exist
arcpy.gp.OverwriteOutput = True

# Local variables...
workspace = r"C:\Data\911Calls"

try:
    # Set the current workspace 
    #  (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace

    # Copy the input feature class and integrate the points to snap
    # together at 500 feet
    # Process: Copy Features and Integrate
    cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
                         "#", 0, 0, 0)

    integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")

    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")

    # Add a unique ID field to the count feature class
    # Process: Add Field and Calculate Field
    af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
                     "NON_NULLABLE", "NON_REQUIRED", "#",
                     "911Count.shp")
    
    cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")

    # Create Spatial Weights Matrix for Calculations
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
                        "euclidean6Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 6) 

    # Cluster/Outlier Analysis of 911 Calls
    # Process: Local Moran's I
    clusters = arcpy.ClustersOutliers_stats("911Count.shp", "ICOUNT", 
                        "911ClusterOutlier.shp", 
                        "GET_SPATIAL_WEIGHTS_FROM_FILE",
                        "EUCLIDEAN_DISTANCE", "NONE",
                        "#", "euclidean6Neighs.swm","NO_FDR")

except:
    # If an error occurred when running the tool, print out the error message.
    print arcpy.GetMessages()

Entornos

Sistema de coordenadas de salida

La geometría de la entidad se proyecta al Sistema de coordenadas de salida antes del análisis, por lo tanto los valores introducidos para el parámetro Banda de distancia o distancia de umbral deben coincidir con los que se especificaron en el Sistema de coordenadas de salida. Todos los cálculos matemáticos se basan en la referencia espacial del Sistema de coordenadas de salida. Cuando el entorno del Sistema de coordenadas de salida se basa en grados, minutos y segundos, las distancias geodésicas se calculan en metros mediante la distancia de cuerda.

Temas relacionados

Información sobre licencias

ArcGIS for Desktop Basic: Sí
ArcGIS for Desktop Standard: Sí
ArcGIS for Desktop Advanced: Sí
5/10/2014