Clustering alto/bajo (G general de Getis-Ord) (Estadística espacial)
Resumen
Mide el grado de clustering para valores altos o bajos mediante la estadística G general de Getis-Ord.
Puede acceder a los resultados de esta herramienta (incluido el archivo de informe opcional) desde la ventana Resultados. Si deshabilita el procesamiento en segundo plano, los resultados también se escriben en el cuadro de diálogo Progreso.
Más información sobre cómo funciona el Clustering alto/bajo: G general de Getis-Ord
Ilustración
Uso
-
La herramienta Clustering alto/bajo: G general de Getis-Ord devuelve cinco valores: G general observada, G general esperada, Varianza, puntuación z y valor P. Se puede acceder a estos valores en la ventana Resultados y los mismos también se transmiten como valores de salida derivados para uso potencial en modelos o secuencias de comandos. Opcionalmente, esta herramienta creará un archivo HTML con un resumen gráfico de los resultados. Haga doble clic en el archivo HTML de la ventana Resultados para abrir el archivo HTML en el navegador de Internet predeterminado. Haga clic con el botón derecho del ratón en la entrada Mensajes de la ventana Resultados y seleccione Ver para mostrar los resultados en el cuadro de diálogo Mensaje.
Nota:- Si esta herramienta es parte de una herramienta de modelo personalizado, el vínculo HTML solo aparece en la ventana Resultados si se establece como un parámetro de modelo antes de ejecutar la herramienta.
- Para obtener una mejor visualización de gráficos HTML, asegúrese de que su monitor esté configurado a 96 DPI.
-
El Campo de entrada debe contener una variedad de valores que no sean negativos. Si el Campo de entrada contiene valores negativos, aparecerá un mensaje de error. Además, la operación matemática para esta estadística requiere cierta variación en la variable analizada; no se puede resolver si todos los valores de entrada son 1, por ejemplo. Si desea utilizar esta herramienta para analizar el patrón espacial de los datos de incidentes, considere agregar los datos de incidentes. La herramienta Análisis de puntos calientes optimizado también se puede utilizar para analizar el patrón espacial de datos de incidentes.
Nota:Los datos de incidentes son puntos que representan eventos (delincuencia, accidentes de tráfico) u objetos (árboles, tiendas) donde el foco se centra en su presencia o ausencia en lugar de algún atributo de medición asociado con cada punto.
-
Los resultados de la puntuación z y el valor p son medidas de significancia estadística que indican si se debe rechazar o no la hipótesis nula. Para esta herramienta, la hipótesis nula establece que los valores asociados con entidades están distribuidos en forma aleatoria.
-
La puntuación z está basada en el cálculo de la hipótesis nula de aleatorización. Para obtener más información sobre las puntuaciones z, consulte ¿Qué es una puntuación z? ¿Qué es un valor P?
-
Mientras más alta (o más baja) sea la puntuación z, mayor será la intensidad del clustering. Una puntuación z cercana a cero indica que no hay un clustering evidente dentro del área de estudio. Una puntuación z positiva indica que hay un clustering de valores altos. Una puntuación z negativa indica que hay un clustering de valores bajos.
Cuando la Clase de entidad de entrada no está proyectada (es decir, cuando las coordenadas se especifican en grados, minutos y segundos) o cuando el sistema de coordenadas de salida está establecido en un Sistema de coordenadas geográficas, las distancias se calculan mediante mediciones de cuerda. Las mediciones de distancia de cuerda se utilizan porque se pueden calcular rápidamente y proporcionar muy buenas estimaciones de verdaderas distancias geodésicas, al menos para los puntos separados unos treinta grados entre sí. Las distancias de cuerda se basan en una esfera en lugar de la verdadera forma de elipsoide oblato de la Tierra. Dados dos puntos en la superficie de la Tierra, la distancia de cuerda entre ellos es la longitud de una línea, que atraviesa la Tierra tridimensional, para conectar estos dos puntos. Las distancias de cuerda se informan en metros.
Precaución:Asegúrese de proyectar los datos si su área de estudio se extiende más allá de los 30 grados. Las distancias de cuerda no son una buena estimación de las distancias geodésicas más allá de 30 grados.
Cuando se utilizan distancias de cuerda en el análisis, el parámetro Banda de distancia o distancia de umbral, si se especifica, debe proporcionarse en metros.
Antes de ArcGIS 10.2.1 se mostraba un mensaje de advertencia si los parámetros y la configuración del entorno seleccionados tendrían como resultados unos cálculos realizados mediante Coordenadas geográficas (grados, minutos, segundos). Esta advertencia le aconsejaba que proyectara sus datos en un Sistema de Coordenadas Proyectadas para que los cálculos de la distancia fueran precisos. Sin embargo, a partir de la versión 10.2.1, esta herramienta también calcula las distancias de cuerda cuando se precisan cálculos de Sistema de Coordenadas Proyectadas.
Precaución:Debido a este cambio, hay pocas posibilidades de que deba modificar los modelos que incorporan esta herramienta si sus modelos fueron creados con anterioridad a ArcGIS 10.2.1 e incluían valores de parámetros del Sistema de Coordenadas Proyectadas codificados. Si, por ejemplo, un parámetro de distancia se establece en 0,0025 grados, deberá convertir ese valor fijo de grados a metros y volver a guardar el modelo.
-
Los centroides de entidad se utilizan en los cálculos de distancia para las entidades de línea y polígono. Para multipuntos, polilíneas o polígonos con varias partes, el centroide se calcula utilizando el centro medio ponderado de todas las partes de entidad. La ponderación para las entidades de punto es 1, para las entidades de línea es longitud y para las entidades de polígono es área.
Esta herramienta creará opcionalmente un archivo HTML que resume los resultados. Los archivos HTML no aparecerán automáticamente en la ventana Catálogo. Si desea que los archivos HTML se muestren en el Catálogo, abra la aplicación ArcCatalog, seleccione la opción de menú Personalizar, haga clic en Opciones de ArcCatalog y seleccione la pestaña Tipos de archivo. Haga clic en el botón Nuevo tipo y especifique HTML para Extensión de archivo.
-
Su elección del parámetro Conceptualización de relaciones espaciales deberá reflejar relaciones inherentes entre las entidades que analiza. Cuanto más pueda modelar de manera realista cómo interactúan mutuamente las entidades en el espacio, más precisos serán sus resultados. Las recomendaciones se esquematizan en Seleccionar una conceptualización de relaciones espaciales. Aquí le presentamos algunas sugerencias adicionales:
- Para esta estadística se recomienda un esquema de pesos binarios: distancia fija, contigüidad de polígonos, vecinos más próximos K o triangulación de Delaunay. Seleccione NINGUNO para el parámetro Estandarización.
- FIXED_DISTANCE_BAND
La Banda de distancia o distancia de umbral predeterminada garantizará que cada entidad tenga un vecino como mínimo, lo cual es importante. Sin embargo, generalmente, este valor predeterminado no es la distancia más apropiada que se debe utilizar para el análisis. En Seleccionar un valor de banda de distancia fija se describen estrategias adicionales para seleccionar una escala apropiada (banda de distancia) para su análisis.
- INVERSE_DISTANCE o INVERSE_DISTANCE_SQUARED (no recomendado)
Cuando se introduce cero para el parámetro Banda de distancia o distancia de umbral, se considera que todas las entidades son vecinas de las demás entidades; cuando este parámetro se deja en blanco, se aplica la distancia predeterminada.
Los pesos de las distancias menores que 1 se vuelven inestables cuando se invierten. Por consiguiente, a los pesos de entidades separadas por menos de 1 unidad de distancia se les da un peso de 1.
Para las opciones de distancia inversa (no se recomienda para esta herramienta), dos puntos que son coincidentes recibirán una ponderación de uno para evitar la división por cero. Esto garantiza que las entidades no sean excluidas del análisis.
-
Las opciones adicionales para el parámetro Conceptualización de relaciones espaciales, incluyendo las relaciones espacio-tiempo, están disponibles mediante las herramientas Generar matriz de ponderaciones espaciales o Generar pesos espaciales de red. Para aprovechar estas opciones adicionales, utilice una de estas herramientas para crear el archivo de matriz de ponderaciones espaciales antes del análisis; seleccione GET_SPATIAL_WEIGHTS_FROM_FILE para el parámetro Conceptualización de relaciones espaciales; y, para el parámetro Archivo de matriz de ponderaciones, especifique la ruta al archivo de ponderaciones espaciales que creó.
-
Las capas del mapa se pueden utilizar para definir la Clase de entidad de entrada. Cuando se utiliza una capa con una selección, solo las entidades seleccionadas se incluyen en el análisis.
Si proporciona un Archivo de matriz de ponderaciones con una extensión SWM, esta herramienta espera un archivo de matriz de ponderaciones espaciales creado utilizando las herramientas Generar matriz de ponderaciones espaciales o Generar pesos espaciales de red; de lo contrario, esta herramienta espera un archivo de matriz de ponderaciones espaciales con formato ASCII. En algunos casos, el comportamiento es diferente según el tipo de archivo de matriz de ponderaciones espaciales que se utiliza:
- Archivos de matriz de ponderaciones espaciales con formato ASCII:
- Las ponderaciones se utilizan como están. Las relaciones de entidad a entidad que faltan se tratan como ceros.
- Si los pesos están estandarizados por fila, es probable que los resultados sean incorrectos para el análisis en los conjuntos de selección. Si necesita ejecutar el análisis en un conjunto de selección, convierta el archivo de ponderaciones espaciales ASCII a un archivo SWM leyendo los datos ASCII en una tabla y utilizando después la opción CONVERT_TABLE con la herramienta Generar matriz de ponderaciones espaciales.
- Archivo de matriz de ponderaciones espaciales con formato SWM:
- Si las ponderaciones están estandarizadas en filas, se volverán a estandarizar para los conjuntos de selección; de lo contrario, las ponderaciones se utilizan tal cual.
- Archivos de matriz de ponderaciones espaciales con formato ASCII:
La ejecución del análisis con un archivo de matriz de ponderaciones espaciales con formato ASCII consume muchos recursos de memoria. Para los análisis de más de 5.000 entidades, considere convertir el archivo de matriz de ponderaciones espaciales con formato ASCII en un archivo con formato SWM. Primero coloque los pesos ASCII en una tabla con formato (por ejemplo, por medio de Excel). A continuación, ejecute la herramienta Generar matriz de ponderaciones espaciales utilizando CONVERT_TABLE para el parámetro Conceptualización de relaciones espaciales. El resultado será un archivo de matriz de ponderaciones espaciales con formato SWM.
-
El tema de ayuda Modelado de relaciones espaciales ofrece información adicional sobre los parámetros de esta herramienta.
En ArcGIS 10, el resultado gráfico opcional ya no se muestra automáticamente. En cambio, se crea un archivo HTML que resume los resultados. Para ver los resultados, haga doble clic en el archivo HTML de la ventana Resultados. Es posible que sea necesario reconstruir las secuencias de comandos o las herramientas de modelo personalizadas anteriores a ArcGIS 10 que utilizan esta herramienta. Para reconstruir estas herramientas personalizadas, ábralas, quite el parámetro Mostrar resultados de forma gráfica y vuelva a guardarlas.
Al utilizar shapefiles tenga en cuenta que no pueden almacenar valores nulos. Las herramientas u otros procedimientos que crean shapefiles a partir de entradas sin shapefiles pueden almacenar o interpretar valores nulos como cero. En algunos casos, los nulos se almacenan como valores negativos muy grandes en shapefiles. Esto puede ocasionar resultados inesperados. Consulte Consideraciones de geoprocesamiento para la salida del shapefile para obtener más información.
Sintaxis
Parámetro | Explicación | Tipo de datos |
Input_Feature_Class |
La clase de entidad para la cual se calculará la estadística G general. | Feature Layer |
Input_Field |
El campo numérico que se evaluará. | Field |
Generate_Report (Opcional) |
| Boolean |
Conceptualization_of_Spatial_Relationships |
Especifica cómo se conceptualizan las relaciones espaciales entre las entidades.
| String |
Distance_Method |
Especifica cómo se calculan las distancias desde cada entidad hasta las entidades vecinas.
| String |
Standardization |
Se recomienda la estandarización de filas siempre que la distribución de las entidades esté potencialmente influenciada debido al diseño de muestreo o a un esquema de agregación impuesto.
| String |
Distance_Band_or_Threshold_Distance (Opcional) |
Especifica una distancia de valor límite para las opciones Distancia inversa y Distancia fija. Las entidades que están fuera del valor límite especificado para una entidad de destino se ignoran en el análisis de esa entidad. Sin embargo, para la Zona de indiferencia, la influencia de las entidades que están fuera de la distancia dada se reduce con la distancia, mientras que aquellas que están dentro del umbral de distancia se consideran por igual. El valor de distancia introducido debe coincidir con el del sistema de coordenadas de salida. Para las conceptualizaciones de relaciones espaciales de la Distancia inversa, un valor de 0 indica que no se aplica una distancia de umbral; cuando este parámetro se deja en blanco, se calcula y se aplica un valor de umbral predeterminado. Este valor predeterminado es la distancia euclidiana que garantiza que cada entidad tenga como mínimo un vecino. Este parámetro no tiene efecto cuando se seleccionan las conceptualizaciones espaciales Contigüidad de polígono u Obtener ponderaciones espaciales a partir del archivo. | Double |
Weights_Matrix_File (Opcional) |
La ruta a un archivo que contenga los pesos que definen las relaciones espaciales, y potencialmente temporales entre las entidades. | File |
Ejemplo de código
La siguiente secuencia de comandos de la ventana de Python muestra cómo utilizar la herramienta Clustering alto/bajo.
import arcpy
arcpy.env.workspace = r"C:\data"
arcpy.HighLowClustering_stats("911Count.shp", "ICOUNT","false", "GET_SPATIAL_WEIGHTS_FROM_FILE","EUCLIDEAN_DISTANCE", "NONE","#", "euclidean6Neighs.swm")
La siguiente secuencia de comandos independiente de la ventana de Python muestra cómo utilizar la herramienta Clustering alto/bajo.
# Analyze the spatial distribution of 911 calls in a metropolitan area
# using the High/Low Clustering (Getis-Ord General G) tool
# Import system modules
import arcpy
# Set the geoprocessor object property to overwrite existing outputs
arcpy.gp.overwriteOutput = True
# Local variables...
workspace = r"C:\Data"
try:
# Set the current workspace (to avoid having to specify the full path to the feature classes each time)
arcpy.env.workspace = workspace
# Copy the input feature class and integrate the points to snap
# together at 500 feet
# Process: Copy Features and Integrate
cf = arcpy.CopyFeatures_management("911Calls.shp", "911Copied.shp",
"#", 0, 0, 0)
integrate = arcpy.Integrate_management("911Copied.shp #", "500 Feet")
# Use Collect Events to count the number of calls at each location
# Process: Collect Events
ce = arcpy.CollectEvents_stats("911Copied.shp", "911Count.shp", "Count", "#")
# Add a unique ID field to the count feature class
# Process: Add Field and Calculate Field
af = arcpy.AddField_management("911Count.shp", "MyID", "LONG", "#", "#", "#", "#",
"NON_NULLABLE", "NON_REQUIRED", "#",
"911Count.shp")
cf = arcpy.CalculateField_management("911Count.shp", "MyID", "[FID]", "VB")
# Create Spatial Weights Matrix for Calculations
# Process: Generate Spatial Weights Matrix...
swm = arcpy.GenerateSpatialWeightsMatrix_stats("911Count.shp", "MYID",
"euclidean6Neighs.swm",
"K_NEAREST_NEIGHBORS",
"#", "#", "#", 6,
"NO_STANDARDIZATION")
# Cluster Analysis of 911 Calls
# Process: High/Low Clustering (Getis-Ord General G)
hs = arcpy.HighLowClustering_stats("911Count.shp", "ICOUNT",
"false",
"GET_SPATIAL_WEIGHTS_FROM_FILE",
"EUCLIDEAN_DISTANCE", "NONE",
"#", "euclidean6Neighs.swm")
except:
# If an error occurred when running the tool, print out the error message.
print arcpy.GetMessages()
Entornos
- Sistema de coordenadas de salida
La geometría de entidades se proyecta al sistema de coordenadas de salida antes del análisis. Todos los cálculos matemáticos se basan en la referencia espacial del sistema de coordenadas de salida. Cuando el entorno del Sistema de coordenadas de salida se basa en grados, minutos y segundos, las distancias geodésicas se calculan mediante distancias de cuerda.