Cómo funciona Clustering alto/bajo (G general de Getis-Ord)

La herramienta Clustering alto/bajo mide la concentración de valores altos o bajos para una área de estudio determinada.

Cálculos

Cálculos matemáticos para la estadística G general

Ver cálculos adicionales para la estadística G general.

Observe que la única diferencia entre el numerador y el denominador es el peso (wij). La herramienta Clustering alto/bajo sólo funciona con valores positivos. Como consecuencia, si los pesos son binarios (0/1) o son siempre menores que 1, el rango para G general estará entre 0 y 1. Para esta estadística, se recomienda un esquema de pesos binarios. Seleccione Banda de distancia fija, Contigüidad de polígono, Vecinos más próximos K o Triangulación de Delaunay para el parámetro Conceptualización de relaciones espaciales. No seleccione ninguna para el parámetro Estandarización.

Interpretación

La herramienta Clustering alto/bajo (G general de Getis-Ord) es una estadística deductiva, lo que significa que los resultados del análisis se interpretan dentro del contexto de la hipótesis nula. La hipótesis nula para la estadística Clustering alto/bajo (G general) establece que no existe un clustering espacial de valores de entidades. Cuando el valor P que devuelve la herramienta es pequeño y estadísticamente significativo, la hipótesis nula se puede rechazar (consulte ¿Qué es una puntuación z? ¿Qué es un valor P?). Si se rechaza la hipótesis nula, el signo de la puntuación z se torna importante. Si el valor de la puntuación z es positivo, el índice de G general observada es mayor que el índice de G general esperada, lo que indica que se agrupan valores altos para el atributo en el área de estudio. Si el valor de la puntuación z es negativo, el índice de G general observada es menor que el índice de G general esperada, lo que indica que se agrupan valores bajos en el área de estudio.

La herramienta Clustering alto/bajo (G general de Getis-Ord) es más adecuada cuando tiene una distribución de valores pareja y busca picos espaciales no esperados de valores altos. Desafortunadamente, cuando se agrupan valores altos y bajos, estos tienden a cancelarse entre sí. Si desea medir un clustering espacial cuando se agrupan valores altos y bajos, utilice la herramienta Autocorrelación espacial.

La hipótesis nula para las herramientas Clustering alto/bajo (G general de Getis-Ord) y Autocorrelación espacial (I de Moran global) es la aleatoriedad espacial completa (CSR); los valores se distribuyen en forma aleatoria entre las entidades en el dataset, lo que refleja los procesos espaciales aleatorios en funcionamiento. Sin embargo, la interpretación de las puntuaciones z para la herramienta Clustering alto/bajo es muy diferente a la interpretación de las puntuaciones z para la herramienta Autocorrelación espacial (l de Moran global):

Resultado

Clustering alto/bajo

Autocorrelación espacial

El valor P no es estadísticamente significativo.

No puede rechazar la hipótesis nula. Es posible que la distribución espacial de los valores de atributos de entidades sea el resultado de procesos espaciales aleatorios. Dicho de otra forma, el patrón espacial observado de los valores podría ser cualquiera de las tantas versiones posibles de la aleatoriedad espacial completa.

El valor P es estadísticamente significativo y la puntuación z es positiva.

Puede rechazar la hipótesis nula. La distribución espacial de los valores altos en el dataset está más agrupada espacialmente de lo que se esperaría si los procesos espaciales subyacentes fueran realmente aleatorios.

Puede rechazar la hipótesis nula. La distribución espacial de los valores altos y los bajos en el dataset está más agrupada espacialmente de lo que se esperaría si los procesos espaciales subyacentes fueran realmente aleatorios.

El valor P es estadísticamente significativo y la puntuación z es negativa.

Puede rechazar la hipótesis nula. La distribución espacial de los valores bajos en el dataset está más agrupada espacialmente de lo que se esperaría si los procesos espaciales subyacentes fueran realmente aleatorios.

Puede rechazar la hipótesis nula. La distribución espacial de los valores altos y los valores bajos en el dataset está más dispersa espacialmente de lo que se esperaría si los procesos espaciales subyacentes fueran realmente aleatorios. Por lo general, un patrón espacial disperso refleja un tipo de proceso competitivo: una entidad con un valor alto rechaza a otras entidades con valores altos; del mismo modo, una entidad con un valor bajo rechaza a otras entidades con valores bajos.

Salida

La herramienta Clustering alto/bajo devuelve cinco valores: G general observada, G general esperada, varianza, puntuación z y valor P. Se puede acceder a estos valores en la ventana Resultados y los mismos se transmiten como valores de salida derivados para uso potencial en modelos o secuencias de comandos. Opcionalmente, esta herramienta creará un archivo HTML con un resumen gráfico de los resultados. Haga doble clic en el archivo HTML de la ventana Resultados para abrir el archivo HTML en el navegador de Internet predeterminado.

Además, al hacer clic con el botón derecho del ratón en la entrada Mensajes de la ventana Resultados y seleccionar Ver se mostrarán los resultados en el cuadro de diálogo Mensaje.

Se puede acceder al resultado de la herramienta en la ventana Resultados

Preguntas frecuentes

P: Los resultados de la herramienta Análisis de punto caliente (Gi* de Getis-Ord) indican los puntos calientes estadísticamente significativos. ¿Por qué los resultados de la herramienta Clustering alto/bajo (G general de Getis-Ord) no son también estadísticamente significativos?

R: Las estadísticas globales como la herramienta Clustering alto/bajo (G general de Getis-Ord) evalúan el patrón y la tendencia general de los datos. Son más efectivas cuando el patrón espacial es consistente en toda el área de estudio. Las herramientas de estadísticas locales (como Análisis de punto caliente) evalúan cada entidad dentro del contexto de entidades vecinas y comparan la situación local con la situación global. Considere un ejemplo. Cuando calcula una media o un promedio para un conjunto de valores, también está calculando una estadística global. Si todos los valores están cerca de 20, la media también estará cerca de 20, y dicho resultado será un buen resumen/una buena representación de todo el dataset. Pero si la mitad de los valores está cerca de 1 y la otra mitad de los valores está cerca de 100, la media estará cerca de 50. Puede que no haya valores de datos cerca de 50, de modo que el valor medio no es un buen resumen/una buena representación de todo el dataset. Sin embargo, si crea un histograma de los valores de los datos, podrá ver la distribución de dos modelos. Del mismo modo, las estadísticas espaciales globales, incluida la herramienta Clustering alto/bajo, son más efectivas cuando los procesos espaciales que se miden son consistentes en toda el área de estudio. Los resultados serán entonces un buen resumen/una buena representación del patrón espacial general. Para obtener más información, consulte Getis y Ord (1992), que se menciona más abajo, y el análisis de SIDS que presentan.

 

P: ¿Por qué los resultados de la herramienta Clustering alto/bajo (G general de Getis-Ord) son distintos a los resultados de la herramienta Autocorrelación espacial (I de Moran global)?

R: Vea la tabla anterior. Estas herramientas miden distintos patrones espaciales.

 

P: ¿Puede comparar las puntuaciones z y los valores P de esta herramienta con los resultados de un análisis de un área de estudio diferente?

R: En realidad los resultados no son comparables a menos que el área de estudio y los parámetros utilizados para el análisis sean fijos (los mismos para todos los análisis que desea comparar). No obstante, si el área de estudio comprende un conjunto fijo de polígonos y los parámetros del análisis son fijos, puede comparar las puntuaciones z para un atributo en particular con el transcurso del tiempo. Por ejemplo, supongamos que desea analizar las tendencias de clustering de la compra de medicamentos sin prescripción (OTC) al nivel de distrito de un condado en particular. Puede ejecutar Clustering alto/bajo para cada período de tiempo, y después crear un gráfico de línea de los resultados. Si descubre que las puntuaciones z son estadísticamente significativas y van en aumento, puede llegar a la conclusión de que se incrementó la intensidad del clustering espacial para las compras altas de OTC.

 

P: ¿El tamaño de la entidad afecta al análisis?

R: El tamaño de las entidades puede afectar los resultados. Por ejemplo, si los polígonos grandes tienden a tener valores bajos y los polígonos más pequeños tienden a tener valores altos, aún si la concentración de altos y bajos es igual, el índice de G general observada puede ser mayor que el índice de G general esperada ya que hay más pares de polígonos pequeños dentro de la distancia especificada.

Potenciales aplicaciones

Recursos adicionales

Getis, Arthur y J. K. Ord. "The Analysis of Spatial Association by Use of Distance Statistics". Geographical Analysis 24, Nº 3. 1992.

Mitchell, Andy. La Guía de Esri para el análisis SIG, Volumen 2. Esri Press, 2005.

9/11/2013