Regresión ponderada geográficamente (GWR) (Estadística espacial)

Nivel de licencia:BasicStandardAdvanced

Resumen

Realiza una Regresión ponderada geográficamente (GWR), una forma local de regresión lineal que se utiliza para modelar las relaciones que varían espacialmente.

Más información sobre cómo funciona Regresión ponderada geográficamente

Ilustración

Regresión ponderada geográficamente
GWR es un modelo de regresión local. Se permite que los coeficientes varíen.

Uso

Sintaxis

GeographicallyWeightedRegression_stats (in_features, dependent_field, explanatory_field, out_featureclass, kernel_type, bandwidth_method, {distance}, {number_of_neighbors}, {weight_field}, {coefficient_raster_workspace}, {cell_size}, {in_prediction_locations}, {prediction_explanatory_field}, {out_prediction_featureclass})
ParámetroExplicaciónTipo de datos
in_features

La clase en entidad que contiene las variables dependientes e independientes.

Feature Layer
dependent_field

El campo numérico que contiene los valores de aquello que intenta modelar.

Field
explanatory_field
[explanatory_field,...]

Una lista de campos que representan variables explicativas independientes en el modelo de regresión.

Field
out_featureclass

La clase de entidad de salida que recibirá estimaciones y residuales de variables dependientes.

Feature Class
kernel_type

Especifica si el kernel se construye como una distancia fija o si puede variar en extensión como una función de la densidad de entidad.

  • FIXEDEl contexto espacial (el Kernel gaussiano) que se utiliza para resolver cada análisis de regresión local es una distancia fija.
  • ADAPTIVEEl contexto espacial (el Kernel gaussiano) es una función de una cantidad de vecinos específica. Donde la distribución de entidades es densa, el contexto espacial es más pequeño; donde la distribución de entidades es dispersa, el contexto espacial en más amplio.
String
bandwidth_method

Especifica cómo se debe determinar la extensión del kernel. Cuando se selecciona AICc o CV, la herramienta buscará el parámetro de distancia/vecino óptimo. Normalmente seleccionará AICc o CV si no sabe qué utilizar para los parámetros Distancia (kernel_type = FIJO) o los parámetros number_of_neighbors (kernel_type = ADAPTABLE). Si selecciona BANDWIDTH_PARAMETER necesitará especificar un valor para los parámetros distancia o number_of_neighbors.

  • AICcLa extensión del kernel se determina mediante el Criterio de información de Akaike (AICc).
  • CVLa extensión del kernel se determina mediante la Validación cruzada.
  • BANDWIDTH_PARAMETERLa extensión del kernel se determina mediante una distancia fija o una cantidad de vecinos fija.
String
distance
(Opcional)

Especifica una extensión de ancho de banda o de distancia fija cuando el tipo de kernel es FIJO y el método de ancho de banda es BANDWIDTH_PARAMETER.

Double
number_of_neighbors
(Opcional)

Un entero que refleja la cantidad exacta de vecinos para incluir en el ancho de banda local del Kernel gaussiano cuando el tipo de kernel es ADAPTABLE y el método de ancho de banda es BANDWIDTH_PARAMETER.

Long
weight_field
(Opcional)

El campo numérico que contiene una ponderación espacial para las entidades individuales. Este campo de peso permite que algunas entidades sean más importantes que otras en el proceso de calibración del modelo. Es útil principalmente cuando el número de muestras tomadas en diferentes ubicaciones varía, los valores de las variables dependientes e independientes se promedian y los lugares con más muestras son más confiables (deben tener una mayor ponderación). Si tiene un promedio de 25 muestras diferentes para una ubicación, pero un promedio de solo 2 muestras para otra, puede utilizar el número de muestras como campo de peso para que las ubicaciones con más muestras tengan mayor influencia en la calibración del modelo que las ubicaciones con pocas muestras.

Field
coefficient_raster_workspace
(Opcional)

Una ruta de acceso completa al espacio de trabajo donde se crearán todos los rásteres de coeficiente. Cuando se proporciona este espacio de trabajo, se crean rásteres para la intercepción y para cada variable explicativa.

Folder
cell_size
(Opcional)

El tamaño de celda (un número) o la referencia al tamaño de celda (una ruta de acceso al dataset ráster) para utilizar cuando se crean los rásteres de coeficiente.

El tamaño de celda predeterminado es el más corto del ancho o la altura de la extensión especificada en el sistema de coordenadas de salida del entorno de geoprocesamiento, dividido por 250.

Analysis Cell Size
in_prediction_locations
(Opcional)

Una clase de entidad que contiene entidades que representan ubicaciones donde se deben realizar los cálculos. Cada entidad en este dataset debe incluir valores para todas las variables explicativas especificadas; la variable dependiente para estas entidades se calculará con el modelo calibrado para los datos de la clase de entidad de entrada.

Feature Layer
prediction_explanatory_field
[prediction_explanatory_field,...]
(Opcional)

Una lista de campos que representan las variables explicativas en la clase de entidad de Predicción ubicaciones. Los nombres de los campos se deben proporcionar en el mismo orden (una correspondencia de uno a uno) que los nombres enumerados para el parámetro Variables explicativas de la clase de entidad de entrada. Si no se proporcionan variables explicativas de predicción, la clase de entidad de predicción de salida solo incluirá valores de coeficiente calculados para cada ubicación de predicción.

Field
out_prediction_featureclass
(Opcional)

La clase de entidad de salida que recibirá los cálculos de la variable dependiente para cada entidad en la clase de entidad de Predicción ubicaciones.

Feature Class

Ejemplo de código

Ejemplo de GeographicallyWeightedRegression (ventana de Python)

La siguiente secuencia de comandos de la ventana de Python muestra cómo utilizar la herramienta GeographicallyWeightedRegression.

import arcpy
arcpy.env.workspace = "c:/data"
arcpy.GeographicallyWeightedRegression_stats("CallData.shp", "Calls","BUS_COUNT;RENTROCC00;NoHSDip",
                                             "CallsGWR.shp", "ADAPTIVE", "BANDWIDTH PARAMETER",
                                             "#", "25", "#","CoefRasters", "135", "PredictionPoints", 
                                             "#", "GWRCallPredictions.shp")
Ejemplo de GeographicallyWeightedRegression (secuencia de comandos de Python independiente)

La siguiente secuencia de comandos de Python independiente muestra cómo utilizar la herramienta GeographicallyWeightedRegression.

# Model 911 emergency calls using GWR

# Import system modules
import arcpy

# Set the geoprocessor object property to overwrite existing outputs
arcpy.gp.overwriteOutput = True

# Local variables...
workspace = r"C:\Data"

try:
    # Set the current workspace (to avoid having to specify the full path to the feature classes each time)
    arcpy.env.workspace = workspace

    # 911 Calls as a function of {number of businesses, number of rental units,
    # number of adults who didn't finish high school}
    # Process: Geographically Weighted Regression... 
    gwr = arcpy.GeographicallyWeightedRegression_stats("CallData.shp", "Calls", 
                        "BUS_COUNT;RENTROCC00;NoHSDip",
                        "CallsGWR.shp", "ADAPTIVE", "BANDWIDTH PARAMETER","#", "25", "#",
                        "CoefRasters", "135", "PredictionPoints", "#", "GWRCallPredictions.shp")

    # Create Spatial Weights Matrix to use with Global Moran's I tool
    # Process: Generate Spatial Weights Matrix... 
    swm = arcpy.GenerateSpatialWeightsMatrix_stats("CallsGWR.shp", "UniqID",
                        "CallData25Neighs.swm",
                        "K_NEAREST_NEIGHBORS",
                        "#", "#", "#", 25) 
                        
    # Calculate Moran's Index of Spatial Autocorrelation for 
    # OLS Residuals using a SWM File.  
    # Process: Spatial Autocorrelation (Morans I)...      
    moransI = arcpy.SpatialAutocorrelation_stats("CallsGWR.shp", "StdResid",
                        "NO_REPORT", "GET_SPATIAL_WEIGHTS_FROM_FILE", 
                        "EUCLIDEAN_DISTANCE", "NONE", "#", 
                        "CallData25Neighs.swm")

except:
    # If an error occurred when running the tool, print out the error message.
    print arcpy.GetMessages()

Entornos

Sistema de coordenadas de salida

La geometría de entidades se proyecta en el Sistema de coordenadas de salida una vez que se completa el análisis. Como consecuencia, el valor introducido para el parámetro Distancia se debe especificar con las mismas unidades que la Clase de entidad de entrada. Los valores introducidos para el Tamaño de celda de salida se deben especificar con las mismas unidades que el Sistema de coordenadas de salida.

Temas relacionados

Información sobre licencias

ArcGIS for Desktop Basic: Requiere Spatial Analyst o Geostatistical Analyst
ArcGIS for Desktop Standard: Requiere Spatial Analyst o Geostatistical Analyst
ArcGIS for Desktop Advanced: Sí
5/10/2014