Formato de cuadrícula de Esri
Una cuadrícula es un formato de almacenamiento de datos ráster nativo de Esri. Hay dos tipos de cuadrículas: entero y punto flotante. Utilice cuadrículas de enteros para representar datos discretos y cuadrículas de punto flotante para representar datos continuos.
Más información acerca de los datos discretos y continuos
Los atributos para una cuadrícula de enteros se almacenan en una tabla de atributos de valores (VAT). Una tabla de valores de atributos tiene un registro para cada valor único en la cuadrícula. El registro almacena el valor único (VALOR es un entero que representa una clase particular o grupo de celdas) y el número de celdas (CANTIDAD) en la cuadrícula representado por ese valor. Por ejemplo, si 50 celdas tienen un valor de 1 que representa un bosque, la tabla de valores de atributos mostraría un VALOR = 1 y CANTIDAD = 50 para cada una de las 50 celdas.
Más información sobre las tablas de atributos de dataset ráster
Las cuadrículas de punto flotante no tienen una tabla de valores de atributos porque las celdas en la cuadrícula pueden asumir cualquier valor dentro de un rango de valores determinado. Las celdas en este tipo de cuadrícula no pertenecen a categorías discretas. El valor de celda es el atributo que describe la ubicación. Por ejemplo, en una cuadrícula que representa datos de elevación en metros sobre el nivel del mar, una celda con un valor de 10.1662 indica que la ubicación es aproximadamente a 10 metros sobre el nivel del mar.
El rango de valores de datos que se puede almacenar como valores de la cuadrícula es el siguiente:
- Las cuadrículas de punto flotante pueden almacenar valores de -3,4. x 1038 a 3,4 x 1038.
- Las cuadrículas de enteros pueden almacenar valores de -2147483648 a 2147483647 (-231 a 231-1).
Para las cuadrículas de enteros, esta información se aplica solamente al elemento VALOR. Una cuadrícula de enteros puede tener otros elementos de INFO agregados a la tabla de valores de atributos cuyo rango de valores depende de la definición del elemento.
El sistema de coordenadas de una cuadrícula es el mismo que el de los otros datos geográficos. Las filas y columnas son paralelas a los ejes x e y del sistema de coordenadas. Ya que cada celda dentro de una cuadrícula tiene la misma dimensión que las otras celdas, la ubicación y el área cubierta por cualquier celda se determina fácilmente por su fila y columna. El sistema de coordenadas de una cuadrícula se define por el tamaño de celda, el número de filas y columnas, y las coordenadas x,y de la esquina superior izquierda. Las cuadrículas también tienen información adicional, como el sistema de coordenadas asociado con la cuadrícula.
Al igual que con la mayoría de los formatos, una cuadrícula no debe tener espacios o cualquier otro carácter especial en el nombre. Una cuadrícula de múltiple banda no puede tener más de 9 caracteres en el nombre de archivo, y un dataset ráster de banda única no puede tener más de 13 caracteres.
Estructura de datos de cuadrícula
Las cuadrículas se implementan mediante una estructura de datos ráster en tesela en la que la unidad básica de almacenamiento de datos es un bloque rectangular de celdas. Los bloques se almacenan en disco en forma comprimida en una estructura de archivo de longitud variable que se denomina tesela. Cada bloque se almacena como un registro de longitud variable.
El tamaño de la tesela para una cuadrícula se basa en el número de filas y columnas en la cuadrícula al momento de la creación. El límite superior en el tamaño de una tesela se establece por la aplicación y es muy grande (actualmente se establece en 4.000.000 x 4.000.000 celdas). Como resultado, la mayoría de las cuadrículas que se utilizan para aplicaciones SIG se almacenan automáticamente en una sola tesela. Los datos espaciales para una cuadrícula se dividen automáticamente en múltiples teselas si el tamaño de la cuadrícula al momento de la creación es más grande que el límite superior para el tamaño de una tesela.
La organización de almacenamiento bloqueada para las cuadrículas admite el acceso espacial secuencial y aleatorio a datasets ráster grandes. La estructura de bloqueo no impone restricciones en el análisis conjunto de cuadrículas. Las teselas y bloques de distintas cuadrículas tampoco deben coincidir en el espacio de mapa para el análisis conjunto. La estructura de tesela y bloque de una cuadrícula se oculta por completo para el usuario, que siempre crea y manipula una cuadrícula como si fuera un ráster sin interrupciones de celdas uniformemente cuadradas.
Las cuadrículas utilizan un esquema de compresión ráster de longitud de pista que es adaptable en el nivel de bloque. Cada bloque se prueba para determinar la profundidad (bits por celda) a utilizar para el bloque y para determinar qué técnica de almacenamiento (celda por celda o longitud de pista codificada) es más eficiente. El bloque se almacena en el formato que requiere menos espacio en disco. El esquema de compresión adaptable es la opción óptima debido a su capacidad para representar de manera efectiva los datos categóricos homogéneos y los datos continuos heterogéneos mientras admite el análisis conjunto con los dos tipos de datos. Las operaciones por celda de una sola capa, como la reclasificación de datos, operan directamente en las ejecuciones de datos sin descompresión. Las operaciones por celda multicapa en las capas de entrada comprimidas intersecan ejecuciones de datos de distintas capas y operan en las ejecuciones intersecadas. Las operaciones por vecindad de una sola capa y las operaciones por celda multicapa que mezclan datos comprimidos y no comprimidos expanden ejecuciones en celdas y realizan el procesamiento tradicional celda por celda de manera transparente.
La estructura de tesela-bloque de una cuadrícula también es transparente para cualquier programa de aplicación que obtiene acceso a los datos espaciales en una cuadrícula. Los programas que manipulan las cuadrículas obtienen acceso a los datos espaciales al establecer una ventana rectangular definida en las coordenadas del mapa.
Almacenamiento de datos de una cuadrícula
Una cuadrícula se almacena en un espacio de trabajo de ArcInfo. La cuadrícula, al igual que la cobertura, se almacena como un directorio separado con tablas y archivos asociados que contienen información específica sobre la cuadrícula. En un directorio de cuadrícula de enteros (originalmente creado por ArcInfo Workstation), se encuentran las siguientes tablas y archivos: la tabla BND, que almacena el límite de la cuadrícula; el archivo HDR, que almacena información específica que describe la cuadrícula, por ejemplo, la resolución de la celda y el factor de bloqueo; la tabla STA, que contiene estadísticas para la cuadrícula; la tabla de valores de atributos, que almacena los datos de atributo asociados con las zonas de la cuadrícula; el archivo de registro (LOG), que controla la actividad que ocurrió en la cuadrícula; y el archivo de tesela w001001.adf (q0x1y1), que almacena los datos de la celda y el archivo de índice que lo acompaña w001001x.adf (q0x1y1x) que indexa los bloques en la tesela y el REGISTRO. (Algunos de estos, como el archivo de registro, pueden no existir si se crearon con operadores de ArcGIS).
Si se altera una cuadrícula, los valores y la información que contienen los archivos y las tablas se actualizan de inmediato. El usuario puede obtener acceso a la información que contiene la tabla INFO, que incluye información sobre la cuadrícula.
Tabla BND
Un BND de cuadrícula contiene el límite de la cuadrícula. El límite es un rectángulo que abarca las celdas de una cuadrícula; se almacena en las coordenadas del mapa. Todos los BND de cuadrícula se almacenan en doble precisión.
Las coordenadas mínimas en la tabla BND son para la esquina inferior izquierda de la celda inferior izquierda en la cuadrícula. Las coordenadas máximas son para la esquina superior derecha de la celda superior derecha en la cuadrícula.
Archivo HDR
El HDR es una archivo binario. La información almacenada en el archivo incluye el tamaño de la celda, el tipo de cuadrícula (entero o punto flotante), la técnica de compresión, el factor de bloqueo y la información de tesela.
Tabla STA
La tabla STA es una tabla INFO que contiene datos estadísticos sobre una cuadrícula. El valor mínimo, máximo, medio y de desviación estándar para la cuadrícula se almacenan como valores de punto flotante en la tabla STA. No debe intentar alterar estos valores directamente.
Debido a que NoData representa un valor desconocido, NoData no se utiliza al calcular las estadísticas en la tabla STA.
Cuando se crea una cuadrícula de dos niveles (que contiene solamente los valores 0 y 1), la tabla STA contiene el valor 0 para el valor medio y -1 para la desviación estándar. El valor de desviación estándar -1 indica que no se calcularon las estadísticas para una cuadrícula.
Un valor de desviación estándar de -2 indica que la cuadrícula contiene solamente celdas NoData.
Tabla VAT
La tabla de valores de atributos es una tabla INFO que almacena atributos asociados con las zonas de una cuadrícula. Solo las cuadrículas de enteros tienen una tabla de valores de atributos asociada. Cada tabla de valores de atributos tiene al menos dos elementos, VALOR y CANTIDAD. El elemento VALOR contiene valores enteros que se pueden utilizar para distinguir las características de una ubicación de las otras ubicaciones en una cuadrícula. Todas las celdas que tienen asignado el mismo valor contienen las mismas características y, por lo tanto, pertenecen a la misma zona. CANTIDAD es el número de celdas en una zona.
Se pueden agregar nuevos elementos a la tabla de valores de atributos. Los elementos VALOR y CANTIDAD no se deben cambiar y la tabla de valores de atributos se debe mantener ordenada en el elemento VALOR. Nunca agregue nuevos elementos antes de VALOR o CANTIDAD.
Las celdas que contienen NoData no se representan en la tabla de valores de atributos.
A continuación, le mostramos un ejemplo de tabla de valores de atributos:
Record VALUE COUNT 1 0 628872 2 1 265043 3 2 151150 4 3 3185652 5 4 79983 6 5 4782 7 6 74334 8 7 8877 9 8 1817 10 9 491 11 10 858 12 11 8770 13 12 28789 14 13 72539 15 14 3686 16 15 3932 17 16 13227 18 17 1890 19 18 1305 20 19 427286 21 20 6695
Archivos de teselas
Los archivos w001001.adf (q0x1y1) y w001001x.adf (q0x1y1x) almacenan los datos y el índice para la primera tesela, o la tesela base, en una cuadrícula. El límite superior en el tamaño de una tesela es muy grande, y la mayoría de las cuadrículas se almacenan con una sola tesela. Si se utilizan teselas adicionales, se enumeran automáticamente basado en la relación espacial con la primera tesela. Las teselas se implementan como archivos binarios de longitud variable. Con versiones anteriores a ARC/INFO 7.x, estos archivos se denominaban q0x1y1 y q0x1y1x y todavía funcionan con el software actual.
Archivo de REGISTRO
El archivo de REGISTRO es un archivo ASCII que contiene información sobre la creación y las alteraciones de una cuadrícula. El REGISTRO controla las acciones que se realizan en la cuadrícula, pero no contiene cada acción que se realiza con la cuadrícula. Ya que todas las funciones de cuadrícula dan como resultado una nueva cuadrícula, solo los comandos de cuadrícula, como CAMBIAR NOMBRE y COPIAR, pueden alterar una cuadrícula existente y se pueden introducir en el archivo de REGISTRO. Se puede obtener acceso al archivo de REGISTRO, como a todos los archivos ASCII, a través de los comandos del sistema o de cualquier editor de texto.
Limitaciones de almacenamiento
El nombre de una cuadrícula se limita de la siguiente manera:
- No se puede almacenar usando espacios.
- No puede comenzar con un número.
- No puede ser más largo que 13 caracteres (a una cuadrícula multibanda se le permiten hasta 9 caracteres).
Existe un límite en el número de archivos que se pueden almacenar en un directorio INFO para ambas coberturas y cuadrículas. Este total es aproximadamente de 10.000. Por lo tanto, esto limita el número de cuadrículas que puede almacenar en un espacio de trabajo. Por ejemplo, lo siguiente menciona el número máximo teórico de datasets de cuadrícula que se pueden almacenar en un solo directorio de espacio de trabajo:
- Menos de 5.000 cuadrículas de punto flotante o
- Menos de 3.333 cuadrículas de enteros, con VAT (menos de 5.000 si no hay VAT), o
- Menos de 10.000 pilas de cuadrícula
Los números anteriores son máximos teóricos. Si tiene un proceso que creará cuadrículas interinas (y por lo tanto los archivos del directorio INFO), estos números serán menos. Adicionalmente, si está almacenando una mezcla de archivos, como cuadrículas y coberturas, su almacenamiento será menor.
Estos números se relacionan con el número de archivos en la carpeta de cuadrícula que almacena información en el directorio de INFO. El límite es 10.000 (9.999), pero no es el número total de archivos en un directorio de INFO, es el número de archivos que apuntan a los archivos en el directorio de INFO. Para cada cuadrícula, hay dos archivos en la carpeta que apunta a los archivos en la carpeta INFO: los archivos BND (límite) y los archivos de la tabla STA (estadísticas) (9999/2≈5000). Cuando una cuadrícula tiene un VAT, esto también indica a los archivos en el directorio de INFO, de manera que el número que se almacena se reduce nuevamente (9999/3≈3333). Una pila de cuadrícula solo tiene un archivo sencillo que se indica en el directorio INFO (9999/1≈9999).
Apilar
Una pila consiste de un conjunto ordenado de cuadrículas superpuestas espacialmente (capas), que se trata como una entidad simple para el análisis multivariado. El análisis cluster, la clasificación y el análisis de componente principal trabajan en las capas en una pila.
Una pila tiene las siguientes características:
- Un conjunto de capas en la que cada capa corresponde a una cuadrícula
- Una extensión de mapa, o BND
- Un tamaño de celda
- Un tipo de datos
- Una proyección
Cada capa especificada en una pila tiene un número de índice que indica el orden en la pila. Las cuadrículas que componen una pila deben estar en el mismo espacio de trabajo.
Los límites de las capas de entrada se pueden superponer exactamente, parcialmente o no superponer en absoluto; sin embargo, solo el área donde se superponen las capas compone la pila. El BND de la pila es donde se intersecan los límites de las capas. Los cálculos de una función de análisis multivariado ocurren en el área superpuesta. Si no hay un área común entre las capas de entrada, la pila está vacía y no se producen cálculos.
El tamaño de celda de una pila toma como valor predeterminado la capa más gruesa en la pila.
Puede combinar cualquier cantidad de tipos de datos (reales o enteros) de las cuadrículas de entrada en una pila. Sin embargo, antes de aplicar una técnica multivariada, debe tener en cuenta qué representan los valores, si datos categóricos o continuos, y el rango o rango relativo de los valores. En ciertos análisis, el tipo de datos de entrada de la pila determina el tipo de datos de la salida.
La información de la proyección asociada con las cuadrículas de entrada se almacena con la pila. Debido a que una pila se trata como una entidad simple, todas las cuadrículas en una pila deben estar en la misma proyección. La información de la proyección se utiliza para garantizar que cada cuadrícula de la pila ocupa la misma área geográfica.
Almacenar una pila de cuadrícula
Se almacena una pila en una estructura de directorio similar a una cuadrícula o cobertura. Hay dos archivos en el directorio de la pila: una tabla INFO STK externa y un archivo ASCII PRJ. Las cuadrículas reales que componen la pila no se almacenan en la pila. Son cuadrículas comunes en el espacio de trabajo. Eso significa que cualquier cuadrícula se puede utilizar en más de una pila. La tabla STK almacena los nombres de las cuadrículas que componen la pila y los valores de índice correspondientes:
GRID: LIST JER135.STK Record INDEX GRID 1 1 jer1 2 2 jer3 3 3 jer5
El elemento ÍNDICE proporciona la posición de una cuadrícula en la pila, mientras que el elemento CUADRÍCULA enumera los nombres de la cuadrícula que componen la pila. Los datos espaciales de las cuadrículas de entrada no se duplican en la pila. Como resultado, la pila siempre refleja la última versión de las cuadrículas de entrada. Se puede obtener acceso al archivo STK como a cualquier otro archivo INFO. Puede agregar elementos con fines descriptivos, como un elemento para almacenar la fecha en la que se recolectaron los datos, pero no utilice INFO para alterar los valores en el elemento ÍNDICE o los nombres en el elemento CUADRÍCULA. Todas las manipulaciones de estos elementos se deben realizar solamente con una variedad de comandos de administración de pila disponibles en la Cuadrícula.
El archivo PRJ, cuando está presente, almacena la información de la proyección de la pila:
Projection STATEPLANE Zone 4701 Datum NAD27 Zunits NO Units FEET Spheroid CLARKE1866 Xshift 0.0000000000 Yshift 0.0000000000 Parameters
Si la proyección es desconocida para todas las cuadrículas de entrada en la pila, no se crea ningún archivo PRJ.
El nombre de una pila de cuadrícula no se puede almacenar con espacios, no puede comenzar con un número y no puede tener más de 9 caracteres.
NoData en una cuadricula
Cada celda en una cuadrícula tiene un valor asignado; sin embargo, a las celdas sin valores reales se les puede asignar NoData en la cuadrícula que represente ese tema. NoData y 0 (cero) no son los mismos; 0 es un valor válido. Por esta razón, las celdas NoData no se pueden utilizar en el cálculo de las estadísticas en la tabla STA de una cuadrícula.