Cómo se almacenan y administran los datos ráster
Estructuras de datos ráster y modelos de almacenamiento
Los datos ráster y de imagen se almacenan normalmente en su forma original. Rara vez se editan los valores de un píxel individual, como podría editar una entidad en un dataset vectorial. Con frecuencia estos datos se pueden procesar para crear nuevas formas que pueden ser procesadas al vuelo o guardadas como otra versión. Estos datasets, y las colecciones de datasets, son frecuentemente muy grandes, de modo que contar con buenas capacidades de gestión es importante y ArcGIS está diseñado para hacerlo.
Hay tres métodos para almacenar los datos ráster y de imagen: como archivos en un sistema de archivos, en una geodatabase o administrados desde la geodatabase pero almacenados en un sistema de archivos. Esta decisión también implica determinar si se almacenan todos los datos en un dataset único o en un catálogo con la posibilidad de tener muchos datasets. Si elige almacenar los datos en un sistema de archivos, entonces está eligiendo almacenar datasets ráster mientras que una geodatabase puede almacenar tanto datasets ráster como datasets de mosaico. Una tercera opción de geodatabase es el catálogo de rásters. No se describe a continuación porque ha sido reemplazada por el dataset de mosaico, que tiene muchas más capacidades, usos y funciones.
Datasets ráster
La mayoría de los datos ráster y de imágenes (tales como una ortofotografía o DEM) se proporcionan como un dataset ráster. El término dataset ráster hace referencia a cualquier modelo de datos ráster que se almacena en el disco o en una geodatabase. Es el modelo de almacenamiento de datos ráster más básico, en el que los otros datasets se construyen en datasets ráster de gestión de datasets de mosaico. También es la salida de muchas herramientas de geoprocesamiento que procesan datos ráster. A continuación se muestra un ejemplo de un dataset ráster.
Un dataset ráster es cualquier formato ráster válido organizado en una o más bandas. Cada banda está compuesta de un vector de píxeles (celdas) y cada píxel tiene un valor. Un dataset ráster tiene por lo menos una banda. ArcGIS admite más de 70 formatos de archivo diferentes para dataset ráster, incluidos TIFF, JPEG 2000, Esri Grid y MrSid.
Más información sobre los formatos de archivo de dataset ráster admitidos
Datasets de mosaico
Un dataset de mosaico es una colección de datasets ráster (imágenes) almacenada como un catálogo y visualizada o accedida como una imagen en mosaico única o como imágenes individuales (rásteres). Estos conjuntos pueden ser extremadamente grandes tanto en tamaño de archivo total como en la cantidad de datasets. Los datasets ráster en un dataset de mosaico puede permanecer en su formato nativo en el disco o en la geodatabase. Los metadatos se pueden administrar en el registro del ráster, así como los atributos de la tabla de atributos. El almacenamiento de metadatos como atributos permite administrar fácilmente los parámetros como datos de orientación de sensor, así como habilitar consultas rápidas para habilitar selecciones.
Los datos en un dataset de mosaico no tienen que estar adyacentes o superpuestos, pero pueden existir como datasets discontinuos no conectados. Por ejemplo, puede tener imágenes que cubran completamente un área o puede tener muchas tiras de imágenes que posiblemente no se unan para formar una imagen continua (como a lo largo de tuberías).
Los datos incluso pueden superponerse completa o parcialmente, pero capturarse en fechas diferentes. El dataset de mosaico es un dataset ideal para almacenar datos temporales. Puede consultar el dataset de mosaico para ver las imágenes que necesite en función de la hora o las fechas, y utilizar un método de mosaico para mostrar la imagen en mosaico de acuerdo con un atributo de hora o fecha.
Los datasets de mosaico no están limitados a un tipo determinado de datos ráster. Puede agregar datos ráster en distintas proyecciones, resoluciones, profundidades de píxel y cantidad de bandas. Se pueden generar vistas generales (como pirámides) para el conjunto completo de datos. Esto permite ver más rápidamente los datos y servir fácilmente estos datasets. También hay muchas propiedades adicionales para la vista, incluido el establecimiento de un método de creación de mosaicos, que convierten estos datasets en únicos y funcionales en muchas situaciones. También puede consultar un dataset de mosaico sobre la base de restricciones de consulta espaciales y no espaciales. Los resultados de esa consulta pueden ser un conjunto de imágenes que podrían procesarse una por una, o podría ser una imagen en mosaico generada dinámicamente.
Además de los datos ráster, puede almacenar y administrar datos LIDAR en un dataset de mosaico de la misma manera que lo hace con los datasets ráster, e incluso junto con los datasets ráster. Los datos LIDAR se pueden almacenar tanto en el sistema de archivos como en archivos LAS o datasets LAS, o en una geodatabase como un dataset de terreno.
Los datasets de mosaico están en versiones. La siguiente tabla describe su compatibilidad entre versiones:
Cliente | 10.0 dataset de mosaico | 10.1 dataset de mosaico |
---|---|---|
10.0 | Completo (leer/modificar/crear) | No compatible |
10.1 | Sólo lectura | Completo (leer/modificar/crear) |
Comparación de modelos de almacenamiento de datos ráster
Almacenar los datasets ráster individualmente suele ser el mejor método cuando los datasets no son adyacentes entre sí o se utilizan raramente en los mismos proyectos. La creación de mosaicos con las entradas para formar un gran extensión única de datos ráster es adecuada para muchas aplicaciones, pero es posible que se desee un dataset de mosaico por cualquiera de estas razones:
- La extensión de los datasets ráster se superpone parcial o totalmente y se desea conservar las áreas comunes.
- Los datasets ráster representan una colección de observaciones de la misma área en diferentes momentos de una serie temporal.
- No se necesita ver el área completa a la vez; sin embargo, si necesita ver el área completa, utilice un dataset de mosaico.
- Desea administrar una colección de imágenes como un conjunto integrado, pero mantener sus estados individuales.
- Desea registrar y administrar columnas de atributos adicionales que describen cada imagen.
Dataset ráster | dataset de mosaico | |
---|---|---|
Descripción |
Una imagen única de un objeto o una imagen sin fisuras que cubre un área espacialmente continua. Puede ser una imagen original única o el resultado de muchas imágenes anexadas (en mosaico) entre sí. |
Una colección de datasets ráster almacenada como un catálogo que permite almacenar, administrar, ver y consultar colecciones de ráster y datos LIDAR. Se ve como una imagen en mosaico, pero se tiene acceso a cada dataset en la colección. |
Almacenamiento | Como un archivo en el disco o en una geodatabase. | En una geodatabase, pero puede tener una referencia almacenada como un archivo en el disco. |
Capas de mapa |
Una capa de mapa. |
Una capa de mapa. |
Datos homogéneos o heterogéneos |
Datos homogéneos: un único formato, tipo de datos y archivo. |
Datos heterogéneos: varios formatos, tipos de datos, tamaños de archivo y sistemas de coordenadas. |
Metadatos |
Se almacenan una vez y se aplican al dataset completo. |
Se puede almacenar dentro del registro ráster y como atributos en la tabla de atributos. |
Datasets submuestreados |
Una pirámide única en el dataset ráster completo. |
Pirámides para cada dataset ráster, así como vistas generales (como una pirámide) para el conjunto completo. |
Geoprocesamiento y análisis de la imagen |
|
|
Ventajas |
|
|
Desventajas |
Los datasets ráster de geodatabases personales y de archivos son más lentos de actualizar porque hay que reescribir el archivo completo. |
Las vistas generales pueden tardar tiempo en generarse. |
Servicio |
Se puede servir directamente como un servicio de imágenes. |
Se puede servir directamente como un servicio de imágenes. |
Recomendaciones |
Utilice datasets ráster cuando no sea necesario conservar la superposición entre imágenes en mosaico, y para la visualización rápida de grandes cantidades de datos ráster. |
Utilice un dataset de mosaico para administrar y visualizar datos LIDAR y ráster. Bueno para datos multidimensionales, consulta, almacenamiento de metadatos y superposición de datos, y proporciona una buena solución híbrida. |
Almacenamiento de datos ráster en la geodatabase
Almacene los datos ráster en la geodatabase cuando desee administrar los rásteres, agregar comportamiento y controlar el esquema; cuando desee administrar un conjunto bien definido de datasets ráster como parte del DBMS; y cuando necesite una arquitectura de datos para administrar todo el contenido. Hay tres tipos principales de geodatabases: corporativos, personales y de archivos.
La geodatabase corporativa utiliza ArcSDE y puede admitir varias operaciones en su DBMS. Las geodatabases de archivos (como las geodatabases personales) están diseñadas para ser editadas por un único usuario y no admiten el versionado. Residen en el directorio del sistema de archivos, así que no necesitan contraseña para el acceso. Las geodatabases de archivos y las geodatabases corporativas comparten el mismo esquema de almacenamiento básico.
El comportamiento funcional de cada geodatabase es básicamente el mismo; no obstante, al algunas excepciones para herramientas o procedimientos específicos. Para obtener información sobre las diferencias en el comportamiento de una herramienta o procedimiento, consulte la herramienta o el procedimiento específico con este sistema de ayuda.
Característica de almacenamiento de ráster |
Geodatabase de archivos |
Geodatabase corporativa |
Geodatabase personal |
---|---|---|---|
Límite de tamaño |
1 TB para cada dataset ráster |
Sin límite; el límite depende de los límites del DBMS |
2 gigabytes (GB) por geodatabase (éste es un límite de tamaño de tabla, no un límite de tamaño de dataset ráster) |
Formato de archivo de dataset ráster |
Dataset ráster de geodatabase de archivos |
Dataset ráster de ArcSDE |
ERDAS IMAGINE, JPEG o JPEG 2000 |
Almacenamiento |
|
|
|
Se almacena en el sistema de archivos |
Se almacena en un RDBMS |
Se almacena en Microsoft Access |
|
Compresión |
LZ77, JPEG, JPEG 2000 o ninguna |
LZ77, JPEG, JPEG 2000 o ninguna |
LZ77, JPEG, JPEG 2000 o ninguna |
Pirámides |
Admite la piramidación parcial |
Admite la piramidación parcial |
Regenera la pirámide completa |
Realizar mosaicos |
Permite anexar a un dataset ráster al disponer en mosaico |
Permite anexar a un dataset ráster al disponer en mosaico |
Reescribe un nuevo dataset cada vez que se dispone en mosaico a un dataset ráster |
Actualización |
Permite la actualización incremental |
Permite la actualización incremental | |
Cantidad de usuarios |
Un único usuario y grupos de trabajo pequeños; algunos lectores y un escritor |
Multiusuario; muchos usuarios y muchos escritores |
Un único usuario y grupos de trabajo pequeños; algunos lectores y un escritor |
Geodatabase de archivos
El modelo de almacenamiento de las geodatabases de archivos es un híbrido entre la geodatabase corporativa y la geodatabase personal, donde los datos ráster administrados siguen el modelo de almacenamiento de la geodatabase corporativa y los datos de ráster no administrados siguen el modelo de almacenamiento de la geodatabase personal. Las geodatabases de archivos también se asemejan a las personales, porque están diseñadas para ser editadas por un solo usuario y no son compatibles con el control de versiones. Residen en el directorio del sistema de archivos, así que no necesitan contraseña para el acceso. Las geodatabases de archivos y las geodatabases corporativas comparten el mismo esquema de almacenamiento básico.
Una geodatabase de archivos tiene varias ventajas sobre el uso de una geodatabase personal. Al igual que la geodatabase corporativa, la geodatabase de archivos almacena datos en bloques. Esto proporciona un acceso más eficaz a los datos, especialmente durante la operación de mosaico. Al crear un mosaico de datos en una geodatabase de archivos, solo se actualizan los bloques superpuestos. Si no existe un bloque superpuesto, se inserta un bloque nuevo. Los bloques parciales se rellenan con píxeles NoData. Además, el modelo de almacenamiento de la geodatabase de archivos (y corporativa) emplea actualizaciones de pirámide parciales, lo que ahorra tiempo. También las estructuras de los datos de las geodatabases de archivos y las corporativas son las mismas, lo que permite utilizar tecnología de copiado rápido para copiar y pegar los datos entre la geodatabase de archivos y la corporativa.
La geodatabase de archivos también acepta las palabras clave de configuración, pero a diferencia de la geodatabase corporativa, las palabras clave de configuración tienen un valor estándar predefinido. Para obtener más información sobre las palabras clave de configuración, vea Palabras clave de configuración para geodatabases de archivos.
Geodatabase corporativa
Cuando se almacenan los datos ráster en la geodatabase corporativa, es posible ofrecer un nivel de funcionalidad corporativo, como seguridad, acceso multiusuario y uso compartido de datos. Las siguientes son las tres razones principales para almacenar los datos ráster como una geodatabase corporativa:
- No se actualizarán con mucha regularidad (por ejemplo, cada dos o tres años o más).
- Se accederá a ellos en casos de uso de solo lectura (por ejemplo, utilizándolos como datos de mapa base bajo datos vectoriales).
- Cientos de usuarios (o más) tendrán acceso a ellos como un mapa base.
Debido a su estructura de almacenamiento, se dice que los datos ráster son administrados, o totalmente controlados, por la geodatabase. Las geodatabases corporativas almacenan siempre toda la información del ráster (píxeles, referencia espacial, cualquier tabla asociada y otros metadatos) para los datasets ráster y los atributos de ráster en la base de datos relacional asociada. Esto significa que toda la información de ráster de entrada se carga en la base de datos y se puede considerar una conversión de formato.
La geodatabase corporativa divide uniformemente las bandas en bloques de píxeles según una dimensión definida por el usuario (el valor predeterminado es 128 por 128). Ordenar en teselas los datos de bandas de ráster permite un almacenamiento y una recuperación eficaces de los datos ráster. La información de la pirámide se almacena según una resolución en descenso. El número de niveles especificado por la aplicación o el usuario determina la altura de la pirámide.
La tabla de bloques de ráster (la tabla más grande y la que almacena la información real de píxel y las pirámides) almacena una fila por bloque (tesela) por banda en un dataset ráster y por nivel de pirámide. Por ejemplo, un ráster de tres bandas dividido en 12 bloques sin pirámides generadas tendrá 36 filas en la tabla BLK: 12 bloques independientes para cada una de las bandas. La columna que contiene los datos de píxel del bloque es un objeto binario grande (BLOB).
DBMS | Modelo de almacenamiento de datos | |
---|---|---|
DB2 | ||
Informix | ||
Oracle | ||
PostgreSQL | ||
SQL Server |
Geodatabase personal
En una geodatabase personal, el dataset ráster se convierte en un archivo IMAGINE (.img) y se almacena dentro de una carpeta de base de datos de imágenes (IDB). La carpeta IDB se encuentra en el directorio situado junto a la geodatabase personal. Al eliminar un dataset ráster, el ráster de la carpeta IDB se elimina de forma permanente.
Cuando se almacena un dataset de mosaico en una geodatabase personal, el dataset de mosaico es una tabla que apunta a los datasets ráster almacenados que contiene. En un dataset de mosaico, los datasets ráster se almacenan como no administrados; por lo tanto, contiene la ubicación de ruta donde están almacenados los datasets ráster. Cada fila en la tabla de negocios apunta al dataset ráster almacenado. Las operaciones en un dataset de mosaico no afectan a los archivos ráster almacenados; por lo tanto, si elimina los datasets ráster en un dataset de mosaico, sólo se eliminan del dataset de mosaico y no del disco.
Al almacenar un dataset ráster como un atributo, el ráster se almacena como un archivo IMG en la ubicación definida por el sistema o tal cual en el sistema de archivos; esto depende de si está administrado o no.
Compresión, pirámides y tamaño de tesela
Hay otras estructuras de almacenamiento a considerar al almacenar y administrar datos ráster, como la compresión, los datasets submuestreados (pirámides y vistas generales) y el tamaño de tesela.
Compresión
Hay dos tipos de compresión: sin pérdida de información y con pérdida de información. Una compresión sin pérdida de información significa que los valores de píxeles del dataset ráster no se modifican, mientras que la compresión con pérdida de información produce valores de píxel alterados. La cantidad de compresión depende del tipo de datos de píxel; cuanto más homogénea sea la imagen, más alta será la tasa de compresión. Debería almacenar los datos que se vayan a utilizar para el análisis, no solo para mostrar, mediante una compresión sin pérdida de información. La principal ventaja de comprimir los datos es que se necesita menos espacio de almacenamiento; la cantidad de ahorro depende del método de compresión y la redundancia de los datos. Una ventaja adicional es la impresionante mejora de rendimiento debido a la transferencia de menos paquetes de datos. Por ejemplo, cuando se accede a datos ráster a través de una red con ancho de banda bajo, el uso de compresión puede ofrecer un rendimiento mejorado porque la cantidad de información que se va a transferir se reduce considerablemente, lo que permite almacenar datasets ráster grandes, sin interrupciones, y proporcionarlos rápidamente a un cliente para su visualización.
Más información acerca de la compresión ráster
Los datasets de mosaico también tienen compresión. No se usa para el almacenamiento del dataset ráster que se va a administrar sino para la compresión que se aplica a la imagen que genera cuando se visualiza. Esto también es útil cuando se accede a los datos a través de la red al reducir el tamaño de archivo que se transfiere.
Más información sobre la propiedad Método de compresión permitido
Datasets submuestreados
Los datasets submuestreados son rásteres creados a partir de los datos originales para datasets ráster o datasets de mosaico. Se generan para mejorar la velocidad de visualización y el rendimiento. Cuando se crean para los datasets ráster, se denominan pirámides, y cuando se crean para los datasets de mosaico, se denominan vistas generales.
Pirámides | Vistas generales | |
---|---|---|
Se crean para | Datasets ráster | Datasets de mosaico |
Formato | Escribe archivos .ovr, con algunas excepciones. Lee pirámides almacenadas externamente como .ovr o .rrd, o almacenadas internamente. | Escribe archivos .tif. |
Almacenamiento | En un único archivo que generalmente se encuentra junto al dataset ráster de origen utilizando el mismo nombre. | En forma predeterminada, en una carpeta junto a la geodatabase con una extensión *.overviews, o internamente para ArcSDE. La ubicación de almacenamiento se puede personalizar. |
Tamaño de almacenamiento | 2 a 10% (en comparación con los datasets ráster originales) | |
Factor de submuestreo | 2 | 3 |
extensión |
|
|
Opciones para la creación |
|
|
Más información acerca de las pirámides ráster
Más información sobre las vistas generales del dataset de mosaico
Tamaño de tesela
En una geodatabase corporativa, los datos ráster se almacenan en una estructura donde son divididos en teselas, indexados, estructurados en pirámides y muy frecuentemente comprimidos. Debido al ordenamiento en teselas, la indización y la piramidación, cada vez que se consultan los datos ráster, solo se devuelven las teselas necesarias para satisfacer la extensión y resolución de la consulta, en lugar de todo el dataset. El tamaño de tesela controla el número de píxeles que desea almacenar en cada bloque de memoria de base de datos. Se especifica como un número de píxeles en X e Y. El tamaño de tesela predeterminado es 128 por 128 píxeles y la mayoría de las aplicaciones no garantiza la desviación de estos valores predeterminados. En una geodatabase corporativa, las teselas de datos ráster se comprimen antes de su almacenamiento en la geodatabase.