¿Cómo funciona la Clasificación de máxima verosimilitud?
El algoritmo que utiliza la herramienta Clasificación de máxima verosimilitud se basa en dos principios:
- Las celdas en cada muestra de clases del espacio multidimensional que se distribuyen normalmente
- El teorema de Bayes de toma de decisiones
La herramienta tiene en cuenta las varianzas y covarianzas de las firmas de clases cuando asigna cada celda a una de las clases representadas en el archivo de firma. Si se asume que la distribución de una muestra de clases es normal, una clase puede estar caracterizada por el vector del valor medio y la matriz de covarianza. Dadas estas dos características para cada valor de celda, se calcula la probabilidad estadística para cada clase a fin de determinar la pertenencia de las celdas a la clase. Cuando se especifica la opción Ponderación de la probabilidad a priori EQUAL, cada celda se asigna a la clase a la que tiene mayor probabilidad de pertenecer como miembro.
Si la probabilidad de ocurrencia de algunas clases es mayor (o menor) que el promedio, se debe usar la opción FILE a priori con un Archivo de probabilidades a priori de entrada. Los pesos de las clases con probabilidades especiales se especifican en el archivo a priori. En este caso, un archivo a priori ayuda a asignar las celdas que se superponen estadísticamente entre dos clases. Estas celdas se asignan con mayor exactitud a la clase adecuada, dando como resultado una mejor clasificación. Este enfoque de ponderación para la clasificación se conoce como el clasificador bayesiano.
Al elegir la opción SAMPLE a priori, las probabilidades a priori asignadas a todas las muestras de clases en el archivo de firma de entrada son proporcionales a la cantidad de celdas capturadas en cada firma. Por consiguiente, las clases que tienen menos celdas que el promedio en la muestra reciben pesos menores que el promedio, y las que tienen más celdas reciben pesos mayores que el promedio. Como resultado, las clases respectivas tienen más o menos celdas asignadas.
Cuando se realiza una clasificación de máxima verosimilitud, también se puede producir un ráster de confianza de salida opcional. Este ráster muestra los niveles de confianza de la clasificación. La cantidad de niveles de confianza es 14, que se relaciona directamente con la cantidad de valores de fracción de rechazo válidos. El primer nivel de confianza, codificado en el ráster de confianza como 1, comprende celdas con la menor distancia hasta cualquier vector de valor medio almacenado en el archivo de firma de entrada; por lo tanto, la clasificación de estas celdas tiene una mayor certeza. Las celdas que constituyen el segundo nivel de confianza (valor de celda 2 en el ráster de confianza) se clasificarán sólo si la fracción de rechazo es 0,99 o menor. El nivel de confianza más bajo tiene un valor de 14 en el ráster de confianza, y muestra las celdas que posiblemente estén mal clasificadas. Las celdas de este nivel no se clasificarán cuando la fracción de rechazo sea 0,005 o mayor.
Ejemplo
El siguiente ejemplo muestra la clasificación de un ráster multibanda con tres bandas en cinco clases. Las cinco clases incluyen lecho seco, forestal, lago, residencial/bosquecillo y pradera. También se producirá un ráster de confianza de salida. Las bandas del ráster de entrada se muestran a continuación.
La herramienta Clasificación de máxima verosimilitud se utiliza para clasificar el ráster en cinco clases.
- Configuraciones que se utilizan en el cuadro de diálogo de la herramienta Clasificación de máxima verosimilitud:
Bandas del ráster de entrada: redlands
Archivo de firma de entrada: wedit.gsg
Ráster multibanda de salida: mlclass_1
Fracción de rechazo: 0.01
Ponderación de la probabilidad a priori: EQUAL
Archivo de probabilidades a priori de entrada: apriori_file_1
Ráster de confianza de salida: reject_ras
El ráster clasificado aparece como se muestra a continuación:
Las áreas que se muestran en color rojo son las celdas que tienen una probabilidad menor al 1 por ciento de tener una clasificación correcta. A estas celdas se les otorga un valor de NoData debido a la fracción de rechazo de 0,01 utilizada. La clase de lecho seco se muestra en blanco, con la clase forestal en verde, la clase de lago en azul, la clase residencial/bosquecillo en amarillo y la clase de pradera en naranja.
La lista que se muestra a continuación es la tabla de atributos de valores para el ráster de confianza de salida. Muestra la cantidad de celdas clasificadas y la cantidad de confianza con la que se clasificaron. El valor 1 tiene una probabilidad del 100 por ciento de ser correcto. Hay 3.033 celdas que se clasificaron con ese nivel de confianza. El valor 5 tiene una probabilidad del 95 por ciento de ser correcto. Habían 10.701 celdas que tenían una probabilidad del 0,005 por ciento de ser correctas con un valor de 14.
RECORD VALUE COUNT 1 1 3033 2 2 3061 3 3 9187 4 4 16717 5 5 37361 6 6 136420 7 7 269592 8 8 250863 9 9 105001 10 10 23598 11 11 11190 12 12 11546 13 13 3621 14 14 10701