Fonctionnement de l'outil Statistiques de groupe de canaux
L'outil Statistiques de groupe de canaux fournit des statistiques pour l'analyse multivariée d'un ensemble de canaux raster. Lors de l'utilisation de l'option Calculer les matrices de covariance et de corrélation, les matrices de corrélation et de covariance sont en sortie ainsi que les paramètres des statistiques basiques (tels que les valeurs pour les écarts type, minimum, maximum et moyen pour chaque couche).
La matrice de covariance contient des valeurs de variance et de covariance. La variance est une mesure statistique indiquant le degré de variance par rapport à la moyenne. Pour calculer ces variances, les carrés des différences entre chaque valeur de cellule et la valeur moyenne de toutes les cellules font l'objet d'une moyenne. Les variances de chaque couche peuvent être lues le long de la diagonale de la matrice de covariance allant de l'angle supérieur gauche à l'angle inférieur droit. Les variances sont exprimées en unités de valeur de cellule au carré.
Les entrées restantes dans la matrice de covariance sont les covariances entre toutes les paires des rasters en entrée. La formule suivante permet de déterminer la covariance entre les couches i et j :
où :
Z : valeur d'une cellule
i, j : couches d'une pile
µ : moyenne d'une couche
N : nombre de cellules
k : représente une cellule particulière
La covariance de deux couches est l'intersection de la colonne et de la ligne appropriées. La covariance entre les couches 2 et 3 est la même que celle entre les couches 3 et 2. Les valeurs de la matrice de covariance sont dépendantes sur les unités de valeur, alors que celles de la matrice de corrélation ne le sont pas.
La matrice de corrélation affiche les valeurs des coefficients de corrélation qui représentent la relation entre deux jeux de données. Dans le cas d'un ensemble de couches de raster, la matrice de corrélation présente les valeurs de cellule d'une couche de raster car elles sont liées aux valeurs de cellule d'une autre couche. La corrélation entre deux couches est une mesure de dépendance entre les couches. Il s'agit du ratio de covariance entre les deux couches divisé par le produit de leurs écarts types. Etant donné qu'il s'agit d'un ratio, il s'agit d'un nombre sans unité. L'équation pour calculer la corrélation est la suivante :
Plages de corrélation de +1 à -1. Une corrélation positive indique une relation directe entre deux couches, par exemple lorsque les valeurs de cellule d'une couche augmentent, il est également possible que les valeurs de cellule d'une autre couche le fassent aussi. Une corrélation négative signifie qu'une variable change et pas l'autre. Une corrélation nulle signifie que deux couches sont indépendantes l'une de l'autre.
La matrice de corrélation est symétrique. Sa diagonale allant de l'angle supérieur gauche à l'angle inférieur droit est de 1,0000. En effet le coefficient de corrélation des couches identiques est +1.
Exemple
L'exemple suivant montre le contenu de la sortie de l'outil Statistiques de groupe de canaux pour un raster multicanal à quatre couches. Le premier tableau montre les statistiques basiques lorsque l'option de calcul des matrices n'est pas utilisée. Toutefois, lorsque cette option est activée, les matrices de corrélation et de covariance sont également calculées. Les résultats statistiques contenus dans le fichier de statistiques en sortie sont affichés.
Seule la moyenne est calculée
Sortie avec l'option Calculer les matrices de covariance et de corrélation désactivée (BRIEF) :
# STATISTICS of INDIVIDUAL LAYERS # Layer MIN MAX MEAN STD # --------------------------------------------------------------- 1 1.0000 21.0000 7.8410 4.1690 2 1.0000 128.0000 25.5144 35.8494 3 296.9573 4073.6306 1565.5359 763.9803 4 0.3333 127.5000 51.5314 29.7958 # ===============================================================
A la fois la moyenne et les matrices sont calculées
Sortie avec l'option Calculer les matrices de covariance et de corrélation activée (DETAILED) :
# STATISTICS of INDIVIDUAL LAYERS # Layer MIN MAX MEAN STD # --------------------------------------------------------------- 1 1.0000 21.0000 7.8410 4.1690 2 1.0000 128.0000 25.5144 35.8494 3 296.9573 4073.6306 1565.5359 763.9803 4 0.3333 127.5000 51.5314 29.7958 # =============================================================== # COVARIANCE MATRIX # Layer 1 2 3 4 # --------------------------------------------------------------- 1 17.3826 16.9320 3177.5947 87.9590 2 16.9320 1285.3096 3117.1753 31.3420 3 3177.5947 3117.1753 583723.0625 16137.9785 4 87.9590 31.3420 16137.9785 887.8751 # =============================================================== # CORRELATION MATRIX # Layer 1 2 3 4 # --------------------------------------------------------------- 1 1.0000 0.1133 0.9976 0.7080 2 0.1133 1.0000 0.1138 0.0293 3 0.9976 0.1138 1.0000 0.7089 4 0.7080 0.0293 0.7089 1.0000 # ===============================================================
Bibliographie
Snedecor, G. W. et W. G. Cochran. 1968. Statistical Methods, 6th ed. Ames, Iowa: The Iowa State University Press.