Biologie végétale

Écologie végétale

Contenu du module

Mesures quantitatives et statistiques

Accueil » Écologie végétale » Écosystèmes » Phytosociologie » Mesures quantitatives et statistiques

Mesures quantitatives
Utilisation des méthodes statistiques de groupement et d’ordination

1. Mesures quantitatives

A. Mesures des densités par quadrats

Il s’agit de dénombrements d’individus par unité de surface. De tels comptages sont souvent réalisés pour de petits quadrats placés plusieurs fois dans une communauté. La somme des individus par espèce est calculée pour la surface totale et le résultat est exprimé en densité d’espèces par unité de surface (m2 ou ha).

Il est difficile de compter les individus pour toutes les espèces se propageant végétativement (stolons, rhizomes, …). La taille des quadrats dépend du type de végétation (1 x 1 m pour une végétation rase herbeuse, 10 x 10 m pour une végétation forestière).

B. Détermination des fréquences

La fréquence représente le nombre de fois qu’une espèce est répertoriée dans un certain nombre de répétitions, exprimée en fraction du total (souvent en pourcentages). Un comptage n’est pas nécessaire, mais l’enregistrement de la présence de l’espèce est plus facile que des mesures de densités ou de couvert. Les points de comptage peuvent être pris au hasard ou de manière systématique, souvent à un rythme régulier. Les espèces sont enregistrées indépendamment de leur quantité ou du nombre d’individus. Il s’agit d’une mesure non absolue, c’est-à-dire que le résultat dépend de la taille et de la forme du quadrat d’échantillonnage. Elle donne une idée de l’uniformité de la distribution plutôt que la densité (faible valeur pour une espèce agrégée plutôt que dispersée). Elle ne donne aucune indication sur le type de couverture (une petite espèce dispersée aura de fortes valeurs). La taille du quadrat est fonction de la taille des plantes et de la richesse spécifique (20-30 espèces dans un m2 de pelouse rase seront répertoriées dans 100 subquadrats de 10 x 10 cm).

C. Mesures du couvert

Le couvert représente la projection au sol des parties aériennes d’une espèce, exprimée en fraction ou pourcentage d’une surface de référence. Cette mesure a une grande signification écologique car elle fournit une meilleure estimation de la biomasse que le nombre d’individus présents. De plus, toutes les formes biologiques peuvent être évaluées par les mêmes paramètres et donc comparées (ce qui n’est pas le cas avec les mesures de fréquence ou de densité). La méthode du « quadrat-charting » pour les végétations herbacées basses consiste en un dessin sur papier de la projection d’un quadrat d’un m2 subdivisé en petites mailles (grâce à des photographies). Cette méthode n’est valable que pour des plantes herbacées ou de petite taille et de petites surfaces à inventorier. La méthode du « point-intercept » ou point-contact permet de travailler dans des végétations plus hautes, la mesure des points d’intersection se réalise avec un cadre percé d’aiguilles et permet d’évaluer la fréquence des espèces rencontrées plutôt que leur couvert exact.

2. Utilisation des méthodes statistiques et d'ordination

Actuellement, l’utilisation de tableurs permettant de modifier à volonté les lignes et les colonnes débouche sur un gain de temps appréciable. Des techniques plus poussées permettent l’analyse complète des résultats. Pluseiurs logiciels permettent à présent de nombreuses analyses : PCORD (McCune & Mefford, 1999), R-Vegan (gratuit !), ou Juice11.

Deux méthodes complémentaires se sont développées. La classification ou groupement a pour but d’organiser les relevés en classes ou groupes. Les membres de chaque classe ont en commun un certain nombre de caractéristiques les écartant des membres des autres classes. L’ordination arrange les relevés ou des espèces dans un espace défini par un petit nombre de dimensions, dans lequel les entités semblables sont proches et les dissemblables éloignées (Gauch, 1982). L’ordination, prise au sens large, se fixe trois objectifs :

(1) synthétiser les données d’un tableau de relevés,

(2) mettre les communautés en relation avec des gradients de l’environnement et

(3) comprendre la structure des communautés.

Au sens strict, l’ordination cherche à mettre la végétation en relation avec un ou plusieurs gradients environnementaux ou axes.

A. Mise en forme des données

Pour être analysées, les données doivent être présentées sous la forme de tableau croisant les espèces observées dans l’ensemble des stations ; les cellules du tableau contiennent les valeurs de dominance ou de recouvrement. Seules les données de recouvrement sont utilisées ; on ne tient pas compte du degré de sociabilité et des autres informations associées à l’observation. Ce tableau de contingence (tableau de fréquence) est un tableau multivarié et est facile à construire avec les logiciels tableurs courants (Exell, Lotus, Works,…) mais devient assez fastidieux dès que le nombre de relevés augmente.

La représentation multidimensionnelle de ces données peut prendre deux formes graphiques : soit on considère que l’espace est défini par des axes « stations » où les espèces sont placées en fonction de leur coefficient d’abondance ; soit on considère que l’espace est défini par des axes « espèces » où les stations sont placées en fonction des abondances des espèces qui y sont présentes. On peut ainsi rapidement mettre en évidence les relations de proximité écologique entre espèces ou les espèces ayant les plus fortes dominances pour chaque station.

B. La mesure de la similarité entre stations et entre espèces

La visualisation graphique des positions des stations ou des espèces dans leur espace réciproque a tout de suite évoqué la possibilité de mesurer la distance qui les sépare les unes des autres. Cette distance est en effet la meilleure mesure multivariée des différences qui existent soit entre les espèces, soit entre les stations. Une mesure de distance est donc une estimation inverse de la similarité. De nombreuses mesures de distance ou d’indices de similarité existent dans la littérature (Legendre & Legendre, 1984). Cette grande variété est notamment due à la nécessité de s’adapter aux traits caractéristiques des données selon qu’elles sont de type binaire (présence/absence), ordinales (échelle de van der Maarel) ou quantitatives (fréquences). De nombreux indices permettent de ne pas tenir compte des double-absences ou double–zéros (le fait que plusieurs espèces ne sont pas présentes dans deux relevés différents) et ne comptabilisent que la présence d’une espèce dans deux relevés comme contribution à leur similarité. Les indices généralement utilisés relèvent de deux groupes principaux : les mesures de distance (D) et les indices de similarité (S = 1 – D). Les indices de similarité symétriques considèrent les doubles-rézos comme des ressemblances.

Le choix d’un indice approprié est fondamental car toute analyse ultérieure se fera sur la matrice qui en résulte. L’indice de similarité de Steinhaus (S17) est un indice quantitatif asymétrique qui est destiné aux données d’abondances des espèces. Son équivalent en terme de distances est l’indice de Bray & Curtis (D14 = 1-S17).

C. Méthodes d’analyse

Méthodes d’ordination

L’objectif des méthodes d’ordination est d’ordonner des objets les uns par rapport aux autres de manière à éloigner les objets les plus différents en essayant de limiter le nombre de variables nécessaires. Plusieurs méthodes d’ordination sont largement utilisées en botanique, mais l’analyse factorielle des correspondances (AFC) et l’analyse canonique des correspondances (CCA) sont actuellement les plus répandues (Guinochet, 1973 ; Chapman, 1976 ; Kent & Coker, 1994 ; Bouxin, 2004). Les axes reflètent les grandes variations des facteurs écologiques (humidité par exemple). Cette méthode permet donc de saisir directement les facteurs de variations, par ordre d’importance ainsi que la réaction des espèces à ces divers facteurs et la façon dont le milieu se structure à partir d’eux. Les groupes socio-écologiques sont ainsi facilement détectés.

De nombreuses techniques d’ordination ont été développées: analyse factorielle (FA), technique de Bray et Curtis (Polar ordination), analyse en composantes principales (PCA), analyse des principales coordonnées (PCoA), analyse des correspondances (CA) et sa variante, la « Detrended correspondence analysis (DCA), gradation non métrique multidimensionnelle (NMS). Chacune présente certains avantages et inconvénients, ou sa propre sensibilité et il est parfois utile d’en tester plusieurs pour tirer toute la quintessence d’un tableau de relevés. L’analyse en composantes principales disperse peu les relevés mais beaucoup mieux les espèces et reste utile avec des données d’abondance ou des variables continues (mésologiques par exemple). Les analyses des correspondances (CA et DCA) sont très sensibles aux espèces rares (certains auteurs n’hésitent pas à supprimer ces espèces rares). L’analyse non métrique multidimensionnelle (NMS) est délicate à utiliser puisqu’elle apporte des résultats différents en fonction du nombre d’axes choisis mais semble prometteuse sur le plan synthétique. L’analyse canonique des correspondances apporte une bonne dispersion des relevés mais l’analyse reste influencée par les espèces rares ; elle est la seule à présenter la dispersion des relevés sous forme d’un gradient. Cette dernière technique semble donc intéressante dans ce but.

Le traitement d’autres données que les espèces et les relevés, telles que des données écologiques, est possible : analyse canonique des correspondances (données environnementales traitées en sus du tableau de végétation) ou analyse factorielle multiple (plusieurs tableaux ensemble). L’analyse permet alors de regrouper les relevés (individus) selon leur composition floristique et les espèces (variables principales) selon leur sociologie au sein des relevés. Les données écologiques interviennent dans un second temps comme « variables supplémentaires ». Avec des données de plusieurs strates et de nature très différente (végétation et environnement), l’analyse factorielle multiple ou ses variantes est recommandée (Bouxin, 2004). Les différentes strates peuvent également être analysées séparément de façon à retirer un maximum d’informations des relevés.

Méthodes de groupement

Le principe d’une méthode de groupement ou de classification («clustering») est de rassembler les objets qui ont un degré de similarité suffisant pour être réunis dans le même ensemble. Dans le cadre de l’analyse de la végétation, on groupe les relevés pour mettre en évidence des conditions écologiques particulières qui président à la reconnaissance des associations végétales. Si l’on considère comme Goodall (1973) que les relevés de végétation peuvent être représentés par des points dans un espace multidimensionnel, dont les axes correspondent aux variables par lesquelles ils sont décrits, la classification consiste à diviser cet espace en sous-espaces. Si la dispersion des points est interrompue par des discontinuités, la division suivra celles-ci. Si la dispersion des relevés dans un espace alors défini par un petit nombre de dimensions est continue, un nombre arbitraire de classes peut être défini ; si elle présente des discontinuités, celles-ci serviront de référence.

Il existe un large éventail de méthodes de groupement. Elles sont généralement d’abord classées en fonction de leur caractère hiérarchique ou non. On désigne par l’appellation hiérarchique les méthodes qui imposent de manière définitive la position d’un objet au sein d’une filière de classification. Tous les objets doivent obligatoirement se retrouver dans la structure finale. Elles permettent la construction d’un dendrogramme qui montre la séquence dans laquelle les divisions ou fusions de groupes sont faites. Il s’agit des méthodes les plus utilisées et les plus faciles à comprendre.

Les méthodes hiérarchiques sont de deux types : elles sont agglomératives (ou agrégatives ou ascendantes) quand elles associent les objets (les relevés) et les groupent les uns avec les autres pour terminer par un seul groupe ; elles sont divisives (ou descendantes) quand elles subdivisent les groupes jusqu’à obtenir autant de groupes qu’il y a d’objets (de relevés).

Les méthodes non hiérarchiques établissent une classification qui est indépendante d’un niveau à l’autre. Certaines permettent en outre une superposition des objets dans deux ou plusieurs groupes de manière à bien révéler leur caractère intermédiaire. La méthode de Ward est utilisée de manière préférentielle dans le cas des relevés de végétation car elle permet de minimiser la variance intra-groupe : le critère permettant de décider de la fusion de deux classes est basé sur l’augmentation de la dispersion intra-classe. A chaque classe, on fusionne les deux classes qui provoquent la plus faible augmentation du moment intra-classe. Il s’agit d’une méthode hiérarchique agrégative. D’autres algorithmes de calcul ont été mis au point et peuvent être utilisés. Plusieurs critères d’agrégation existent à partir des mesures de distance (lien complet, lien moyen, lien simple, centroïde et stratégie flexible).

Certains auteurs recommandent de comparer les résultats produits par plusieurs techniques de manière à dégager les noyaux forts, c’est-à-dire les groupements les plus robustes.

Espèces indicatrices

a. Méthode Twinspan

Cette méthode est basée sur le principe de l’AFC dont elle dérive directement. Cette technique (Two-way indicator species analysis) est une méthode divisive polythétique. Elle a le mérite d’organiser de manière simple la matrice de données de départ et d’en identifier la structure majeure. Le principe de base est de réaliser une classification hiérarchique des relevés sur la base du premier axe d’une analyse des correspondances (AFC). Le premier axe permet de séparer les relevés en deux groupes. Les espèces qui caractérisent les extrémités de l’axe sont mises en évidence de manière à polariser les relevés. Ce processus de division est alors répété sur les sous-ensembles de relevés et ainsi de suite jusqu’à ce que chaque groupe de relevé ait un nombre de relevés qui ne dépasse pas un minimum fixé. Une classification correspondante des espèces est produite parallèlement à celle des relevés et la classification hiérarchique des espèces est utilisée pour construire un tableau de données réarrangé à la fois dans ses lignes et colonnes de manière à présenter les groupes de relevés avec leurs espèces indicatrices. Le programme évalue ensuite le caractère indicateur des espèces en se basant sur le concept de « pseudo-espèce ».

b. La méthode IndVal

La méthode Indval (Indicator Value) a été proposée par Dufrêne & Legendre (1997). Elle propose la même approche : on utilise une classification des relevés pour identifier les espèces qui en sont indicatrices. Le principe est simple, il repose sur la définition du caractère indicateur d’une espèce : une espèce est considérée comme indicatrice si elle est typique d’un groupe de relevés (elle est absente des autres groupes) et si elle est présente dans tous les relevés de ce groupe. Elle combine une mesure de la spécificité d’une espèce avec celle de sa fidélité :

La mesure de la spécificité :
Aij = N individus ij / N individus i

avec N individus ij : le nombre moyen d’individus de l’espèce i (abondance moyenne) présents dans le groupe j et
N individus i : la somme des moyennes des nombres d’individus de l’espèce i (abondance moyenne) dans tous les groupes.

La mesure de la fidélité :
Bij = N relevés ij / N relevés i

avec N relevés ij : le nombre de relevés dans le groupe j dans lesquels l’espèce i est présente et
N relevés j : le nombre total de relevés dans le groupe j.

La valeur indicatrice (IndValij en %) : IndVal ij = A ij x B ij x 100

La valeur indicatrice de l’espèce pour un niveau de classification des relevés en différents groupes est la plus grande valeur d’IndVal observée pour un des groupes. La spécificité est maximale (100%) quand l’espèce n’occupe qu’un groupe et la fidélité est maximale (100%) lorsque l’espèce est présente dans tous les relevés d’un groupe. La valeur indicatrice de l’espèce est maximale (100 %) lorsque la spécificité et la fidélité sont maximales.

Ces espèces indicatrices donneront une signification écologique aux groupes préalablement constitués et permettront d’identifier les niveaux auxquels il est inutile de poursuivre la classification.

Les multiples techniques dont nous disposons ne sont rien si elles sont utilisées de manière automatique, sans une importante réflexion sous-jacente sur la nature des données et la manière dont elles ont été récoltées. Ces techniques ne compenseront jamais des lacunes dans l’échantillonnage de la végétation.