2024 : Des outils statistiques pour retrouver les données cachées de l’Ecologie

L’étude des systèmes écologiques nécessite souvent d’analyser certaines composantes qui échappent à une observation parfaite, comme les trajectoires d’animaux en mouvement ou la banque de graines des plantes avec dormance. La modélisation statistique permet de traiter efficacement ces composantes cachées en utilisant le cadre des variables latentes. Ce cadre permet par exemple de modéliser une structure d’interaction sous-jacente entre les variables, de prendre en compte des effets environnementaux ou encore d’effectuer une classification des données, autant de tâches utiles dans l’analyse des données écologiques pour comprendre comment les espèces interagissent entre elles et avec leur milieu.

Cet ouvrage propose un reccueil de travaux récents sur la modélisation statistique et l’estimation dans des modèles avec variables latentes appliquées à l’écologie. Des nombreux exemples concrets impliquant différents types de variables latentes et à différentes échelles d’organisation, des individus aux écosystèmes, illustrent de manière pédagogique l’importance de ces modèles statistiques pour l’écologie et les rendent accessibles.

Contexte en enjeux

L’écologie étudie les organismes vivants en interaction avec leur environnement. Dans le contexte actuel de perte alarmante de la biodiversité, cette discipline doit apporter de nouvelles connaissances sur ces interactions pour aider à la conservation des espèces. Les interactions se produisent à l’échelle de l’individu (un animal, une plante), d’un groupe d’individus (une population, une espèce) ou de plusieurs espèces (une communauté). Pour les étudier, la statistique fournit les outils pour collecter des données sur les systèmes écologiques et les analyser. Cependant ces données sont souvent imparfaites. L’ ignorer peut conduire à des conclusions erronées ou partielles.

Ainsi, dans le cas d’une étude démographique, les potentielles erreurs d’identification des espèces peuvent conduire à une mauvaise estimation de la taille d’une population. De plus les systèmes sont souvent pilotés par des composantes qui échappent à l’observation, comme dans le cas de réseaux écologiques où les interactions peuvent être liées à une structure sous-jacente, non-observée, des espèces de la communauté. Dans les deux contextes, on parle de variables cachées. En statistique, le cadre des modèles à variables latentes permet de modéliser ces situations et d’inférer l’état de ces variables cachées afin de gagner en compréhension sur les systèmes écologiques.

Résultats

Cet ouvrage regroupe des exemples pédagogiques d’application à l’écologie de travaux récents sur les modèles à variables latentes et leur inférence statistique. Ils impliquent différents types de variables latentes, à différentes échelles d’organisation, des individus aux écosystèmes. Les écologues modélisateurs ou les statisciens travaillant dans le domaine de l’écologie trouvent dans cet ouvrage des ressources sur lesquelles s’appuyer pour réaliser leurs propres analyses. Les lecteurs, qui ont accès aux données et aux codes R pour faciliter la compréhension des modèles, peuvent ainsi adapter les outils d’inférence à leurs propres données.

Perspectives

Un autre ouvrage est en préparation, qui se concentre sur les modèles à variables latentes dynamiques, de type chaîne de Markov ou semi Markov cachée. Il est plus destiné aux statisticiens et propose une synthèse bibliographique des dernières avancées sur les extensions multi-chaines et contrôlées de ces modèles. Cet ouvrage est écrit avec la volonté de mettre en avant l’intérêt de ces modèles en écologie avec tout au long des chapitres des exemples fil rouge concrets.

Valorisation

L’ouvrage a été publié en français et en anglais chez ISTE-WILEY.