Apport des longues lectures en métagénomique

Jean Mainguy, MIAT, plateforme Bioinformatique


Date
14 oct. 2022

Depuis la fin des années 2000, on utilise des gènes marqueurs pour étudier la composition des communautés microbiennes dans les écosystèmes d’intérêt. Il s’agit du métabarcoding. L’un des gènes les plus communément utilisé est le gène de l’ARN 16S, mais les technologies de séquençage suffisamment précises pour ce type d’étude ne permettaient d’en obtenir qu’une petite partie (< 500pb). Depuis quelques années sont apparues des longues lectures de bonne qualité ce qui permet de lever ce verrou de la taille du marqueur (~5000pb). L’axe 3 du projet seqOccIn avait pour objectif de revisiter ces pratiques et de tester les nouvelles possibilités permises par ces lectures longues de bonne qualité. Lors de ce séminaire je vais, dans une première partie, vous présenter nos conclusions sur ces aspects. Étudier la composition bactérienne d’un milieu mène souvent à une seconde question : que savent faire ces bactéries ? Pour y répondre, il est possible, bien que plus onéreux, de séquencer l’ensemble des génomes et non plus seulement un gène marqueur. Il s’agit de la métagénomique. Je vous présenterai, dans une seconde partie, les grandes étapes de ce type d’analyse et mettrai l’accent sur les apports et problèmes posés par l’utilisation des longues lectures dans ce cas.