Nouvelle méthode pour faire de la classification non supervisée de données OTU : cas d’application d
Par Anwar Abouabdallah (doctorant unité MIAT-Inra Toulouse)
Produire un inventaire d'OTUs à partir d'un échantillon environnemental est devenu banal. Or, c'est un sujet difficile car (i) faisant appel à l'apprentissage non supervisé et (ii) s'appuyant sur des données massives en métabarcoding. Nous présenterons les travaux d'une thèse en cours où nous développons une méthode de construction des OTUs par un modèle statistique (modèle dit SBM, Stochastic Block Model). Cette approche permet non seulement de construire des OTUs, mais également d'utiliser les paramètres du modèle statistique pour proposer une caractérisation compacte mais non scalaire de la biodiversité. En cette phase de début de la thèse, nous utilisons les données de barcoding des arbres de Guyane pour comparer l'assignation botanique, par SBM ou plus classiquement par classification des séquences de l'atlas moléculaire des arbres de Guyane.