# Atelier 1

Cet atelier propose une initiation à la bioinformatique appliquée à l’étude du microbiome des sols. Les participants découvriront les concepts clés, les formats de données et les outils couramment utilisés. L’analyse de la diversité fongique et eucaryote sera abordée à travers un pipeline complet, incluant les bases de données de référence et la visualisation des résultats. Une introduction aux statistiques appliquées aux données omiques complètera la formation, avec un focus sur les indices de diversité (alpha/bêta) et les analyses multivariées de base.

In [None]:
!git clone https://github.com/thomasbio/AtelierSYMBIOSOL.git

In [None]:
%cd AtelierSYMBIOSOL
%run setup_qiime2


## Importer les informations relatives aux échantillons (metadata)

In [None]:
import pandas as pd
metadata = pd.read_csv('data/metadata.tsv', sep = '\t')
metadata

## Importer les fichiers FASTQ (R1 et R2)

In [None]:
!qiime tools import \
  --type 'SampleData[PairedEndSequencesWithQuality]' \
  --input-path data/procaryotes/fastq_subset \
  --input-format CasavaOneEightSingleLanePerSampleDirFmt \
  --output-path demux-paired-end.qza

## Évaluer la qualité des séquences et définir les paramètres de filtration

In [None]:
!qiime demux summarize \
  --i-data demux-paired-end.qza \
  --o-visualization demux-paired-end.qzv


Quel réglage utiliser pour trunc-len-f et trunc-len-r?

In [None]:
!qiime dada2 denoise-paired \
  --i-demultiplexed-seqs demux-paired-end.qza \
  --o-table table-emp \
  --o-representative-sequences rep-seqs \
  --o-denoising-stats denoising-stats.qza \
  --p-n-threads 1 \
  --p-trim-left-f 19 \
  --p-trim-left-r 20 \
  --p-trunc-len-f xxx \
  --p-trunc-len-r xxx

# Visualisation des stats

In [None]:
qiime metadata tabulate \
  --m-input-file denoising-stats.qza \
  --o-visualization denoising-stats.qzv

In [None]:
Pourquoi selon vous le pourcentage de séquence retenue à la fin est-il si faible?
(Comparez avec le fichier denoising-stats.qzv avec toutes les séquences dans output_16S)

## Assignation taxonomique | bactéries

In [None]:
!qiime feature-classifier classify-sklearn \
  --i-classifier 2024.09.backbone.v4.nb.sklearn-1.4.2.qza \
  --i-reads rep-seqs.qza \
  --o-classification taxo-gg2.qza

## Visualiser les proportions relatives des groupes taxonomiques

In [None]:
!qiime taxa barplot \
  --i-table table-emp.qza \
  --i-taxonomy taxo-gg2.qza \
  --m-metadata-file data/metadata.tsv \
  --o-visualization taxa-bar-plots-emp.qzv

#qiime2.Visualization.load('taxa-bar-plots-emp.qzv')

In [None]:
Trouvez comment éliminer les séquences sans phylum


In [None]:
!qiime

Avec quelle version de Qiime, le fichier table-emp.qza a été généré? (fichier dans le dossier ouput_16S)