# Étude de Cas : analyse de séquences ADN et exploration de données métagénomiques

## Contexte

Vous êtes un bioinformaticien travaillant sur l’analyse de séquences ADN issues d’un séquençage métagénomique à l’aide de la technologie Nanopore. Votre objectif est de détecter la présence de virus potentiellement pathogènes dans un échantillon environnemental.

## Objectifs pédagogiques
 - Comprendre le format FASTQ et manipuler des séquences ADN.
 - Apprendre à filtrer les lectures et à évaluer leur qualité.
 - Effectuer un alignement des lectures sur une base de données de référence.
 - Explorer et visualiser les résultats sous forme de graphiques.
 - Interpréter des résultats d’analyse métagénomique.

## Outils requis
 - Bash
 - FastQC : Contrôle qualité des séquences
 - Minimap2 : Alignement des lectures sur une base de données
 - Samtools : Manipulation et filtrage des fichiers d’alignement

## Étape 1 : Contrôle qualité des lectures

In [None]:
cd ~/Documents/2025/etibiri.github.io/data
fastqc data.fastq -o output/

## Étape 2 : Filtrage des séquences de mauvaise qualité

In [None]:
cd ~/Documents/2025/etibiri.github.io/data
seqtk trimfq -q 20 data.fastq > output/filtered_reads.fastq

## Étape 3 : Alignement avec Minimap2

In [None]:
cd ~/Documents/2025/etibiri.github.io/data
minimap2 -ax map-ont reference_database.mmi data/filtered_reads.fastq > data/alignment.sam

## Étape 4 : Conversion et tri du fichier SAM en BAM

In [None]:
!samtools view -S -b data/alignment.sam | samtools sort -o data/alignment_sorted.bam

## Étape 5 : Comptage des lectures alignées

In [None]:
!samtools idxstats data/alignment_sorted.bam