# DOMINANCE ET E.coli

In [1]:
# Chargement des librairies
library(tidyverse)
library(dplyr)

── [1mAttaching core tidyverse packages[22m ──────────────────────── tidyverse 2.0.0 ──
[32m✔[39m [34mdplyr    [39m 1.1.4     [32m✔[39m [34mreadr    [39m 2.1.5
[32m✔[39m [34mforcats  [39m 1.0.0     [32m✔[39m [34mstringr  [39m 1.5.1
[32m✔[39m [34mggplot2  [39m 3.5.1     [32m✔[39m [34mtibble   [39m 3.2.1
[32m✔[39m [34mlubridate[39m 1.9.3     [32m✔[39m [34mtidyr    [39m 1.3.1
[32m✔[39m [34mpurrr    [39m 1.0.2     
── [1mConflicts[22m ────────────────────────────────────────── tidyverse_conflicts() ──
[31m✖[39m [34mdplyr[39m::[32mfilter()[39m masks [34mstats[39m::filter()
[31m✖[39m [34mdplyr[39m::[32mlag()[39m    masks [34mstats[39m::lag()
[36mℹ[39m Use the conflicted package ([3m[34m<http://conflicted.r-lib.org/>[39m[23m) to force all conflicts to become errors


In [2]:
# Importation du tableau de donnée final
df_pm4 <- tibble(read.csv("data/output/data_final_pm4.csv", sep = ";"))
head(df_pm4)

ASV,sample.id,temperature,frequence,Kingdom,Phylum,Class,Order,Family,Genus,Species,base_ref
<chr>,<chr>,<int>,<int>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>
000346e31c7cc77c7ed1244763587e06,PM415MV6,15,6,Bacteria,Pseudomonadota,Gammaproteobacteria,Enterobacterales_737866,Alteromonadaceae,Pseudoalteromonas,,GG2
000346e31c7cc77c7ed1244763587e06,PM415MV6,15,6,Bacteria,Pseudomonadota,Gammaproteobacteria,Alteromonadales,Pseudoalteromonadaceae,Pseudoalteromonas,tetraodonis,RDP
000346e31c7cc77c7ed1244763587e06,PM415MV6,15,6,Bacteria,Pseudomonadota,Gammaproteobacteria,Enterobacterales,Pseudoalteromonadaceae,Pseudoalteromonas,,SILVA
000346e31c7cc77c7ed1244763587e06,PM420MV8,20,38,Bacteria,Pseudomonadota,Gammaproteobacteria,Enterobacterales_737866,Alteromonadaceae,Pseudoalteromonas,,GG2
000346e31c7cc77c7ed1244763587e06,PM420MV8,20,38,Bacteria,Pseudomonadota,Gammaproteobacteria,Alteromonadales,Pseudoalteromonadaceae,Pseudoalteromonas,tetraodonis,RDP
000346e31c7cc77c7ed1244763587e06,PM420MV8,20,38,Bacteria,Pseudomonadota,Gammaproteobacteria,Enterobacterales,Pseudoalteromonadaceae,Pseudoalteromonas,,SILVA


# I- VERIFICATION DU NOMBRE DE E.coli DANS LES DATABASES

Pour assurer la fiabilité des analyses, nous avons d'abord vérifié l'abondance de E. coli car les nématodes ont été nourris avec cette bactérie.

In [None]:
nb_coli <- df_pm4 %>%
  filter(Species == "coli") %>%       # Filtrer uniquement les lignes où l'espèce est "coli"
  group_by(base_ref) %>%              # Regrouper par base de reference
  dplyr::summarise(
    nb_asv_distincts = n_distinct(ASV),  # Calcul du nombre d'ASV distincts
    nb_coli = n()                        # Calcul du nombre total d'occurrences de "coli"
  )

# Afficher les résultats
print(nb_coli)

# II- CALCUL DU GENRE ET DE L'ESPECE DOMINANTE 

Nous avons analysé les données pour identifier l’espèce et le genre les plus abondants en fonction des différentes températures et des bases de données utilisées.

## 1) L'espece dominante 

In [3]:
# Trouver l'espèce la plus abondante pour chaque combinaison de base de données et température
resultat <- df_pm4 %>%
 group_by(temperature) %>% # grouper les températures 
filter(frequence == max(frequence)) %>% # filtrer les lignes avec la fréquence la plus élevée
  group_by(base_ref) %>% # grouper par base de references 
  ungroup() %>% # dégrouper 
  select(base_ref, temperature, Species, frequence)  # Sélectionner les colonnes importantes

# Afficher les résultats
print(resultat)

[90m# A tibble: 9 × 4[39m
  base_ref temperature Species    frequence
  [3m[90m<chr>[39m[23m          [3m[90m<int>[39m[23m [3m[90m<chr>[39m[23m          [3m[90m<int>[39m[23m
[90m1[39m RDP               15 [31mNA[39m            [4m1[24m[4m4[24m[4m2[24m042
[90m2[39m GG2               15 rumoiensis    [4m1[24m[4m4[24m[4m2[24m042
[90m3[39m SILVA             15 casei         [4m1[24m[4m4[24m[4m2[24m042
[90m4[39m RDP               25 [31mNA[39m             [4m9[24m[4m4[24m065
[90m5[39m GG2               25 rumoiensis     [4m9[24m[4m4[24m065
[90m6[39m SILVA             25 casei          [4m9[24m[4m4[24m065
[90m7[39m RDP               20 [31mNA[39m            [4m2[24m[4m6[24m[4m0[24m151
[90m8[39m GG2               20 rumoiensis    [4m2[24m[4m6[24m[4m0[24m151
[90m9[39m SILVA             20 casei         [4m2[24m[4m6[24m[4m0[24m151


## 2) Le genre dominant

In [4]:
# Trouver le genre le plus abondant pour chaque combinaison de base de donnée et température
resultat <- df_pm4 %>%
  group_by(base_ref, temperature) %>% # grouper par base de references et temperature 
  filter(frequence == max(frequence)) %>% # filtrer les lignes avec la fréquence la plus élevée
  ungroup() %>% # dégrouper 
  select(base_ref, temperature, Genus, frequence)  # Sélectionner les colonnes importantes

# Afficher les résultats
print(resultat)

[90m# A tibble: 9 × 4[39m
  base_ref temperature Genus           frequence
  [3m[90m<chr>[39m[23m          [3m[90m<int>[39m[23m [3m[90m<chr>[39m[23m               [3m[90m<int>[39m[23m
[90m1[39m RDP               15 Vibrio             [4m1[24m[4m4[24m[4m2[24m042
[90m2[39m GG2               15 Vibrio_A_678542    [4m1[24m[4m4[24m[4m2[24m042
[90m3[39m SILVA             15 Vibrio             [4m1[24m[4m4[24m[4m2[24m042
[90m4[39m RDP               25 Vibrio              [4m9[24m[4m4[24m065
[90m5[39m GG2               25 Vibrio_A_678542     [4m9[24m[4m4[24m065
[90m6[39m SILVA             25 Vibrio              [4m9[24m[4m4[24m065
[90m7[39m RDP               20 Vibrio             [4m2[24m[4m6[24m[4m0[24m151
[90m8[39m GG2               20 Vibrio_A_678542    [4m2[24m[4m6[24m[4m0[24m151
[90m9[39m SILVA             20 Vibrio             [4m2[24m[4m6[24m[4m0[24m151
