---

# **Notebook 11 : Visualisation du Nombre de Produits par Pays**

---

### **1. Importation des Bibliothèques**

La première section est dédiée à l'importation des bibliothèques nécessaires pour la manipulation des données et la visualisation.


In [6]:
import os
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

---

### **2. Chargement et Agrégation des Données**

Dans cette section, nous chargeons les fichiers CSV depuis le répertoire `09_translated_countries`, nous comptons le nombre de produits par pays, et nous créons un DataFrame agrégé.

In [7]:
# Définir le répertoire contenant les fichiers de pays traduits
input_directory = 'note-books/phase_1_data/09_translated_countries'

# Initialiser un dictionnaire pour stocker le comptage de produits par pays
produits_par_pays = {}

# Parcourir les fichiers CSV dans le répertoire
for file_name in os.listdir(input_directory):
    file_path = os.path.join(input_directory, file_name)
    
    # Charger le CSV
    df = pd.read_csv(file_path)
    
# Comptage du nombre de produits par pays
for pays in df['countries_translated']:
    if isinstance(pays, str):  # Vérifie si 'pays' est une chaîne de caractères
        pays_list = pays.split(', ')  # Si plusieurs pays sont listés dans une cellule, les séparer
        for p in pays_list:
            if p:
                produits_par_pays[p] = produits_par_pays.get(p, 0) + 1

# Convertir en DataFrame et trier
pays_df = pd.DataFrame(list(produits_par_pays.items()), columns=['Pays', 'Nombre de produits'])
pays_df = pays_df.sort_values(by='Nombre de produits', ascending=True)

---

### **3. Création du Graphique**

Dans cette section, nous générons un graphique en barres montrant le nombre de produits par pays, avec les pays sur l'axe Y et le nombre de produits sur l'axe X.

In [None]:
# Paramètres de taille du graphique
plt.figure(figsize=(10, 20))  # Adapter la taille pour que tous les pays soient visibles

# Création du graphique
sns.barplot(x='Nombre de produits', y='Pays', data=pays_df, palette='viridis')
plt.title('Nombre de Produits par Pays')
plt.xlabel('Nombre de produits')
plt.ylabel('Pays')

# Affichage et sauvegarde du graphique
output_graph_path = 'note-books/phase_1_data/graphique/produits_par_pays.png'
plt.tight_layout()
plt.savefig(output_graph_path)
plt.show()

print(f"Graphique sauvegardé dans {output_graph_path}.")


```

---

### **Explications**

- **Chargement des données** : Nous avons agrégé les données de tous les fichiers CSV pour obtenir un comptage total par pays.
- **Graphique ordonné** : Les pays sont affichés par ordre croissant en fonction du nombre de produits, facilitant la comparaison visuelle.
- **Sauvegarde du graphique** : Le graphique est enregistré pour une utilisation ultérieure.

---

