---

# **Notebook : Visualisation des Produits par Année de Création et de Modifications**

---

## **Phase 4 : Création de Graphiques**

---

### **1. Importation des bibliothèques**

Dans cette section, nous importons les bibliothèques nécessaires pour manipuler les données et créer les graphiques.




# 1. Importation des bibliothèques


In [1]:
import os
import pandas as pd
import matplotlib.pyplot as plt

### **2.Définition de la Fonction de Visualisation**

Cette fonction va lire chaque chunk, extraire les années de création et de modification, puis créer et sauvegarder les graphiques.


In [2]:
def creer_graphiques_annees(input_directory, output_directory):
    # Créer le dossier de sortie pour les graphiques s'il n'existe pas
    if not os.path.exists(output_directory):
        os.makedirs(output_directory)
    
    # Listes pour stocker les années de création et de modification
    annees_creation = []
    annees_modification = []
    
    # Parcourir les fichiers dans le dossier des chunks filtrés par complétude
    for file_name in os.listdir(input_directory):
        input_file_path = os.path.join(input_directory, file_name)
        
        # Lire chaque fichier chunk
        try:
            chunk = pd.read_csv(input_file_path, sep=',', low_memory=False)
            
            # Extraire les années de création et de modification
            if 'created_datetime' in chunk.columns:
                annees_creation.extend(pd.to_datetime(chunk['created_datetime'], errors='coerce').dt.year.dropna().astype(int))
            if 'last_modified_datetime' in chunk.columns:
                annees_modification.extend(pd.to_datetime(chunk['last_modified_datetime'], errors='coerce').dt.year.dropna().astype(int))
        
        except Exception as e:
            print(f"Erreur lors du traitement de {file_name}: {e}")
    
    # Création des graphiques
    # 2a. Graphique des produits par année de création
    plt.figure(figsize=(10, 6))
    pd.Series(annees_creation).value_counts().sort_index().plot(kind='bar')
    plt.title("Distribution des Produits par Année de Création")
    plt.xlabel("Année de Création")
    plt.ylabel("Nombre de Produits")
    plt.xticks(rotation=45)
    plt.tight_layout()
    plt.savefig(os.path.join(output_directory, 'produits_par_annee_creation.png'))
    plt.close()
    
    # 2b. Graphique des produits par année de dernière modification
    plt.figure(figsize=(10, 6))
    pd.Series(annees_modification).value_counts().sort_index().plot(kind='bar')
    plt.title("Distribution des Produits par Année de Dernière Modification")
    plt.xlabel("Année de Dernière Modification")
    plt.ylabel("Nombre de Produits")
    plt.xticks(rotation=45)
    plt.tight_layout()
    plt.savefig(os.path.join(output_directory, 'produits_par_annee_modification.png'))
    plt.close()
    
    print("Les graphiques ont été sauvegardés dans le dossier :", output_directory)

### **3. Application de la Fonction avec le Dossier `graphique`**

Nous appliquons la fonction aux fichiers dans le dossier **`04_chunk_filtered_columns`** et sauvegardons les graphiques dans **`note-books/phase_1_data/graphique`**.

# Chemins des répertoires d'entrée et de sortie

In [3]:
input_directory = 'note-books/phase_1_data/04_chunk_filtered_columns'
output_directory = 'note-books/phase_1_data/graphique'

# Exécution de la fonction pour créer et sauvegarder les graphiques

In [4]:
creer_graphiques_annees(input_directory, output_directory)

Les graphiques ont été sauvegardés dans le dossier : note-books/phase_1_data/graphique


---

### **Explication :**

- **`pd.to_datetime()`** : Cette méthode convertit les colonnes de dates en format datetime, permettant d'extraire les années.
- **`value_counts()` et `sort_index()`** : Ces méthodes comptent et trient les années pour chaque graphique.
- **`plt.savefig()`** : Chaque graphique est sauvegardé au format PNG dans le dossier spécifié.

---

Après avoir exécuté ce code, vous trouverez deux graphiques dans **`note-books/phase_1_data/graphique`** :
- `produits_par_annee_creation.png`
- `produits_par_annee_modification.png` 

Ces graphiques illustreront la répartition des produits par année de création et de modification.