# Nettoyage des données de pollution atmosphérique

Ce notebook effectue un nettoyage des fichiers CSV en filtrant uniquement les lignes où la colonne 'Zas' est égale à 'ZAG PARIS'. Les fichiers nettoyés seront sauvegardés dans un nouveau dossier.

In [None]:
# Import Required Libraries
import os
import pandas as pd

# Chemins des dossiers
input_folders = ['./data/2023/', './data/2024/', './data/2025/']
output_folders = ['./data/2023_cleaned/', './data/2024_cleaned/', './data/2025_cleaned/']

# Créer les dossiers de sortie s'ils n'existent pas
for output_folder in output_folders:
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

In [None]:
# Parcourir tous les dossiers d'entrée
for input_folder, output_folder in zip(input_folders, output_folders):
    for file_name in os.listdir(input_folder):
        if file_name.endswith('.csv'):
            input_path = os.path.join(input_folder, file_name)
            output_path = os.path.join(output_folder, file_name)

            # Charger le fichier CSV
            data = pd.read_csv(input_path, sep=';', encoding='utf-8')

            # Filtrer les lignes où 'Zas' est égal à 'ZAG PARIS'
            filtered_data = data[data['Zas'] == 'ZAG PARIS']

            # Sauvegarder le fichier nettoyé
            filtered_data.to_csv(output_path, sep=';', index=False, encoding='utf-8')
            print(f"Fichier nettoyé sauvegardé : {output_path}")