# ETL Faits_Matières

Ce notebook extrait, transforme et charge les données de matières résiduelles dans la table de fait principale du projet BI.

In [6]:
import pandas as pd
import os

os.makedirs('../generated', exist_ok=True)
source_dir = '../generated/normalized/'
# Extraction des données
faits = pd.read_csv(f"{source_dir}matieres_residuelles_quebec.csv", sep=',', encoding='utf-8')

# Transformation : sélection et renommage des colonnes
faits_matieres = faits[[
    'PÉRIODE DE RÉFÉRENCE',
    'GÉO',
    'Type de matières récupérées',
    'Sources des matières préparées en vue du recyclage',
    'VALEUR'
]].rename(columns={
    'PÉRIODE DE RÉFÉRENCE': 'periode',
    'GÉO': 'geo',
    'Type de matières récupérées': 'type_matiere',
    'Sources des matières préparées en vue du recyclage': 'producteur',
    'VALEUR': 'volume_tonnes'
})

faits_matieres.head()

# Sauvegarder le fichier pour l'analyse exploratoire
faits_matieres.to_csv('../generated/faits_matieres.csv', index=False)

In [None]:

faits = pd.read_csv(f"{source_dir}matieres_residuelles_quebec.csv", sep=',', encoding='utf-8')

sites = pd.read_csv(f"{source_dir}liste-centres-tri-crd.csv" , sep=',', encoding='utf-8')

# Dimension TypeMatiere
dim_type_matiere = pd.DataFrame({'type_matiere': faits['Type de matières récupérées'].unique()})
# Dimension Producteur
dim_producteur = pd.DataFrame({'producteur': faits['Sources des matières préparées en vue du recyclage'].unique()})

# Dimension Temps
dim_temps = pd.DataFrame({'periode': faits['PÉRIODE DE RÉFÉRENCE'].unique()})

# Dimension SiteValorisation
dim_site_valorisation = sites.drop_duplicates().reset_index(drop=True)

print("Dimension TypeMatiere")
display(dim_type_matiere.head())

print("\nDimension Producteur")
display(dim_producteur.head())

print("\nDimension Temps")
display(dim_temps.head())

print("\nDimension SiteValorisation")
display(dim_site_valorisation.head())




Dimension TypeMatiere


Unnamed: 0,type_matiere
0,Toutes les matières
1,Toutes les fibres de papier
2,Verre
3,Métaux ferreux
4,Cuivre et aluminium



Dimension Producteur


Unnamed: 0,producteur
0,Toutes les sources des matières récupérées
1,Sources des matières résidentielles récupérées
2,Sources des matières non résidentielles récupé...



Dimension Temps


Unnamed: 0,periode
0,2018
1,2020
2,2022



Dimension SiteValorisation


Unnamed: 0,Région administrative,Nom d'entreprise,Type d'installation,Conditions d'acceptation,Reconnaissance valide jusqu'au,Tonnage traité,Agrégats,Bardeaux,Bois - Recyclage,Bois - Valorisation,...,Taux de recyclage et de valorisation énergétique,Taux incluant les matières utilisées dans les lieux d'élimination,Taux de rejets,Adresse,Municipalité,Code Postal,Téléphone,Site Web,latitude,longitude
0,01 Bas-Saint-Laurent,GFL-Matrec - Matane et Rimouski,,"Pêle-mêle, Prétrié, Séparé",2028-03-31 00:00:00,Entre 20 000 et 40 000 t.,Oui,Oui,0.81,0.19,...,0.4,0.83,0.17,"75, rue Savard",Matane,G4W 0H9,418 562-5116,www.gflenv.com/fr/,48.828127,-67.57227
1,01 Bas-Saint-Laurent,GFL-Matrec - Rivière-du-Loup,,"Pêle-mêle, Prétrié, Séparé",2026-03-31 00:00:00,Entre 40 000 et 60 000 t.,Oui,,0.02,0.98,...,0.25,0.85,0.15,"10, rue Charles-St-Pierre",Rivière-du-Loup,G5R 0N6,418 862-0309,www.gflenv.com/fr/,47.839817,-69.504817
2,02 Saguenay-Lac-Saint-Jean,Centrem,,"Pêle-mêle, Prétrié, Séparé",2028-03-31 00:00:00,Entre 20 000 et 40 000 t.,Oui,Oui,0.0,1.0,...,0.72,0.89,0.11,"1125, rue des Pins",Alma,G8B 7V7,418 668-3223,groupedemexcentrem.com,48.573235,-71.658374
3,03 Capitale-Nationale,AIM Éco-Centre **,,"Pêle-mêle, Prétrié, Séparé",2028-03-31 00:00:00,Entre 80 000 et 100 000 t.,Oui,Oui,0.38,0.62,...,0.39,0.84,0.16,"220, rue Rotterdam",Saint-Augustin-de-Desmaures,G3A 1T4,418 843-6141,aim-ecocentre.com,46.758542,-71.459608
4,03 Capitale-Nationale,Eddy Fugère inc.,,"Pêle-mêle, Prétrié, Séparé",2028-03-31 00:00:00,Entre 80 000 et 100 000 t.,Oui,Oui,0.14,0.86,...,0.41,0.61,0.39,"315, rue Jackson",Québec,G1N 4C4,418 683-3981,S.O.,46.802883,-71.263446


In [10]:
# Persistance des dimensions en CSV
dim_type_matiere.to_csv('../generated/dim_type_matiere.csv', index=False)
dim_producteur.to_csv('../generated/dim_producteur.csv', index=False)
dim_temps.to_csv('../generated/dim_temps.csv', index=False)
dim_site_valorisation.to_csv('../generated/dim_site_valorisation.csv', index=False)
print("Dimensions sauvegardées dans des fichiers CSV à la racine du projet.")

Dimensions sauvegardées dans des fichiers CSV à la racine du projet.
