<a href="https://colab.research.google.com/github/Datalab2020/air_project/blob/projet_francois/Projet.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# **Projet qualité de l'air en région Centre**

L'OMS et l'union européennes ont émisent des normes pour la qualité de l'air extérieur. Ces normes fixent des seuils pour différents polluants dont ceux observés par Lig'Air. 
Ces polluants ont différents effets :
 - Le NO2 est un gaz irritant pour les bronches.
 - L'O3 est un gaz irritant pour les yeux et l'appareil respiratoire dans son entièreté.
 - Le SO2 est un gaz qui irrite les muceuses de la peau et les voix respiratoires supérieures.
 - le PM 2.5 et le PM 10 sont des particules fines, l'indice correspondant à leurs taille en microns. Ces particules pénétrent dans les voix respiratoires, les effets sur la santé sont encore mal connus mais les personnes les plus sensibles sont les enfants, les personnes âgées, les femmes enceintes et les personne souffrant de pathologies cardiovasculaire ou respiratoires.

## Importation des librairies, DataFrame et premières moyennes globales

In [None]:
import pandas as pd
import folium
from pandas_profiling import ProfileReport
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
import numpy as np

def compte(ville):
    return df.loc[(df["lib_zone"] == ville)].groupby(["valeur", "qualif"]).size()

In [None]:
url = "https://opendata.arcgis.com/datasets/6f64bbd4f94c425791c2ec7eee33bb71_0.csv"
df = pd.read_csv(url)

df["jour"] = pd.DatetimeIndex(df["date_ech"]).day
df["mois"] = pd.DatetimeIndex(df["date_ech"]).month
df["an"] = pd.DatetimeIndex(df["date_ech"]).year

In [None]:
'''
#Polluant Blois 2018
#Janvier
2018janBlois_no2=df.loc[:, ["val_no2", "date_ech", "lib_zone"]][df.lib_zone == "BLOIS"][df.date_ech >= "2018/01/01 00:00:00+00"][df.date_ech < "2018/02/01 00:00:00+00"].sort_values(by= ["date_ech"])
2018janBlois_so2=df.loc[:, ["val_so2", "date_ech", "lib_zone"]][df.lib_zone == "BLOIS"][df.date_ech >= "2018/01/01 00:00:00+00"][df.date_ech < "2018/02/01 00:00:00+00"].sort_values(by= ["date_ech"])
janBlois_o3=df.loc[:, ["val_o3", "date_ech", "lib_zone"]][df.lib_zone == "BLOIS"][df.date_ech >= "2018/01/01 00:00:00+00"][df.date_ech < "2018/02/01 00:00:00+00"].sort_values(by= ["date_ech"])
janBloispm10=df.loc[:, ["val_pm10", "date_ech", "lib_zone"]][df.lib_zone == "BLOIS"][df.date_ech >= "2018/01/01 00:00:00+00"][df.date_ech < "2018/02/01 00:00:00+00"].sort_values(by= ["date_ech"])
janBloispm25=df.loc[:, ["val_pm25", "date_ech", "lib_zone"]][df.lib_zone == "BLOIS"][df.date_ech >= "2018/01/01 00:00:00+00"][df.date_ech < "2018/02/01 00:00:00+00"].sort_values(by= ["date_ech"])
'''

dfGroup = df.groupby(['mois','an', 'lib_zone'])

dfAgre = dfGroup.agg({"val_no2" : 'mean',
                       "val_so2" : 'mean',
                       "val_o3" : 'mean',
                       "val_pm25" : 'mean',
                       "val_pm10" : 'mean'})

dfAgre_index = dfAgre.reset_index()

print(dfAgre_index)

In [None]:
for ville in dfAgre_index['lib_zone']:
        globals()['Ville_%s' % ville] = dfAgre_index.loc[:, ][dfAgre_index.lib_zone == ville].sort_values(by=['an', 'mois']).reset_index()

In [None]:
moyenneBL = df.loc[(df["lib_zone"] == "BLOIS")].groupby(["an", "mois"]).mean()[["val_no2", "val_so2", "val_o3", "val_pm10", "val_pm25"]]
moyenneB = df.loc[(df["lib_zone"] == "BOURGES")].groupby(["an", "mois"]).mean()[["val_no2", "val_so2", "val_o3", "val_pm10", "val_pm25"]]
moyenneC = df.loc[(df["lib_zone"] == "CHARTRES")].groupby(["an", "mois"]).mean()[["val_no2", "val_so2", "val_o3", "val_pm10", "val_pm25"]]
moyenneCH = df.loc[(df["lib_zone"] == "CHATEAUROUX")].groupby(["an", "mois"]).mean()[["val_no2", "val_so2", "val_o3", "val_pm10", "val_pm25"]]
moyenneD = df.loc[(df["lib_zone"] == "DREUX")].groupby(["an", "mois"]).mean()[["val_no2", "val_so2", "val_o3", "val_pm10", "val_pm25"]]
moyenneM = df.loc[(df["lib_zone"] == "MONTARGIS")].groupby(["an", "mois"]).mean()[["val_no2", "val_so2", "val_o3", "val_pm10", "val_pm25"]]
moyenneO = df.loc[(df["lib_zone"] == "ORLEANS")].groupby(["an", "mois"]).mean()[["val_no2", "val_so2", "val_o3", "val_pm10", "val_pm25"]]
moyenneT = df.loc[(df["lib_zone"] == "TOURS")].groupby(["an", "mois"]).mean()[["val_no2", "val_so2", "val_o3", "val_pm10", "val_pm25"]]

## Graphiques par ville

In [None]:
graphT= moyenneT.plot(figsize=(15,9), title="MOYENNES DES POLLUANTS SUR 3 ANS POUR TOURS", xticks=np.arange(0, 34, 3))
fig = graphT.get_figure()
axes = plt.gca()
axes.set_xlabel("TEMPS EN ANNEE/MOIS")
fig.autofmt_xdate()
axes.set_ylabel("VALEURS")

In [None]:
comTOU = compte("TOURS")
comTOU.plot(kind='bar', figsize= (9,7), title = "Fréquence des valeurs max de polluants") #, legend='Reverse'
plt.xlabel("Valeur")
plt.ylabel('Fréquence')

In [None]:
graphT= moyenneBL.plot(figsize=(15,9), title="MOYENNES DES POLLUANTS SUR 3 ANS POUR BLOIS", xticks=np.arange(0, 34, 3))
fig = graphT.get_figure()
axes = plt.gca()
axes.set_xlabel("TEMPS EN ANNEE/MOIS")
fig.autofmt_xdate()
axes.set_ylabel("VALEURS")

In [None]:
comBLO = compte("BLOIS")
comBLO.plot(kind='bar', figsize= (9,7), title = "Fréquence des valeurs max de polluants") #, legend='Reverse'
plt.xlabel("Valeur")
plt.ylabel('Fréquence')
plt.savefig("Fréquences_BLOIS.png")

In [None]:
graphT= moyenneB.plot(figsize=(15,9), title="MOYENNES DES POLLUANTS SUR 3 ANS POUR BOURGES", xticks=np.arange(0, 34, 3))
fig = graphT.get_figure()
axes = plt.gca()
axes.set_xlabel("TEMPS EN ANNEE/MOIS")
fig.autofmt_xdate()
axes.set_ylabel("VALEURS")

In [None]:
comBOU = compte("BOURGES")
comBOU.plot(kind='bar', figsize= (9,7), title = "Fréquence des valeurs max de polluants") #, legend='Reverse'
plt.xlabel("Valeur")
plt.ylabel('Fréquence')

In [None]:
graphT= moyenneC.plot(figsize=(15,9), title="MOYENNES DES POLLUANTS SUR 3 ANS POUR CHARTRES", xticks=np.arange(0, 34, 3))
fig = graphT.get_figure()
axes = plt.gca()
axes.set_xlabel("TEMPS EN ANNEE/MOIS")
fig.autofmt_xdate()
axes.set_ylabel("VALEURS")

In [None]:
comCHAR = compte("CHARTRES")
comCHAR.plot(kind='bar', figsize= (9,7), title = "Fréquence des valeurs max de polluants") #, legend='Reverse'
plt.xlabel("Valeur")
plt.ylabel('Fréquence')

In [None]:
graphT= moyenneCH.plot(figsize=(15,9), title="MOYENNES DES POLLUANTS SUR 3 ANS POUR CHATEAUROUX", xticks=np.arange(0, 34, 3))
fig = graphT.get_figure()
axes = plt.gca()
axes.set_xlabel("TEMPS EN ANNEE/MOIS")
fig.autofmt_xdate()
axes.set_ylabel("VALEURS")

In [None]:
comCHAT = compte("CHATEAUROUX")
comCHAT.plot(kind='bar', figsize= (9,7), title = "Fréquence des valeurs max de polluants") #, legend='Reverse'
plt.xlabel("Valeur")
plt.ylabel('Fréquence')

In [None]:
graphT= moyenneD.plot(figsize=(15,9), title="MOYENNES DES POLLUANTS SUR 3 ANS POUR DREUX", xticks=np.arange(0, 34, 3))
fig = graphT.get_figure()
axes = plt.gca()
axes.set_xlabel("TEMPS EN ANNEE/MOIS")
fig.autofmt_xdate()
axes.set_ylabel("VALEURS")

In [None]:
comDRE = compte("DREUX")
comDRE.plot(kind='bar', figsize= (9,7), title = "Fréquence des valeurs max de polluants") #, legend='Reverse'
plt.xlabel("Valeur")
plt.ylabel('Fréquence')

In [None]:
graphT= moyenneM.plot(figsize=(15,9), title="MOYENNES DES POLLUANTS SUR 3 ANS POUR MONTARGIS", xticks=np.arange(0, 34, 3))
fig = graphT.get_figure()
axes = plt.gca()
axes.set_xlabel("TEMPS EN ANNEE/MOIS")
fig.autofmt_xdate()
axes.set_ylabel("VALEURS")

In [None]:
comMON = compte("MONTARGIS")
comMON.plot(kind='bar', figsize= (9,7), title = "Fréquence des valeurs max de polluants") #, legend='Reverse'
plt.xlabel("Valeur")
plt.ylabel('Fréquence')

In [None]:
graphT= moyenneO.plot(figsize=(15,9), title="MOYENNES DES POLLUANTS SUR 3 ANS POUR ORLEANS", xticks=np.arange(0, 34, 3))
fig = graphT.get_figure()
axes = plt.gca()
axes.set_xlabel("TEMPS EN ANNEE/MOIS")
fig.autofmt_xdate()
axes.set_ylabel("VALEURS")

In [None]:
comORL = compte("ORLEANS")
comORL.plot(kind='bar', figsize= (9,7), title = "Fréquence des valeurs max de polluants") #, legend='Reverse'
plt.xlabel("Valeur")
plt.ylabel('Fréquence')