# Projet Climatologie


## Liste des requêtes


- Les températures moyennes françaises de 1995 à 2019.

- L'évolution moyenne de la température chaque mois de l'année (sur toutes les années donc) de chaque région du globe (à l'aide de subplots, soit plusieurs diagrammes sur un seul affichage).

- Le classement graphique des pays les plus chauds au monde.

- Le classement graphique des pays les plus froids au monde.

- L'évolution des températures entre le pays le plus chaud et le pays le plus froid de 1995 à 2019 sur un même graphique.

- L'évolution de la température moyenne de la ville de Paris.

- La température moyenne de chaque pays sur une carte sur la période 2010-2019.



## Structure du jeu de données source

Region / Country / State / City / Month / Day / Year / AvgTemperature

## Import des librairies

In [None]:
# IPython extension reloading modules before user enters code.
%load_ext autoreload
%autoreload 2

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

from src.credentials import Credentials as cr
import src.split_datas as sd

## Nettoyage du jeu de données

In [48]:
global_temperatures = pd.read_csv("./data/RAW/temperatures.csv", delimiter = ',')

In [None]:
global_temperatures.describe()

In [None]:
# Conversion des degrés Fahrenheit en degrés Celsius.
global_temperatures['AvgTemperature'] = (global_temperatures['AvgTemperature'] - 32) / 1.8

In [None]:
# Nettoyage des données aberrantes.
global_temperatures = global_temperatures[global_temperatures['AvgTemperature'] > -72]

In [None]:
# Nous n'avons pas besoin de l'année 2020 dans ce projet.
global_temperatures = global_temperatures[global_temperatures['Year'] <= 2019]

In [46]:
global_temperatures['Region'][global_temperatures['Region'] == 'North America'] = 'NorthAmerica'
global_temperatures['Region'][global_temperatures['Region'] == 'South/Central America & Carribean'] = 'SouthCentralAmericaCarribean'
global_temperatures['Region'][global_temperatures['Region'] == 'Middle East'] = 'MiddleEast'
global_temperatures['Region'][global_temperatures['Region'] == 'Australia/South Pacific'] = 'AustraliaSouthPacific'

In [None]:
global_temperatures.to_csv("./data/RAW/temperatures_filtre.csv")

## Séparation des données

In [None]:
sd.split_datas(cr.TEMPERATURES_FILTRE, 'Country')

In [None]:
sd.split_datas(cr.TEMPERATURES_FILTRE, 'Region')

## Les températures moyennes françaises de 1995 à 2019

In [None]:
local_france = pd.read_csv("./data/CURATED/Country/France.csv", sep=',', encoding='utf-8')

In [None]:
local_france = local_france.drop('Unnamed: 0', axis = 1)

In [None]:
local_france[['Region', 'Country', 'State', 'City']] = local_france[['Region', 'Country', 'State', 'City']].astype('string')

In [None]:
local_france.dtypes

In [None]:
local_france = local_france[['Year', 'AvgTemperature']].groupby('Year').agg({'AvgTemperature': 'mean'})

In [None]:
plt.plot(local_france['AvgTemperature'])
plt.xlabel('Années')
plt.ylabel('Températures moyennes')
plt.title('Les températures moyennes françaises de 1995 à 2019')
plt.show()

In [None]:
# local_bordeaux['Full Date'] = local_bordeaux['Year'].map(str) + "-" + local_bordeaux['Month'].map(str) + "-" + local_bordeaux['Day'].map(str)

## L'évolution moyenne de la température chaque mois de l'année de chaque région du globe

In [47]:
global_temperatures['Region'].value_counts()

NorthAmerica                         1556681
Europe                                381990
Asia                                  316663
Africa                                251118
South/Central America & Carribean     219530
Middle East                           124749
Australia/South Pacific                55596
Name: Region, dtype: int64