# Analyse fréquentielle intégratrice

## Activité de transfert - 21 juillet 2022

préparée par :
- Duy Anh Alexandre
- Gabriel Gobeil
- Jonathan Jalbert

## Application 1 : Analyse fréquentielle classique

Dans cette application, vous reprendrez les grandes étapes du calepin 1-FrequencyAnalysis.pynb pour les données de la rivière Famine.

Vous n'avez qu'à compléter les cellules où il est spécificié **#TODO**.

---
# 1. Chargement des librairies et des fonctions utiles <a name="preparation"></a>

In [None]:
# Chargement des librairies
using CSV, DataFrames, Dates
using Distributions, Extremes, LinearAlgebra, Mamba, Random, Statistics
using Gadfly
using ProgressMeter, StatsBase

# Chargement des fonctions utiles (fonctions maisons)
include("1-utils.jl");

---
# 2. Chargement des données <a name="data"></a>

## 2.1 Chargement des débits observés <a name="data_loading"></a>

#### Chargement des données directement à partir du site web du MELCC

Pour cet exercice, nous utiliserons les données de la station Famine qui se trouve à 6,3 km en amont du pont-route 173 à Saint-Georges. Ces données sont disponibles sous la forme d'un fichier .txt se trouvant à l'adresse suivante : https://www.cehq.gouv.qc.ca/depot/historique_donnees/fichier/023422_Q.txt



In [None]:
# Adresse des données de la rivière Chaudière
data_url = "https://www.cehq.gouv.qc.ca/depot/historique_donnees/fichier/023422_Q.txt"

# Chargement des données dans un DataFrame
discharge = get_discharge_from_txt(data_url)

# Affichage des 5 premières lignes du DataFrame
first(discharge, 5) 

## 2.2 Chargement des variables explicatives <a name="covariable"></a>

La concentration annuelle équivalente de CO₂ dans l'atmosphère sera utilisée comme variable expliquant la non-stationnarité.

In [None]:
# Chargement des données
CO2 = CSV.read("../0-Data/0-RCP/RCPdata.csv", DataFrame)  

# Sélection du scénario RCP8.5 (En période historique, le choix du scénario n'a pas d'impact)
select!(CO2, :Year, :RCP85)

# Modifier les noms des colonnes du DataFrame contenant les données
rename!(CO2, :Year => :Année, :RCP85 => :CO2)

# Affichage des 5 premières lignes
first(CO2, 5)

## 2.3 Affichage des données chargées <a name="data_viz"></a>

#### Affichage des débits

In [None]:
plot(discharge, x=:Date, y=:Débit, Geom.line)

---
# 3. Traitement des données <a name="traitement"></a>

## 3.1 Extraction des maxima annuels des débits journaliers <a name="extraction"></a>

À partir des données journalières de débit, il est possible d'obtenir les maxima annuels grâce aux fonctions `groupby()` et `combine()` définies pour les DataFrames. 

Comme on cherche à grouper les données par année, on va d'abord faire l'**ajout d'une colonne** pour les années à partir de la colonne des dates.

In [None]:
# Ajout de la variable Année au DataFrame
discharge[:, :Année] = year.(discharge[!, :Date])

# Affichage des 5 premières lignes
first(discharge, 5)

In [None]:
# Extraction des maxima annuels
df = combine(groupby(discharge, :Année), :Débit => maximum => :Maximum)

# Affichage des 5 premières lignes
first(df,5)

## 3.2 Jumelage avec la concentration équivalente de CO₂  <a name="jumelage_co2"></a>

In [None]:
# Jonction des DataFrames
data = rightjoin(df, CO2, on=:Année)

# Retirer les lignes avec valeurs manquantes
dropmissing!(data, :Maximum)

# Changer l'ordre d'affichage des colonnes
select!(data, :Année, :CO2, :Maximum)

# Affichage des 5 premières lignes
first(data,5)

## 3.3 Affichage des données traitées <a name="affichage_données_traitées"></a>

#### Affichage des maxima annuels en fonction du temps

In [None]:
#TODO : Tracer les maxima annuels en fonction des années


#### Affichage des maxima annuels en fonction du CO₂

In [None]:
#TODO : Tracer les maxima annuels en fonction du CO₂

---
# 4. Modélisation classique des maxima annuels <a name="modelisation"></a>


## 4.1 Modèle stationnaire <a name="mstat"></a>

### 4.1.1 Estimation des paramètres de la loi GEV

L'estimation des paramètres de la loi GEV s'effectue en utilisant la fonction [`gevfit()`](https://jojal5.github.io/Extremes.jl/stable/functions/#Extremes.gevfit).

In [None]:
#TODO: Estimez les paramètres de la loi GEV stationnaire par maximum de la vraisemblance


In [None]:
#TODO: Calculez les intervalles de confiance des paramètres de la loi GEV stationnaire


### 4.1.2 Figures diagnostiques

Les figures diagnostiques peuvent être tracées avec [`diagnosticplots()`](https://jojal5.github.io/Extremes.jl/stable/functions/#Extremes.diagnosticplots-Tuple{fittedEVA}) :

In [None]:
#TODO: Tracez les figures diagnostiques


###  4.1.3. Estimation des niveaux de retour

L'estimation du niveau de retour peut être obtenue à l'aide de la fonction [`returnlevel()`](https://jojal5.github.io/Extremes.jl/stable/functions/#Extremes.returnlevel-Tuple{BayesianEVA{BlockMaxima},%20Real}).

In [None]:
#TODO: Estimez la valeur qui est excédée en moyenne une fois au 20 ans.


Un intervalle de confiance sur le niveau de retour peut être obtenu de la fonction [`cint()`](https://jojal5.github.io/Extremes.jl/stable/functions/#Extremes.cint) :

In [None]:
# TODO: Calculez l'intervalle de confiance à 95% de cette valeur.


## 4.2 Modèles non stationnaire <a name="mnstat"></a>

### 4.2.1 Estimation des paramètres

In [None]:
#TODO: Estimez la loi GEV avec le paramètre de localisation qui dépend du CO₂.


Les intervalles de confiances sur les paramètres peuvent être obtenus avec [`cint()`](https://jojal5.github.io/Extremes.jl/stable/functions/#Extremes.cint)

In [None]:
#TODO: Calculez les intervalles de confiance.


### 4.2.2 Figures diagnostiques

Les figures diagnostiques peuvent être tracées avec [`diagnosticplots()`](https://jojal5.github.io/Extremes.jl/stable/functions/#Extremes.diagnosticplots-Tuple{fittedEVA}) :

In [None]:
#TODO: Tracez les figures diagnostiques du modèle non stationnaire.

### 4.2.3 Comparaison des modèles

Les différents modèles peuvent êtres comparés à l'aide du BIC. Pour l'instant une fonction calculant le BIC n'est pas encore disponible dans `Extremes`. Elle le sera prochainement.

In [None]:
#TODO: Calulez le BIC du modèle stationnaire et du modèle non stationnaire et choisissez le meilleur modèle.


###  4.2.4. Estimation des niveaux de retour

Les estimations des niveaux de retour à chaque année peuvent être obtenues à l'aide de la fonction [`returnlevel()`](https://jojal5.github.io/Extremes.jl/stable/functions/#Extremes.returnlevel-Tuple{BayesianEVA{BlockMaxima},%20Real}).

In [None]:
#TODO: Calculer la valeur effective qui est dépassée en moyenne une fois au 20 ans.


In [None]:
#TODO: Calculer les intervalles de confiance


---
# 5. Modélisation bayésienne des maxima annuels <a name="bayes"></a>

## 5.1 Estimation des paramètres <a name="param_estimation"></a>

L'estimation bayésienne des paramètres s'effectue de la même façon analogue en utilisant la fonction [`gevfitbayes()`](https://jojal5.github.io/Extremes.jl/stable/functions/#Extremes.gevfitbayes). Les intervalles de crédibilité sont obtenus en utilisant la fonction [`cint()`](https://jojal5.github.io/Extremes.jl/stable/functions/#Extremes.cint).

In [None]:
#TODO: Estimez de façon bayésienne les paramètres du modèle stationnaire


In [None]:
#TODO: Estimez les intervalles de crédibilité bayésien
