# <h1 align="center"> THEME 3 - Visualisation </h1>

### üéØ Objectifs

- Visualisation de fonctions analytiques
- Utilisation de graphiques appropri√©s pour visualiser un jeu de donn√©es
- Utilisation de techniques d'analyse graphique
- G√©n√©ration d'animations

### üìö Notions 

- [Exemple 1](#ex1):
    - Anatomie d'un graphique matplotlib
    - Tracer une courbe de base
    - Personalisation de la courbe
    - Tracer plusieurs courbes sur un m√™me graphique
- [Exemple 2](#ex2):
    - Tracer un diagramme √† barres verticales/horizontales
    - Tracer un diagramme circulaire
    - Tracer un mix de graphiques dans une seule figure
- [Exemple 3](#ex4): Visualisation 2D
- [Exemple 4](#ex5): Visualisation 3D
- [Exemple 5](#ex5): Animation

Un [lexique](#lexique) avec l'ensemble des fonctions qui ont √©t√© vues est disponible √† la fin du notebook.

### üß∞ Librairies

- **Matplotlib** est une librairie compl√®te qui permet de cr√©er tr√®s facilement des visualisations principalement statiques et interactives en Python.
- **PyQtGraph** est une librairie de haute performance, ax√©e sur la visualisation d'une grande quantit√© de donn√©es, animations et cr√©ation de GUI.

### üîó R√©f√©rences

- [Documentation Matplotlib](https://matplotlib.org/3.5.0/index.html)
- [Scientific visualization with Python & Matplotlib](https://github.com/rougier/scientific-visualization-book/blob/master/pdf/book.pdf)
- [Documentation PyQtGraph](https://pyqtgraph.readthedocs.io/en/latest/)

---

## <h2 align="center" id='ex1'> Exemple 1 - √âquation de Van Der Waals </h2>

### üìù Contexte
En thermodynamique, l'√©quation de Wan Der Waals permet de d√©crire l'√©tat d'un fluide: 

$$
\begin{aligned}
P=\frac{RT}{{\bar{V}}-b}-\frac{a}{{\bar{V}}^2}
\end{aligned}
$$

Avec
$$
\begin{aligned}
a &=\frac{27}{64}\frac{{{T_{c}}^2}{R^2}}{P_{c}}\\
b &=\frac{{R}{T_{c}}}{{8}{P_{c}}}\\
\end{aligned}
$$

En prenant pour exemple l'hexane: 
- $R=8.314 \mathrm{{J} {mol^{‚àí1}} {K^{‚àí1}}}$ (constante des gazs parfaits)
- $T_{c}=507.5 \mathrm{K}$ (Temp√©rature critique)
- $Pc = 30.1 \times {10^5} \mathrm{Pa}$ (Pression critique)

### ‚≠ê Objectif

Afficher sur un m√™me graphique la pression $P$ pour un volume molaire $\bar{V}$ entre $10^{-4}$ et $1 m^{3}mol^{-1}$ pour des temp√©ratures √©gales √† 0.5, 0.75, 1, 1.5 et 2 fois la temp√©rature critique $T_{c}$.

### üíª Code

On commence par d√©finir les constantes et la fonction du probl√®me

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# D√©finition des constantes du probl√®me
const = {
    "R": 8.314,  # J/(K*mol)
    "T_c": 507.5,  # K
    "P_c": 30.1 * 1e5,  # Pa
}

const["a"] = 27 / 64 * (const["T_c"] ** 2 * const["R"] ** 2) / const["P_c"]
const["b"] = (const["R"] * const["T_c"]) / (8 * const["P_c"])

# Cr√©ation du vecteur qui contient les valeurs de temp√©rature
vec_T = np.array([0.5, 0.75, 1, 1.5, 2]) * const["T_c"]


def fn_van_der_waals(const, T, vec_V):
    """
    √âquation de Van der Waals sous forme intensive
    Args:
        - const: dictionnaire des constantes du probl√®me
        - T: temp√©rature en K
        - vec_V: vecteur des valeurs de V
    Returns:
        - vec_P: vecteur des valeurs de P
    """
    vec_P = const["R"] * T / (vec_V - const["b"]) - const["a"] / (vec_V**2)
    return vec_P

Pour ensuite visualiser des donn√©es, il est d'abord essentiel de comprendre la terminologie des diff√©rents √©l√©ments qui composent un graphique matplotlib.

<center>
    <img src='assets/anatomy_of_figure.png' width=500px>
</center>

Pour commencer, tra√ßons une courbe simple en prenant les valeurs √©valu√©es pour $T = 0.25*T_{c} \approx 127 K$.

In [None]:
T = 127  # K
# Discr√©tisation du volume molaire entre 0.01 et 1 avec 31 points
vec_V = np.linspace(0.01, 1, 31)
# Calcul de la pression avec notre fonction
vec_P = fn_van_der_waals(const, T, vec_V)

plt.plot(vec_V, vec_P)  # Ajout de la courbe
plt.show()  # Afficher la figure

Matplotlib est une librairie tr√®s compl√®te qui offre beaucoup d'options pour personnaliser les graphiques. En consultant la documentation officielle, on peut voir que la fonction `plt.plot` accepte plusieurs arguments optionnels pour modifier l'apparence de la courbe:

`plt.plot(<donn√©es x>,<donn√©es y>,'<couleur><marqueur><type de ligne>', linewidth=, markersize=, label=)`.

- `<couleur>` est la [couleur](https://matplotlib.org/2.0.1/api/colors_api.html) de la ligne (et des points).
- `<marqueur>` est le type de [point](https://matplotlib.org/stable/api/markers_api.html) utilis√©.
- `<type de ligne>` est le [style de ligne](https://matplotlib.org/2.0.1/api/lines_api.html#matplotlib.lines.Line2D.set_linestyle) utilis√© (pleine, tiret√©e, pointill√©s, etc...)

In [None]:
# Ajuster la taille du graphique affich√© sur le notebook
f = plt.figure(figsize=(10, 5))

# Tracer la pression en fonction du volume molaire
# ----------------------------------------------------------------------------
# 'go--' veut dire green - circle marker - dashed line
# On peut aussi rentrer ces arguments avec color='green', marker='o', linestyle='dashed'
# linewidth et markersize controlent la largeur de la ligne et la taille du marqueur en pixels
# Label= permet de donner un nom √† la courbe qui sera affich√© dans la l√©gende
plt.plot(vec_V, vec_P, "go--", linewidth=2, markersize=5, label=f"T = {T}K")

# Ajout des √©l√©ments d'un graphique
# ----------------------------------------------------------------------------
plt.title("Pression en fonction du volume molaire")  # Titre du graphique
plt.legend()  # Affiche la l√©gende
plt.xlabel(r"$\bar{V} (m^{3} mol^{-1})$")  # Titre d'axe des x en Latex
plt.ylabel("P (Pa)")  # Titre d'axe des y
plt.grid(True)  # Affiche la grille

plt.show()

Matplotlib permet aussi de tracer plusieurs courbes sur un m√™me graphique en appelant plusieurs fois la fonction `plt.plot()` avant d'afficher le graphique.

Pour notre probl√®me, un graphique avec √©chelle logarithmique en x est plus adapt√©. Avec Matplotlib, on peut utliser `plt.semilogx()` de fa√ßon analogue √† `plt.plot()`. Cependant le vecteur x doit maintenant √™tre g√©n√©r√© de fa√ßon logarithmique et pas lin√©aire comme avant. Avec numpy, cela se fait tr√®s facilement avec `np.logspace()`.

In [None]:
# Discr√©tisation logarithmique du volume molaire entre 10^-4 et 10^0
vec_V = np.logspace(-4, 0, 101, base=10)

f = plt.figure(figsize=(10, 5))

# Passer √† travers les temp√©ratures, calculer la pression pour chaque volume
# molaire et ajouter la courbe au graphique
for t in vec_T:
    P = fn_van_der_waals(const, t, vec_V)
    plt.semilogx(vec_V, P, label=f"T = {t}K")  # Ajout de la courbe

plt.title("Pression en fonction du volume molaire")
plt.legend()
plt.xlabel(r"$\bar{V} (m^{3} mol^{-1})$")
plt.ylabel("P (Pa)")
plt.xlim(1e-4, 1e0)  # Fixer les limites en x
plt.ylim(-const["P_c"], 3 * const["P_c"])  # Fixer les limites en y
plt.grid(True)

plt.show()

### üí° Astuces

- Avec Matplotlib, il y a un grand nombre d'arguments pour personnaliser un graphique. Ne jamais h√©siter √† jeter un coup d'oeil √† la documentation officielle pour se rafraichir la m√©moire sur l'utilisation d'une fonction ou pour en savoir plus. 

## <h2 align="center" id='ex1'> Exemple 2 - Donn√©es Hydro-Qu√©bec </h2>

### üìù Contexte

> L‚Äôouverture des donn√©es est devenue, en quelques ann√©es, une pratique incontournable. Gouvernements, entreprises et collectivit√©s int√®grent les donn√©es ouvertes dans leur d√©marche d‚Äôinnovation. Ce projet vise √† permettre √† des tiers de valoriser nos donn√©es afin de contribuer activement √† la transition √©nerg√©tique.

Tir√© de [Hydro-Qu√©bec](https://www.hydroquebec.com/documents-donnees/donnees-ouvertes/)

Parmis ces donn√©es, Hydro-Qu√©bec rend disponible les donn√©es en temps r√©el de demande et production d'√©lectricit√© au qu√©bec qui sont mises √† jour toutes les 15min et 1h respectivement.

Les donn√©es de [demande](https://www.hydroquebec.com/data/documents-donnees/donnees-ouvertes/json/demande.json) et de [production](https://www.hydroquebec.com/data/documents-donnees/donnees-ouvertes/json/production.json) sont sous forme JSON et accessibles depuis un URL.  

JSON est un format de donn√©es textuelles tr√®s employ√© dans la transmission de donn√©es web. Sa structure ressemble √† un dictionnaire Python: il y des cl√©s qui contiennent des objets qui peuvent √™tre des valeurs, une liste ou encore un autre dictionnaire. 

En consultant l'URL des donn√©es de demande, on voit que leur structure est:

```bash
{
  '...': ...,
  "details" : [ {
    "date" : "2022-05-21T00:00:00",
    "valeurs" : {
      "demandeTotal" : 16036.0
    }
  }, ... ]
}
```

Les donn√©es sont situ√©es dans la cl√© `details` qui contient une liste de dictionnaires avec les cl√©s `date` et `valeurs`. La cl√© `valeurs` contient un autre dictionnaire avec diff√©rentes cl√©s en fonction du type de donn√©es. Dans le cas des donn√©es de demande, il y a seulement la cl√© `demandeTotal`, avec sa valeur associ√©e, dans le dictionnaire `valeurs`. 

### ‚≠ê Objectif

Commencer par:
- Tracer un graphique √† barres avec les donn√©es de CO2 √©quivalent par kWh pour plusieurs sources d'√©lectricit√©. ([source](https://www.hydroquebec.com/a-propos/notre-energie.html))

Puis dans un seul graphique, tracer: 
- Une courbe avec la demande et la production totale d'√©lectricit√©. ([demande](https://www.hydroquebec.com/data/documents-donnees/donnees-ouvertes/json/demande.json))
- Une courbe avec l'√©volution des sources d'√©lectricit√© dans la journ√©e ([production](https://www.hydroquebec.com/data/documents-donnees/donnees-ouvertes/json/production.json))
- Un graphique circulaire des sources de l'√©lectricit√© du Qu√©bec dans la derni√®re heure. 

### üíª Code

Pour commencer, √† partir des donn√©es du site web, il faut d√©finir manuellement les donn√©es de CO2 √©quivalent dans un dictionnaire.

In [None]:
co2_eq = {
    "Hydro": 28,
    "√âolien": 14,
    "Nul√©aire": 8,
    "Solaire": 64,
    "Gaz naturel": 608,
    "Charbon": 880,
}

Pour tracer un graphique √† barres verticales on peut utiliser `plt.bar()`:

`plt.bar(<donn√©es x>, <donn√©es y>, width=, align=)`

- `donn√©es x` sont les donn√©es en x qui dans notre cas sont les sources.
- `donn√©es y` sont les donn√©es en y qui dans notre cas sont les valeurs de CO2 eq. 
- `width=` pour ajuster la largeur des barres.
- `align=` pour sp√©cifier le mode d'alignement des donn√©es en x

Pour un graphique √† barre horizontales, remplacer par `plt.barh()`.

In [None]:
# Isoler les cl√©s du dictionnaire dans une liste
sources = list(co2_eq.keys())
# Isoler les valeurs du dictionnaire dans une liste
valeurs = list(co2_eq.values())

# Afficher le graphique √† barres
plt.bar(sources, valeurs, align="center")
# plt.barh(sources, valeurs, align='center') # Pour barres horizontales
plt.show()

Pour les donn√©es de demande et production, on va d'abord √©crire une fonction qui obtenir ces donn√©es √† partir d'un url et les retourner sous une forme tabulaire.

Pour cela on va avoir besoin de 3 librairies suppl√©mentaires: `urllib` pour effectuer des requetes web, `json` pour lire les donn√©es json en dictionnaire Python et `pandas` pour cr√©er un `DataFrame`. Un `DataFrame` est une repr√©sentation tabulaire des donn√©es, leur manipulation est introduite plus en d√©tail dans le th√®me 4.

In [None]:
from urllib.request import urlopen
import json
import pandas as pd

# Creation des dictionnaire pour les donn√©es de demande et production
demande = {"url": "https://www.hydroquebec.com/data/documents-donnees/donnees-ouvertes/json/demande.json", "df": []}
production = {
    "url": "https://www.hydroquebec.com/data/documents-donnees/donnees-ouvertes/json/production.json",
    "df": [],
}


def hydroquebec_json_details(url):
    """
    Fonction qui √† partir d'un url des donn√©es ouvertes de Hydro Qu√©bec, retourne les donn√©es sous une forme tabulaire.
    Args:
        - url: URL o√π se trouve le fichier JSON
    Returns:
        - DataFrame: tableau des donn√©es
    """
    # R√©cup√©rer le fichier JSON √† partir de l'url
    with urlopen(url) as u:
        raw_data = json.loads(u.read().decode())

    # Modification de la structure de la liste de dictionnaires. On passe de √ßa:
    # [ {
    #     "date" : "2022-05-21T00:00:00",
    #     "valeurs" : {
    #       "demandeTotal" : 16036.0
    #     }
    #   }, ... ]
    #
    # √† cela:
    # [ {
    #     "date" : "2022-05-21T00:00:00",
    #     "demandeTotal" : 16036.0
    #   }, ... ]
    #
    data = [{"date": np.datetime64(x["date"]), **x["valeurs"]} for x in raw_data["details"]]

    # Cr√©er un DataFrame √† partir de la liste des dictionnaires
    df = pd.DataFrame(data)

    # Retourner uniquement les lignes du DataFrame qui ont une valeur
    # Cela est n√©c√©ssaire car le JSON d'Hydro Qu√©bec contient des lignes pour des dates du futur donc qui n'ont pas
    # encore de valeur.
    return df[~df.isna().any(axis=1)]


# Obtention des donn√©es avec notre fonction
demande["df"] = hydroquebec_json_details(demande["url"])
production["df"] = hydroquebec_json_details(production["url"])

Matplotlib permet plusieurs fa√ßons de tracer plusieurs graphiques dans une seule figure. L'une de ces m√©thodes est `plt.subplot_mosaic()`, elle permet de d√©finir la position de chaque graphique en utilisant une notation matricielle. Par exemple, si l'on veut 2 graphiques l'un au dessus de l'autre √† gauche et un seul √† droite on peut faire: `plt.subplot_mosaic([['A', 'C'],['B', 'C']])` avec 'A', 'B et 'C' les noms des graphiques.

Pour tracer un diagramme circulaire avec Matplotlib, on emploie `plt.pie`. 

In [None]:
import matplotlib.dates as mdates

# Initialiser la figure avec 3 graphiques
# 'A' va √™tre les courbes de demande et production
# 'B' va √™tre les courbes d'√©volution des sources d'√©nergie'
# 'C' va √™tre le diagramme circulaire des derni√®res donn√©es des sources d'√©nergie
# -------------------------------------------------------------------------------------------------
fig, axs = plt.subplot_mosaic([["A", "C"], ["B", "C"]], constrained_layout=True, figsize=(15, 7))

# Graphique A
# -------------------------------------------------------------------------------------------------
axs["A"].plot(demande["df"]["date"], demande["df"]["demandeTotal"], label="demande")  # Courbe de demande
axs["A"].plot(production["df"]["date"], production["df"]["total"], label="production")  # Courbe de production
axs["A"].legend()  # Afficher la l√©gende
axs["A"].xaxis.set_major_formatter(mdates.DateFormatter("%m/%d - %H:%M:%S"))  # Formatage des dates
axs["A"].xaxis.set_tick_params(rotation=30)  # Rotation des dates
axs["A"].set_ylabel("√ânergie (MW)")  # Titre d'axe des y
axs["A"].grid(True)  # Afficher la grille

# Graphique B
# -------------------------------------------------------------------------------------------------
sources = ["hydraulique", "eolien", "autres", "solaire", "thermique"]  # Sources d'√©nergie
# Ajouter courbe pour chaque source d'√©nergie
for source in sources:
    axs["B"].plot(production["df"]["date"], production["df"][source], label=source)
axs["B"].legend(loc="center right")  # Afficher la l√©gende avec une position (loc) fix√©e au milieu √† droite
axs["B"].xaxis.set_major_formatter(mdates.DateFormatter("%m/%d - %H:%M:%S"))
axs["B"].xaxis.set_tick_params(rotation=30)
axs["B"].set_ylabel("√ânergie (MW)")
axs["B"].grid(True)

# Graphique C
# -------------------------------------------------------------------------------------------------
# Pour ce graphique, on a besoin des derni√®res donn√©es pour chaque source d'√©nergie, ce qui correspond √† la derni√®re ligne du tableau.
# Seules les sources avec une production sup√©rieures √† 100 MW sont prises en compte.
src = production["df"].iloc[-1]  # Selectionner la derni√®re ligne du tableau
last_src = src[sources][src[sources] > 100]  # Selectionner les sources avec une production sup√©rieures √† 100 MW
# Ajouter le diagramme circulaire
explode = [0.1] * len(last_src.values)  # Liste de d√©calage pour chaque morceau du diagramme
axs["C"].pie(last_src.values, labels=last_src.index, explode=explode, autopct="%1.1f%%")  # Diagramme circulaire
axs["C"].set_title(f"Sources d'√©nergie \n {src['date']}")  # Titre du graphique

# Affichage de la figure
# -------------------------------------------------------------------------------------------------
plt.show()

## <h2 align="center" id='lexique'> Lexique </h2>

### üìö Terminologie

### ‚úîÔ∏è Vu dans l'exemple 1

