# Chapitre 9 : visualisation de données

## [Documentation Matplotlib](https://matplotlib.org/)

## [Gallerie Matplotlib](https://matplotlib.org/stable/gallery/index.html)

## Objectif principal : aider la prise de décisions

## Package **Matplotlib**

## Importer le module pyplot

**Exemple :**
```python
import matplotlib.pyplot as plt
```

**NOTE :** il faut installer la package **Matplotlib** depuis **Anaconda**.

## Un premier exemple

### Principales étapes :
1. Créer une **`figure`**.
2. Donner un titre avec la méthode **[`title()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.title.html)**.
3. Afficher les données avec la fonction **[`plot()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html)** (ou similaire).
**Signature :** `plot(x, y, format)`

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

plt.figure()
plt.title("My first graph!")
plt.plot(np.random.randn(1000), np.random.randn(1000), ".")
```

### ==================== EXERCICE ====================
1. Exécuter l'exemple donné précédemment.
2. Que se passe-t-il si on omet le paramètre x ?
3. Que se passe-t-il si les paramètres `x` et `y` ne contiennent pas le même nombre d'éléments ?

### ==================== SOLUTION ===================

### ==============================================

## Créer des sous-graphes : les [`subplot`s](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.subplot.html)
### Signature : `subplot(nrows, ncols, index)`

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

plt.figure()
plt.subplot(2,3,1)
plt.title("Subplot #1")
plt.plot(np.random.randn(200))
plt.subplot(2,3,2)
plt.title("Subplot #2")
plt.plot(np.random.randn(200), "o-r")
plt.subplot(2,3,3)
plt.title("Subplot #3")
plt.plot(np.random.randn(200), "v--g")
plt.subplot(2,3,4)
plt.title("Subplot #4")
plt.plot(np.random.randn(200), ">:g")
plt.subplot(2,3,5)
plt.title("Subplot #5")
plt.plot(np.random.randn(200), "-r")
plt.subplot(2,3,6)
plt.title("Subplot #6")
plt.plot(np.random.randn(200), "b")
```

**NOTE :** la fonction **[`plot()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html)** peut aussi prendre un paramètre pour spécifier le format des lignes affichées. Ce format est `[marker][line][color]`. Voir la documentation de la fonction [`plot()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html)

### ==================== EXERCICE ====================
1. Exécuter l'exemple donné précédemment.
2. Expérimenter avec les différents formats possibles.

### ==================== SOLUTION ===================

### ==============================================

## Utiliser des styles
### Le dictionnaire `plt.style.available`
### La fonction `plt.style.use()`

**Exemple :**
```python
# Show available styles
print(plt.style.available)

# Use the chosen style
plt.style.use('seaborn-whitegrid')
```

### ==================== EXERCICE ====================
1. Utiliser les exemples précédents et changer le style d'affichage.
2. En utilisant `plt.style.available`, écrire une fonction qui affiche une `figure` pour les 10 derniers styles disponibles.

**NOTE :** si vous souhaitez afficher plus de 20 graphiques à la fois, vous recevez un warning car la mémoire consommée pourrait être trop importante.

### ==================== SOLUTION ===================

### ==============================================

## Les labels sur les axes : [`xlabel()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.xlabel.html) et [`ylabel()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.ylabel.html)

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

plt.style.use("seaborn-talk")
plt.figure()        
plt.title("Graph with Labels")
plt.xlabel("X")
plt.ylabel("Y")
plt.plot(np.random.randn(200))
```

### ==================== EXERCICE ====================
1. Exécuter l'exemple précédent.
2. Expérimenter.

### ==================== SOLUTION ===================

### ==============================================

## Plusieurs `plot()` par graphique

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

plt.style.use("seaborn-talk")
plt.figure()        
plt.title("Graph with several plot()")
plt.xlabel("X")
plt.ylabel("Y")
plt.plot(np.random.randn(200), ".r:", label="Data 1")
plt.plot(np.random.randn(200), "^g:", label="Data 2")
plt.plot(np.random.randn(200), "ob:", label="Data 3")
```

### ==================== EXERCICE ====================
1. Exécuter l'exemple précédent.
2. Expérimenter.

### ==================== SOLUTION ===================

### ==============================================

## Graphiques avec légende : la fonction **[`legend()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.legend.html)**
- Ajouter des labels aux courbes.
- Appeler la fonction `legend()`

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

plt.style.use("seaborn-talk")
plt.figure()        
plt.title("Graph with Legend")
plt.xlabel("X")
plt.ylabel("Y")
plt.plot(np.random.randn(200), ".r:", label="Data 1")
plt.plot(np.random.randn(200), "^g:", label="Data 2")
plt.plot(np.random.randn(200), "ob:", label="Data 3")
plt.legend()
```

### ==================== EXERCICE ====================
1. Exécuter l'exemple précédent.
2. Expérimenter.

### ==================== SOLUTION ===================

### ==============================================

## Exporter un graphique : la fonction **[`savefig()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.savefig.html)**

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

plt.style.use("seaborn-talk")
plt.figure()        
plt.title("Graph with Legend")
plt.xlabel("X")
plt.ylabel("Y")
plt.plot(np.random.randn(200), ".r:", label="Data 1")
plt.plot(np.random.randn(200), "^g:", label="Data 2")
plt.plot(np.random.randn(200), "ob:", label="Data 3")
plt.legend()

plt.savefig("RESULTS/chap9_results.svg")
```

### ==================== EXERCICE ====================
1. Exécuter l'exemple précédent.
2. Expérimenter en utilisant les paramètres `dpi`, `transparent` et en changeant l'extension du fichier de sortie.

### ==================== SOLUTION ===================

### ==============================================

## Les nuages de points : la fonction **[`scatter()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.scatter.html#matplotlib.pyplot.scatter)**

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

plt.style.use("seaborn-talk")
plt.figure()
plt.title("Graph with points")
plt.xlabel("X")
plt.ylabel("Y")

X = np.random.randn(200)
Y = np.random.randn(200)

plt.scatter(X, Y)
```

### ==================== EXERCICE ====================
1. Exécuter l'exemple précédent.
2. Expérimenter en utilisant les paramètres `dpi`, `transparent` et en changeant l'extension du fichier de sortie.

### ==================== SOLUTION ===================

### ==============================================

## **[`scatter()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.scatter.html#matplotlib.pyplot.scatter)** avec couleurs et tailles variables


### On utilise la fonction **[`get_cmap()`](https://matplotlib.org/stable/tutorials/colors/colormaps.html)**

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

plt.style.use("seaborn-talk")
plt.figure()
plt.title("Graph with Points")
plt.xlabel("X")
plt.ylabel("Y")

X = np.random.randn(200)
Y = np.random.randn(200)*100

# NOTE: we use random.random here to make sure values are > 0 and we rescale
S = np.random.random(200)*250

# We use a colormap and we pass an array-like variable storing indexes to this colormap
colormap = plt.get_cmap("plasma")
colors = np.random.random(200)*500

plt.scatter(X, Y, s=S, c=colors, cmap=colormap)
plt.colorbar()
```

### ==================== EXERCICE ====================
1. Exécuter l'exemple précédent.
2. Expérimenter.

### ==================== SOLUTION ===================

### ==============================================

## Graphique en bâtons : la fonction **[`bar()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.bar.html)**

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

plt.style.use("seaborn-talk")
plt.figure()
plt.title("Graph with Bars")
plt.xlabel("X")
plt.ylabel("Y")

X = range(8)
Y = np.random.randn(8)*100

# We change the labels on X axis
plt.xticks(X, ["Label 1", "Label 2", "Label 3", "Label 4", "Label 5", "Label 6", "Label 7", "Label 8"])

# Colors
C = ["blue", "red", "green", "orange", "yellow", "purple", "black", "pink"]
plt.bar(X, Y, color=C)
```

### ==================== EXERCICE ====================
1. Exécuter l'exemple précédent.
2. Expérimenter.

### ==================== SOLUTION ===================

### ==============================================

## Le pie chart : la fonction **[`pie()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.pie.html)**

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

V = [500, 250, 150, 70, 30]
L = ["Label 1", "Label 2", "Label 3", "Label 4", "Label 5"]

plt.figure()
plt.title("Pie Graph")

plt.pie(V, labels=L, autopct='% 1.1f%%')
```

### ==================== EXERCICE ====================
1. Exécuter l'exemple précédent.
2. Expérimenter.

### ==================== SOLUTION ===================

### ==============================================

## L'histogramme : la fonction **[`hist()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html)**

1. Découpe l'espace possible des valeurs en **`bins`** intervalles de même taille.
2. Pour chaque intervalle, compte le nombre d'occurences.

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

plt.figure()
plt.title("Histogram")
plt.xlabel("X")
plt.ylabel("Y")

X = np.random.randn(1000000)*10

plt.hist(X, bins=1000)
```

### ==================== EXERCICE ====================
1. Exécuter l'exemple précédent.
2. Expérimenter. En particulier, modifier le nombre de valeurs générées ainsi que le paramètre `bins`.

### ==================== SOLUTION ===================

### ==============================================

## Afficher une "image" : la fonction **[`imshow()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.imshow.html)**

**Exemple :**
```python
import matplotlib.pyplot as plt
import numpy as np

image_path = "medias/The_Shawshank_Redemption_1994.jpg"

# Load image
movie_poster = plt.imread(image_path)

plt.figure()
plt.title("Image RGB")
plt.imshow(movie_poster)
```

### ==================== EXERCICE ====================
1. Exécuter l'exemple précédent.
2. Comment afficher les images des composantes Rouge, Vert et Bleue ?

### ==================== SOLUTION ===================

### ==============================================

## Et bien d'autres encore...

### [Gallerie Matplotlib](https://matplotlib.org/stable/gallery/index.html)

In [32]:

%%html
<iframe src="https://matplotlib.org/stable/gallery/index.html" width="1200" height="1000"></iframe>