<br>
<div align="right">Enseignant : Aric Wizenberg</div>
<div align="right">E-mail : icarwiz@yahoo.fr</div>
<div align="right">Année : 2018/2019</div><br><br><br>
<div align="center"><span style="font-family:Lucida Caligraphy;font-size:32px;color:darkgreen">Master 2 MASERATI - Cours de Python</span></div><br><br>
<div align="center"><span style="font-family:Lucida Caligraphy;font-size:24px;color:#e60000">Graphiques complexes</span></div><br><br>
<hr>

# Paramétrage

In [None]:
%matplotlib

Dès qu'on veut pouvoir afficher des graphiques un peu plus complexes sous Python, il faut utiliser le sous-module externe matplotlib.pyplot. On peut en profiter pour définir la taille de graphique par défaut, et plein d'autres paramètres graphiques par défaut

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# pour définir la taille par défaut des graphs (optionnel, au format largeur, hauteur)
plt.rcParams['figure.figsize'] = (8, 6) 

In [None]:
df = pd.read_pickle('../output/Output_GFLT.pickle')

In [None]:
df_ts_train = pd.read_csv('../data/bike_share.csv')

In [None]:
df_ts_train.datetime = pd.to_datetime(df_ts_train.datetime)
df_ts_train = df_ts_train.set_index('datetime')

In [None]:
df_ts_test = pd.read_csv('../data/bike_share_test.csv')
df_ts_test.datetime = pd.to_datetime(df_ts_test.datetime)
df_ts_test = df_ts_test.set_index('datetime')

In [None]:
df_ts = pd.concat((df_ts_train, df_ts_test), sort=True)
df_ts = df_ts.sort_index()

In [None]:
df_iris = pd.read_csv('../data/iris_data.csv')

In [None]:
df_iris.head()

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://matplotlib.org/users/customizing.html#matplotlib-rcparams> Doc officielle Matplotlib : <b>les rcParams</b> </a></div>

# Plusieurs séries sur une seule figure 

## Plusieurs graphs différents

In [None]:
df.price.plot.hist(bins=100, density=True)
df.price.plot.density()

In [None]:
df_ts.temp.plot()
df_ts.humidity.plot()

## Plusieurs couleurs sur une seule figure

In [None]:
for elem in df_iris['class'].unique():
    plt.plot(
        df_iris[df_iris['class'] == elem].petal_length, 
        df_iris[df_iris['class'] == elem].petal_width, 
        '+'
    )
    
plt.legend(df_iris['class'].unique())

In [None]:
colors = df_iris['class'].map({
    'Iris-setosa' : 'red', 
    'Iris-versicolor' : 'blue', 
    'Iris-virginica' : 'green'
})

pd.plotting.scatter_matrix(
    df_iris, 
    figsize=(16,9), 
    color=colors
);

# Graphs complexes

## Initialisation

In [None]:
vary1 = 'temp'
vary2 = 'humidity'

## Graphs

In [None]:
fig, ax = plt.subplots()

plt.plot(df_ts[vary1].rolling(24, center=True).mean())
plt.plot(df_ts[vary2].rolling(24, center=True).mean())

## Points

In [None]:
points = [
    (df_ts.temp.idxmin(), df_ts.temp.min(), 'bo'),
    (df_ts.temp.idxmax(), df_ts.temp.max(), 'ro'),
]


for point in points:
    plt.plot(*point)

## Lignes

##### Verticales

In [None]:
plt.axvline('2012-01-01 00:00:00', c='black')

##### Horizontales

In [None]:
plt.axhline(df_ts.temp.max(), c='r', linestyle='--')
plt.axhline(df_ts.temp.min(), c='b', linestyle='--')

## Annotations

##### Etiquettes d'axe

In [None]:
plt.xlabel('Date')
plt.ylabel(f'{vary1} et {vary2}')

##### Titre

In [None]:
plt.title(f'Evolution temporelle de {vary1} et {vary2}', fontsize=15)

##### Annotations sur graph

In [None]:
try:
    plt.text(
        df_ts.index[0],
        df_ts.temp.max() + 1,
        'Max temp',
    )
except TypeError:
    pass

In [None]:
try:
    plt.text(
        df_ts.index[0],
        df_ts.temp.min() + 1,
        'Min temp',
    )
except TypeError:
    pass

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <br>
<a href=https://matplotlib.org/users/text_intro.html> Tutorial rapide sur les <b>Annotations sous Matplotlib</b> </a><br>
<a href=https://matplotlib.org/tutorials/text/annotations.html> Tutorial plus complet sur les <b>Annotations sous Matplotlib</b> </a>
</div>

## Légende

La légende se crée et se positionne automatiquement

In [None]:
plt.legend()

On peut aussi spécifier une position

In [None]:
plt.legend(loc=1)

Voici les différentes valeurs de localisation possibles

|pos verticale|gauche|centre|droite|
|---|---|---|---|
|haut|2|9|1|
|milieu|6|10|7|
|bas|3|8|4|

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://matplotlib.org/users/legend_guide.html> Doc officielle des <b>légendes sous Matplotlib</b> </a></div>

## Interaction avec ces éléments

On peut facilement interagir avec tous ces différents éléments, mais alors il faut penser à les assigner au préalable à une variable lors de leur création...

In [None]:
ma_ligne = plt.axhline(15, linestyle='--', c='green')

On peut alors modifier une de ses propriétés en faisant appel aux méthodes **set\_\*** de cet objet

In [None]:
ma_ligne.set_color('yellow')

In [None]:
ma_ligne.set_ydata([25, 25])

On peut voir les valeurs actuelles en utilisant les méthodes **get\_\*** correspondantes

In [None]:
ma_ligne.get_ydata()

In [None]:
ma_ligne.set_ydata(np.array(ma_ligne.get_ydata()) + 2)

Ou en supprimant puis recréant l'élément ensuite

In [None]:
ma_ligne.remove()

In [None]:
ma_ligne = plt.axhline(df_ts.temp.mean(), linestyle='--', c='green')

# Plusieurs graphs sur un seul tableau de bord

Il faut d'abord créer une figure (l'ensemble) et des axes (les graphs)

In [None]:
fig, axes = plt.subplots(3, 1, sharex=True)

Puis on peut ensuite utiliser les axes pour ajouter des représentations graphiques

In [None]:
axes[0].plot(df_ts['temp'], c='red')
axes[1].plot(df_ts['humidity'], c='blue')
axes[2].plot(df_ts['count'], c='green')

Et des éléments supplémentaires

In [None]:
axes[0].set_title('Température', fontsize=8)
axes[1].set_title('Humidité', fontsize=8)
axes[2].set_title('Utilisations', fontsize=8)

Et utiliser la figure elle-même pour personnaliser le cadre général

In [None]:
fig.suptitle('Mes graphs', fontsize=16)

Ou encore pour enregistrer la figure

In [None]:
fig.savefig('../output/figure.png')

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://matplotlib.org/tutorials/introductory/sample_plots.html> Tutorial bien fait <b>sur Matplotlib</b> </a></div>

# Scatter plots en 3D

In [None]:
from mpl_toolkits.mplot3d import Axes3D
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')

In [None]:
for elem in df_iris['class'].unique():
    ax.scatter(
        df_iris[df_iris['class'] == elem].petal_length, 
        df_iris[df_iris['class'] == elem].petal_width,
        df_iris[df_iris['class'] == elem].sepal_length, 
        marker='+'
    )
    
fig.legend(df_iris['class'].unique())

ax.set_xlabel('petal_length')
ax.set_ylabel('petal_width')
ax.set_zlabel('sepal_length')

<div class="alert alert-block alert-info"><b>Pour aller plus loin :</b> <a href=https://matplotlib.org/mpl_toolkits/mplot3d/tutorial.html> Doc officielle de <b>mplot3d</b> </a></div>

# Autres modules pour les graphs

Il existe plusieurs autres modules Python permettant de faire des représentations graphiques

**Bokeh** et **Plotely Dash** permettent de faire des graph interactifs et même de les intégrer facilement dans un site web. Les deux sont équivalents dans l'usage

https://bokeh.pydata.org/en/latest/

https://bokeh.pydata.org/en/latest/docs/gallery.html

https://bokeh.pydata.org/en/latest/docs/user_guide.html

https://dash.plot.ly/

https://dash.plot.ly/gallery

**Datashader** peut être utile pour la représentation graphique de très grosses quantités d'éléments sur un graph

http://datashader.org/

http://datashader.org/getting_started/index.html

**Holoviews** permet une utilisation facilitée des autres modules de visualisation

http://holoviews.org

http://holoviews.org/gallery/index.html

http://holoviews.org/user_guide