# Extensions

Il existe un certain nombre d'extensions qui reposent sur matplotlib et offrent des facilités pour définir des visualisations. La liste qui suit n'est bien évidemment pas exhaustive.

- Seaborn : Seaborn est une surcouche de pyplot qui facilite la mise en place de visualisation de données statistiques. https://seaborn.pydata.org
- ggplot : ggplot est le portage sous python de ggplot2, une des bibliothèques de visualisation de données les plus utilisées dans le langage R. http://ggplot.yhathq.com/
- Altair :  Altair est une bibliothèque permettant de créer des visualisations au format Vega.json. Ces visualisations sont ensuite rendues par l'intermédiaire de bibliothèques JavaScript prenant en charge ce format. https://altair-viz.github.io
- Bokeh : Bokeh est une bibliothèque complète permettant de réaliser des visualisations complexes. https://bokeh.pydata.org/ https://bokeh.pydata.org/en/latest/docs/gallery.html
- Folium : Folium est une bibliothèque python utilisant Leaflet pour l'affichage de données géographiques. Elle permet en particulier de visualiser des cartographies définies sous OpenStreetMap. https://folium.readthedocs.io/en/latest/index.html

Nous ne sommes bien évidemment pas exhaustif, et il existe de nombreux outils libres et commerciaux avec des supports pour différents langage de programmation.

Nous ne rentrerons pas en détail dans la desriptions de toutes ces bibliothèques, chacune répondant à des besoins particuliers.

## Les styles de matplotlib

matplotlib est livré avec différents styles qui définissent chacun des réglages par défaut associés aux fonctionnalités de `pyplot`.

In [None]:
%matplotlib notebook
import matplotlib.pyplot as plt

plt.style.available

La sélection d'un style particulier est réalisé par `pyplot.style.use`.

In [None]:
plt.style.use('fivethirtyeight')

import numpy as np

x = np.arange(10)
y = x**2

plt.plot(x,y)
plt.plot(x,x)

## Pandas

En premier lieu, nous revenons brièvement sur les fonctionnalités de visualisation offertes par pandas.

In [None]:
import pandas as pd

df = pd.DataFrame({'A' : np.random.randn(365).cumsum(0),
                   'B' : np.random.randn(365).cumsum(0)+20,
                   'C' : np.random.randn(365).cumsum(0)-20,
                   'D' : np.random.randn(365).cumsum(0)+40},
                 index = pd.date_range(1/1/2018,periods = 365))
df

In [None]:
df[['A','C']].plot()

In [None]:
df.plot('A','B',kind='scatter')
df.plot('A','B',kind='line')
df.plot('A', kind='hist')


In [None]:
df.plot.scatter('A','C')
df.plot.scatter('A','C', c='B', s=(df['D']-df['D'].min()+3)*3)
df.plot.scatter('A','C', c='B', s=(df['D']-df['D'].min()+3)*3, colormap = 'viridis')

In [None]:
ax = df.plot.scatter('A','C', c='B', s=(df['D']-df['D'].min()+3)*3, colormap = 'viridis')
ax .set_aspect('equal')

In [None]:
df.plot.box()

In [None]:
df.plot.hist(alpha=0.3)
df.plot.hist(stacked=True)
df.plot.hist(bins=30,alpha=0.3)

In [None]:
df.plot.kde()

In [None]:
iris = pd.read_csv('iris.csv')
iris.head()

In [None]:
pd.plotting.scatter_matrix(iris)

In [None]:
plt.figure()
pd.plotting.parallel_coordinates(iris,'species')