# **<h1><center><span style="color:#3775a8"><u>SORBONNE DATA ANALYTIC : Data Visualization</u></span></center></h1>**
# **<span style="color:#3775a8">Découverte de Matplotlib et Seaborn</span>**

**Bienvenue dans ce module !**

Matplotlib et Seaborn sont les librairies les plus utilisées pour la data visualisation en Python.

Matplotlib est un package que l'on appelle bas niveau dans le sens où il est possible de tout visualiser. Seaborn est une couche utilisant matplotlib et permet de faire des plots parfois plus simplement. Connaître l'ensemble des fonctions et paramètres qui existent dans ces packages serait vraiment difficile donc le plus important est de comprendre coment ils fonctionnent afin de savoir comment trouver l'information que vous rechercherez dans la documentation et/ou sur internet.

Vous allez voir dans cette formation comment faire différents types de plots qui appellent plusieurs fonctions différentes afin d'avoir une première pratique de ces packages pour **visualiser vos données**.

Avant toutes choses, voici les packages et les versions que j'utilise: 
- numpy==1.19.1
- pandas==1.1.0
- matplotlib==3.3.4
- seaborn==0.11.0

**Attention**, si vous n'avez pas strictement les même, il est possible que vos output ne soient pas exactement les mêmes !

## **<span style="color:#3775a8">0. Importer les packages</span>**

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.patches import Patch
from matplotlib.lines import Line2D
import matplotlib.dates as mdates
import seaborn as sns

## **<span style="color:#3775a8">1. Bar Plot avec matplotlib</span>**

Voici les données que nous allons utiliser:

In [None]:
data = {'company': ['Barton LLC', 'Frami, Hills and Schmidt', 'Fritsch, Russel and Anderson', 'Jerde-Hilpert', 'Keeling LLC', 'Koepp Ltd', 'Kulas Inc', 'Trantow-Barrows', 'White-Trantow', 'Will LLC'], 'ventes': [109438.50, 98031.76, 112214.71, 112591.43, 94501.30, 103660.54, 137351.96, 123381.38, 135841.99, 104437.60]}
df = pd.DataFrame.from_dict(data)
df = df.sort_values(by='ventes', ascending=True)
df

In [None]:
# Définissez votre figure et votre Axes:
fig1, ax = plt.subplots()
# Définissez le type de visualisation, à savoir un barplot horizontal:
ax.barh(y= df['company'], width= df['ventes'])
# Vous obtenez le barplot par défaut suivant:
plt.show()

In [None]:
# Rajoutez à présent une ligne verticale montrant la moyenne des ventes, pour cela, il faut la calculer:
moyenne_ventes = df['ventes'].mean()

fig1, ax = plt.subplots()
ax.barh(y= df['company'], width= df['ventes'])
# Puis utiliser le paramètre axvline:
ax.axvline(moyenne_ventes, color='#058ED9')
# Rajoutez également un titre à l'Axe ainsi qu'un label aux axis:
ax.set_title('Classement des ventes', loc= 'center', fontsize=16)
ax.set_ylabel('Companies', fontsize=15)
ax.set_xlabel('Ventes', fontsize=15)
plt.show()

In [None]:
# Agrémentez l'Axe par:
moyenne_ventes = df['ventes'].mean()

fig1, ax = plt.subplots()
ax.barh(y= df['company'], width= df['ventes'])

ax.axvline(moyenne_ventes, color='#058ED9')
ax.set_title('Classement des ventes', loc= 'center', fontsize=16)
ax.set_ylabel('Companies', fontsize=15)
ax.set_xlabel('Ventes', fontsize=15)

# Une grille mais seulement sur l'axis des x:
ax.grid(b=True, which='major', axis='x')
# Supprimer les bordures:
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.spines['bottom'].set_visible(False)
ax.spines['left'].set_visible(False)

plt.show()

In [None]:
# Changez le format de l'axe des abscisses afin que ce soit en k€:
# Pour cela, il faut d'abord créer une fonction:
def currency(x, pos):
    """The two args are the value and tick position"""
    if x >= 1e6:
        s = '{:1.1f}M€'.format(x*1e-6)
    else:
        s = '{:1.0f}K€'.format(x*1e-3)
    return s

moyenne_ventes = df['ventes'].mean()

fig1, ax = plt.subplots()
ax.barh(y= df['company'], width= df['ventes'])

ax.axvline(moyenne_ventes, color='#058ED9')
ax.set_title('Classement des ventes', loc= 'center', fontsize=16)
ax.set_ylabel('Companies', fontsize=15)
ax.set_xlabel('Ventes', fontsize=15)

ax.grid(b=True, which='major', axis='x')
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.spines['bottom'].set_visible(False)
ax.spines['left'].set_visible(False)
# Puis l'appliquer sur l'axe des abscisses:
ax.xaxis.set_major_formatter(currency)

plt.show()

In [None]:
# A présent il serait intéressant de distinguer les entreprises en plusieurs groupes selon le montant des ventes et de leur assigner une couleur en fonction de seuils:
clrs = ['#E1DAAE' if (x >= 120000) else '#CC2D35' if (x < 100000) else '#FF934F' for x in df['ventes']]

def currency(x, pos):
    """The two args are the value and tick position"""
    if x >= 1e6:
        s = '{:1.1f}M€'.format(x*1e-6)
    else:
        s = '{:1.0f}K€'.format(x*1e-3)
    return s

moyenne_ventes = df['ventes'].mean()

fig1, ax = plt.subplots()
# Vous spécifiez la liste de couleur obtenue ci-dessus dans le paramètre color de barh:
ax.barh(y= df['company'], width= df['ventes'], color=clrs)

ax.axvline(moyenne_ventes, color='#058ED9')
ax.set_title('Classement des ventes', loc= 'center', fontsize=16)
ax.set_ylabel('Companies', fontsize=15)
ax.set_xlabel('Ventes', fontsize=15)

ax.grid(b=True, which='major', axis='x')
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.spines['bottom'].set_visible(False)
ax.spines['left'].set_visible(False)
ax.xaxis.set_major_formatter(currency)

plt.show()

In [None]:
# Dernier point, il faut créer une légende.
# Vous verrez que cela peut être fait automatiquement dans certains cas mais ici, voyez comment cela est fait manuellement:

clrs = ['#E1DAAE' if (x >= 120000) else '#CC2D35' if (x < 100000) else '#FF934F' for x in df['ventes']]

def currency(x, pos):
    """The two args are the value and tick position"""
    if x >= 1e6:
        s = '{:1.1f}M€'.format(x*1e-6)
    else:
        s = '{:1.0f}K€'.format(x*1e-3)
    return s

moyenne_ventes = df['ventes'].mean()

fig1, ax = plt.subplots()
ax.barh(y= df['company'], width= df['ventes'], color=clrs)

# Création d'une liste d'objets servant à la légende composée de plusieurs éléments de matplotlib:
legend_elements = [Patch(color='#E1DAAE', label='Montant >= 120K€'),
                   Patch(color='#FF934F', label='Montant >= 100K€ & < 120K€'),
                   Patch(color='#CC2D35', label='Montant < 100K€'),
                   Line2D([0], [0], color='#058ED9', lw=4, label='Montant moyen: {moyenne}K€'.format(moyenne = np.round((moyenne_ventes/1000), 2)))]
#Pour voir l'output legend_elements , vous pouvez en faire un print: print(legend_elements)
# Vous ajoutez la liste précédente dans l'Axe legend:
ax.legend(handles=legend_elements, loc='center left', bbox_to_anchor= (1.04, 0.5), ncol=1, borderaxespad=0, frameon=False)

ax.axvline(moyenne_ventes, color='#058ED9')
ax.set_title('Classement des ventes', loc= 'center', fontsize=16)
ax.set_ylabel('Companies', fontsize=15)
ax.set_xlabel('Ventes', fontsize=15)

ax.grid(b=True, which='major', axis='x')
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.spines['bottom'].set_visible(False)
ax.spines['left'].set_visible(False)
ax.xaxis.set_major_formatter(currency)

plt.show()

Bravo ! Vous venez de voir comment faire pas à pas votre premier bar plot horizontal. 

L'objectif est que vous repreniez les différentes étapes et que vous testiez les différents paramètres pour comprendre leurs rôles.

## **<span style="color:#3775a8">2. Line Plot avec matplotlib</span>**

Voici les données que nous allons utiliser:

In [None]:
data2 = {'company': ['Blue Iron', 'Blue Iron', 'Blue Iron', 'Blue Iron', 'Blue Iron', 'Sodring', 'Sodring', 'Sodring', 'Sodring', 'Sodring', 'Gouslat', 'Gouslat', 'Gouslat', 'Gouslat', 'Gouslat', 'Purvell LLC', 'Purvell LLC', 'Purvell LLC', 'Purvell LLC', 'Purvell LLC', 'Camply', 'Camply', 'Camply', 'Camply', 'Camply'], 
         'evolution': [100, 100.6, 101.3, 103.2, 106.8, 100, 102.1, 102.9, 103.4, 105.6, 100, 101, 101.8, 102.5, 102.9, 100, 99.2, 98.0, 97.5, 97.2, 100, 99.5, 99.2, 100.8, 102.4], 
         'date': ['2021-03-01', '2021-04-01', '2021-05-01', '2021-06-01', '2021-07-01', '2021-03-01', '2021-04-01', '2021-05-01', '2021-06-01', '2021-07-01', '2021-03-01', '2021-04-01', '2021-05-01', '2021-06-01', '2021-07-01', '2021-03-01', '2021-04-01', '2021-05-01', '2021-06-01', '2021-07-01', '2021-03-01', '2021-04-01', '2021-05-01', '2021-06-01', '2021-07-01']}
df2 = pd.DataFrame.from_dict(data2)
df2['date'] = pd.to_datetime(df2['date'])
df2

In [None]:
# Pivot de la base:
df2_p = pd.DataFrame(df2.pivot(index='date', columns = 'company', values='evolution').to_records())
df2_p

In [None]:
# Compte tenu qu'il y a plusieurs entreprises dans la base, il faut créer plusieurs lignes:
fig2, ax = plt.subplots()
ax.plot(df2_p.date, df2_p['Blue Iron'], color='#6FDE6E', label='Blue Iron')
ax.plot(df2_p.date, df2_p['Sodring'], color='#FF4242', label='Sodring')
ax.plot(df2_p.date, df2_p['Gouslat'], color='#A691AE', label='Gouslat')
ax.plot(df2_p.date, df2_p['Purvell LLC'], color='#235FA4', label='Purvell LLC')
ax.plot(df2_p.date, df2_p['Camply'], color='#0A284B', label='Camply')

plt.show()

In [None]:
# Rajoutez une legend automatiquement
fig2, ax = plt.subplots()
ax.plot(df2_p.date, df2_p['Blue Iron'], color='#6FDE6E', label='Blue Iron')
ax.plot(df2_p.date, df2_p['Sodring'], color='#FF4242', label='Sodring')
ax.plot(df2_p.date, df2_p['Gouslat'], color='#A691AE', label='Gouslat')
ax.plot(df2_p.date, df2_p['Purvell LLC'], color='#235FA4', label='Purvell LLC')
ax.plot(df2_p.date, df2_p['Camply'], color='#0A284B', label='Camply')

# Grace au fait que le label ait été spécifié lors dans ax.plot, la légende se créé automatiquement:
ax.legend(loc='center left', bbox_to_anchor= (1.04, 0.5), ncol=1, borderaxespad=0, frameon=False)

plt.show()

In [None]:
# Rajoutez d'autres éléments:
fig2, ax = plt.subplots()
ax.plot(df2_p.date, df2_p['Blue Iron'], color='#6FDE6E', label='Blue Iron')
ax.plot(df2_p.date, df2_p['Sodring'], color='#FF4242', label='Sodring')
ax.plot(df2_p.date, df2_p['Gouslat'], color='#A691AE', label='Gouslat')
ax.plot(df2_p.date, df2_p['Purvell LLC'], color='#235FA4', label='Purvell LLC')
ax.plot(df2_p.date, df2_p['Camply'], color='#0A284B', label='Camply')

ax.legend(loc='center left', bbox_to_anchor= (1.04, 0.5), ncol=1, borderaxespad=0, frameon=False)
ax.set_title('Evolution journalière \ndes ventes en base 100', loc= 'center', fontsize=16)
ax.set_ylabel('Evolution', fontsize=15)

ax.grid(b=True, which='major', axis='y')
ax.axhline(100, color='black')
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.spines['bottom'].set_visible(False)
ax.spines['left'].set_visible(False)

plt.show()

In [None]:
# Occupez vous de l'overlap sur l'axis des abscisses:
months = mdates.MonthLocator()
x_display = mdates.DateFormatter('%d-%b')

fig2, ax = plt.subplots()
ax.plot(df2_p.date, df2_p['Blue Iron'], color='#6FDE6E', label='Blue Iron')
ax.plot(df2_p.date, df2_p['Sodring'], color='#FF4242', label='Sodring')
ax.plot(df2_p.date, df2_p['Gouslat'], color='#A691AE', label='Gouslat')
ax.plot(df2_p.date, df2_p['Purvell LLC'], color='#235FA4', label='Purvell LLC')
ax.plot(df2_p.date, df2_p['Camply'], color='#0A284B', label='Camply')

ax.legend(loc='center left', bbox_to_anchor= (1.04, 0.5), ncol=1, borderaxespad=0, frameon=False)
ax.set_title('Evolution journalière \ndes ventes en base 100', loc= 'center', fontsize=16)
ax.set_ylabel('Evolution', fontsize=15)
# En changeant le format par exemple:
ax.xaxis.set_major_locator(months)
ax.xaxis.set_major_formatter(x_display)

ax.grid(b=True, which='major', axis='y')
ax.axhline(100, color='black')
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.spines['bottom'].set_visible(False)
ax.spines['left'].set_visible(False)

plt.show()

Bravo ! Vous venez de voir comment faire pas à pas votre premier line plot avec matplotlib. 

L'objectif est que vous repreniez les différentes étapes et que vous testiez les différents paramètres pour comprendre leurs rôles.

## **<span style="color:#3775a8">3. Line Plot avec seaborn</span>**

L'objectif est de reproduire la même visualisation mais cette fois ci, en utilisant seaborn.
La différence majeure concerne les données à utiliser. Ce ne sera plus df2_p mais df2. Ainsi, seaborn permet d'utiliser le format long (comme ggplot2 en R) chose que matplotlib ne permet pas du fait qu'il prenne le format wide.

In [None]:
df2

In [None]:
# Creation d'une palette de couleur customisée
colors = ["#6FDE6E", "#FF4242", '#A691AE', '#235FA4', '#0A284B']
customPalette = sns.set_palette(sns.color_palette(colors))

In [None]:
# Avec très peu de lignes de code, l'output est très proche de matplotlib:
fig3, ax = plt.subplots()
# Le paramètre hue permet d'utiliser les données en format long, sans lui il faudrait faire comme pour matplotlib et écrire plusieurs fois sns.lineplot (Mieux: mettre dans une boucle for)
sns.lineplot(ax=ax, data=df2, x="date", y="evolution", hue="company", legend=None, palette=customPalette)
# Comme vous voyez, seaborn est une sur couche de matplotlib ce qui signifie que l'on peut rajouter des éléments de matplotlib grâce à l'Axe définit par plt.subplots() :
ax.axhline(100, color='black')
plt.show()

In [None]:
# Rajoutez la légende mais cette fois non plus sur le côté mais à la suite des lignes:
fig3, ax = plt.subplots()
sns.lineplot(ax=ax, data=df2, x="date", y="evolution", hue="company", legend=None, palette=customPalette)
ax.axhline(100, color='black')

for line, name in zip(ax.lines, df2['company'].unique()):
    y = line.get_ydata()[-1]
    x = line.get_xdata()[-1]
    text = ax.annotate(name,
                       xy=(x, y),
                       xytext=(2, -3),
                       color=line.get_color(),
                       xycoords=(ax.get_xaxis_transform(),
                                 ax.get_yaxis_transform()),
                       textcoords="offset points")
    text_width = (text.get_window_extent(fig3.canvas.get_renderer()).transformed(ax.transData.inverted()).width)
    ax.set_xlim(ax.get_xlim()[0], text.xy[0] + text_width * 1.05)


plt.show()

In [None]:
# Rajoutez quelques éléments graphiques:
fig3, ax = plt.subplots()
sns.lineplot(ax=ax, data=df2, x="date", y="evolution", hue="company", legend=None, palette=customPalette)
ax.axhline(100, color='black')

for line, name in zip(ax.lines, df2['company'].unique()):
    y = line.get_ydata()[-1]
    x = line.get_xdata()[-1]
    text = ax.annotate(name,
                       xy=(x, y),
                       xytext=(2, -3),
                       color=line.get_color(),
                       xycoords=(ax.get_xaxis_transform(),
                                 ax.get_yaxis_transform()),
                       textcoords="offset points")
    text_width = (text.get_window_extent(fig3.canvas.get_renderer()).transformed(ax.transData.inverted()).width)
    ax.set_xlim(ax.get_xlim()[0], text.xy[0] + text_width * 1.05)

ax.set_title('Evolution journalière \ndes ventes en base 100', loc= 'center', fontsize=16)
ax.set_ylabel('Evolution', fontsize=15)
ax.set_xlabel('')
ax.xaxis.set_major_locator(months)
ax.xaxis.set_major_formatter(x_display)

ax.grid(b=True, which='major', axis='y')
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.spines['bottom'].set_visible(False)
ax.spines['left'].set_visible(False)

plt.show()

Bravo ! Vous venez de voir comment faire pas à pas votre premier line plot avec seaborn ainsi que la différence des 2 packages au niveau du traitement de la donnée. 

L'objectif est que vous repreniez les différentes étapes et que vous testiez les différents paramètres pour comprendre leurs rôles.

## **<span style="color:#3775a8">4. Subplots avec matplotlib & seaborn</span>**

L'objectif est de reproduire les mêmes visualisations précédentes + un density plot mais cette fois ci, qu'elles soient sur une seule et même figure.

Voici les données pour le density plot:

In [None]:
data_kde = [-20.31275116, -18.3594738, -18.3553103, -14.18406452, -11.67305,
        -11.38179997, -11.3761126, -10.6904519, -10.68305023, -10.34148,
         -8.75222277,  -8.7498553, -6.00130727,   1.45761078,   1.77479,
          1.78314794,   2.6612791]

data_kde = [i+10 for i in data_kde]
data_kde

In [None]:
data_kde2 = [i+20 for i in data_kde]
data_kde2

In [None]:
# Vous allez réutiliser les éléments moyenne_ventes, clrs, months, x_display, colors, customPalette

# Création de la figure et des différents Axes:
fig4 = plt.figure(constrained_layout=True, figsize = (15,10))
gs = fig4.add_gridspec(2, 2)
ax1 = fig4.add_subplot(gs[0, 0])
ax2 = fig4.add_subplot(gs[0, 1])
ax3 = fig4.add_subplot(gs[1, 0:])

In [None]:
fig4 = plt.figure(constrained_layout=True, figsize = (15,10))
gs = fig4.add_gridspec(2, 2)
ax1 = fig4.add_subplot(gs[0, 0])
ax2 = fig4.add_subplot(gs[0, 1])
ax3 = fig4.add_subplot(gs[1, 0:])

# ax1
ax1.barh(y= df['company'], width= df['ventes'], color=clrs)

legend_elements = [Patch(color='#E1DAAE', label='Montant >= 120K€'),
                   Patch(color='#FF934F', label='Montant >= 100K€ & < 120K€'),
                   Patch(color='#CC2D35', label='Montant < 100K€'),
                   Line2D([0], [0], color='#058ED9', lw=4, label='Montant moyen: {moyenne}K€'.format(moyenne = np.round((moyenne_ventes/1000), 2)))]
ax1.legend(handles=legend_elements, loc='center left', bbox_to_anchor= (1.04, 0.5), ncol=1, borderaxespad=0, frameon=False)

ax1.axvline(moyenne_ventes, color='#058ED9')
ax1.set_title('Classement des ventes', loc= 'center', fontsize=16)
ax1.set_ylabel('Companies', fontsize=15)
ax1.set_xlabel('Ventes', fontsize=15)

ax1.grid(b=True, which='major', axis='x')
ax1.spines['top'].set_visible(False)
ax1.spines['right'].set_visible(False)
ax1.spines['bottom'].set_visible(False)
ax1.spines['left'].set_visible(False)
ax1.xaxis.set_major_formatter(currency)
ax1.tick_params(axis='x', which='major', labelsize=12)

In [None]:
fig4 = plt.figure(constrained_layout=True, figsize = (15,10))
gs = fig4.add_gridspec(2, 2)
ax1 = fig4.add_subplot(gs[0, 0])
ax2 = fig4.add_subplot(gs[0, 1])
ax3 = fig4.add_subplot(gs[1, 0:])

# ax1
ax1.barh(y= df['company'], width= df['ventes'], color=clrs)

legend_elements = [Patch(color='#E1DAAE', label='Montant >= 120K€'),
                   Patch(color='#FF934F', label='Montant >= 100K€ & < 120K€'),
                   Patch(color='#CC2D35', label='Montant < 100K€'),
                   Line2D([0], [0], color='#058ED9', lw=4, label='Montant moyen: {moyenne}K€'.format(moyenne = np.round((moyenne_ventes/1000), 2)))]
ax1.legend(handles=legend_elements, loc='center left', bbox_to_anchor= (1.04, 0.5), ncol=1, borderaxespad=0, frameon=False)

ax1.axvline(moyenne_ventes, color='#058ED9')
ax1.set_title('Classement des ventes', loc= 'center', fontsize=16)
ax1.set_ylabel('Companies', fontsize=15)
ax1.set_xlabel('Ventes', fontsize=15)

ax1.grid(b=True, which='major', axis='x')
ax1.spines['top'].set_visible(False)
ax1.spines['right'].set_visible(False)
ax1.spines['bottom'].set_visible(False)
ax1.spines['left'].set_visible(False)
ax1.xaxis.set_major_formatter(currency)
ax1.tick_params(axis='x', which='major', labelsize=12)

#ax2:
# Ici, je n'ai pas utiliser le paramètre hue pour vous montrer que sans lui, il faut fénir les variables une à une, mais le resultat est le même!
sns.kdeplot(ax=ax2, data = data_kde, alpha=0.8, fill=True, label='Méthode 1', color = '#CC2D35')#shade=True
sns.kdeplot(ax=ax2, data = data_kde2, alpha=0.8, fill=True, label='Méthode 2', color = '#058ED9')#shade=True

ax2.legend(loc='center left', bbox_to_anchor= (1.04, 0.5), ncol=1, borderaxespad=0, frameon=False)

ax2.set_title('Rendements des méthodes de production', loc= 'center', fontsize=16)
ax2.set_ylabel('Density', fontsize=15)
ax2.set_xlabel('Rendements (percent)', fontsize=15)
ax2.tick_params(axis='both', which='major', labelsize=15)

ax2.grid(b=True, which='major', axis='y')
ax2.spines['top'].set_visible(False)
ax2.spines['right'].set_visible(False)
ax2.spines['bottom'].set_visible(False)
ax2.spines['left'].set_visible(False)

In [None]:
fig4 = plt.figure(constrained_layout=True, figsize = (15,10))
gs = fig4.add_gridspec(2, 2)
ax1 = fig4.add_subplot(gs[0, 0])
ax2 = fig4.add_subplot(gs[0, 1])
ax3 = fig4.add_subplot(gs[1, 0:])

# ax1
ax1.barh(y= df['company'], width= df['ventes'], color=clrs)

legend_elements = [Patch(color='#E1DAAE', label='Montant >= 120K€'),
                   Patch(color='#FF934F', label='Montant >= 100K€ & < 120K€'),
                   Patch(color='#CC2D35', label='Montant < 100K€'),
                   Line2D([0], [0], color='#058ED9', lw=4, label='Montant moyen: {moyenne}K€'.format(moyenne = np.round((moyenne_ventes/1000), 2)))]
ax1.legend(handles=legend_elements, loc='center left', bbox_to_anchor= (1.04, 0.5), ncol=1, borderaxespad=0, frameon=False)

ax1.axvline(moyenne_ventes, color='#058ED9')
ax1.set_title('Classement des ventes', loc= 'center', fontsize=16)
ax1.set_ylabel('Companies', fontsize=15)
ax1.set_xlabel('Ventes', fontsize=15)

ax1.grid(b=True, which='major', axis='x')
ax1.spines['top'].set_visible(False)
ax1.spines['right'].set_visible(False)
ax1.spines['bottom'].set_visible(False)
ax1.spines['left'].set_visible(False)
ax1.xaxis.set_major_formatter(currency)
ax1.tick_params(axis='x', which='major', labelsize=12)

#ax2:
sns.kdeplot(ax=ax2, data = data_kde, alpha=0.8, fill=True, label='Méthode 1', color = '#CC2D35')#shade=True
sns.kdeplot(ax=ax2, data = data_kde2, alpha=0.8, fill=True, label='Méthode 2', color = '#058ED9')#shade=True

ax2.legend(loc='center left', bbox_to_anchor= (1.04, 0.5), ncol=1, borderaxespad=0, frameon=False)

ax2.set_title('Rendements des méthodes de production', loc= 'center', fontsize=16)
ax2.set_ylabel('Density', fontsize=15)
ax2.set_xlabel('Rendements (percent)', fontsize=15)
ax2.tick_params(axis='both', which='major', labelsize=15)

ax2.grid(b=True, which='major', axis='y')
ax2.spines['top'].set_visible(False)
ax2.spines['right'].set_visible(False)
ax2.spines['bottom'].set_visible(False)
ax2.spines['left'].set_visible(False)

#ax3:
sns.lineplot(ax=ax3, data=df2, x="date", y="evolution", hue="company", legend=None, palette=customPalette)
ax3.axhline(100, color='black')

for line, name in zip(ax3.lines, df2['company'].unique()):
    y = line.get_ydata()[-1]
    x = line.get_xdata()[-1]
    text = ax3.annotate(name,
                       xy=(x, y),
                       xytext=(2, -3),
                       color=line.get_color(),
                       xycoords=(ax3.get_xaxis_transform(),
                                 ax3.get_yaxis_transform()),
                       textcoords="offset points")
    text_width = (text.get_window_extent(fig4.canvas.get_renderer()).transformed(ax3.transData.inverted()).width)
    ax3.set_xlim(ax3.get_xlim()[0], text.xy[0] + text_width * 1.05)

ax3.set_title('Evolution journalière \ndes ventes en base 100', loc= 'center', fontsize=16)
ax3.set_ylabel('Evolution', fontsize=15)
ax3.tick_params(axis='both', which='major', labelsize=15)
ax3.set_xlabel(None)
ax3.xaxis.set_major_locator(months)
ax3.xaxis.set_major_formatter(x_display)

ax3.grid(b=True, which='major', axis='y')
ax3.spines['top'].set_visible(False)
ax3.spines['right'].set_visible(False)
ax3.spines['bottom'].set_visible(False)
ax3.spines['left'].set_visible(False)

Bravo ! Vous venez de voir comment faire pas à pas votre premier subplots en utilisant à la fois matplotlib et seaborn !

L'objectif est que vous repreniez les différentes étapes et que vous testiez les différents paramètres pour comprendre leurs rôles.

# **<span style="color:#37a871">Félicitations !</span>**

Félicitations vous avez désormais toutes les clés en main pour continuer à apprendre par vous même !