**Tutoriel sur la classe `stat_univariee`**
=====================================================

**Introduction**
---------------

La classe `stat_univariee` est une classe Python qui permet de réaliser des analyses univariées de données. Elle est conçue pour être utilisée avec des données Pandas. L'objectif est d'avoir tout à portée de main pour les analyses de première intentions sans négliger l'aspect visuel pour autant. Une interface codée en HTML permet de disposer des différentes analyses universées des colonnes d'un dataframe sur un même espace.


**Création d'une instance de `stat_univariee`**
---------------------------------------------

Pour créer une instance de `stat_univariee`, il suffit de passer les arguments suivants :

* `datafram` : un DataFrame ou une série Pandas contenant les données à analyser.
* `hue` : une série Pandas catégorielle optionnelle. Si cette variable est utilisée, le dataframe ou la série précédente sera décomposé en fonction de chaque catégorie. L'analyse univariée se fera sur chacune de ces catégories puis sera restitué sur la même figure.

In [1]:
import seaborn as sns
from stat_univar import stat_univariee

# Charger le dataset Titanic intégré dans seaborn
df = sns.load_dataset('titanic')

# Création d'une instance de stat_univariee
fig = stat_univariee(df.loc[:, ['age', 'fare', 'embark_town']])
fig

100%|██████████| 3/3 [00:01<00:00,  1.95series/s]


<stat_univar.stat_univariee at 0x27e32ad7a30>

In [2]:
# Création d'une instance de stat_univariee par catégorie 'sex'
fig = stat_univariee(df.loc[:, ['age', 'fare', 'embark_town']], hue=df['sex'])
fig

100%|██████████| 3/3 [00:02<00:00,  1.37series/s]


<stat_univar.stat_univariee at 0x27e1d26d3c0>

**Méthodes de la classe `stat_univariee`**
-----------------------------------------

La classe `stat_univariee` s'utilise principalement au moment de son instanciation. L'objet sera là pour pouvoir ré-afficher La figure ou la sauvegarder dans un fichier HTML:

* `_repr_html_` : méthode qui affiche l'analyse univariée en HTML.   
(Cette méthode est automatiquement appelée dans un Jupiter notebook)

In [3]:
# Affichage de la figure via la méthode _repr_html_()
fig

<stat_univar.stat_univariee at 0x27e1d26d3c0>

In [4]:
# Sauvegarde de la figure sous un fichier HTML
fig.save_html()

**Personnalisation de l'analyse univariée**
-----------------------------------------

La classe `stat_univariee` offre plusieurs paramètres pour personnaliser l'analyse univariée :

* `hist_bins` : paramètre qui définit le nombre de séparateurs sur l'histogramme.
* `lorenz` : paramètre qui définit si la courbe de Lorenz est affichée ou non.
* `lorenz_x(y)ticks` : Paramètres qui rajoutent des lignes de marquage sur les axes X ou y permettant de mettre en avant des valeurs importantes.
* `figsize` : paramètre qui définit la taille de la figure.
* `text_frontsize` : paramètre qui définit la taille de la police.
* `stat_centrales_lines` : paramètre qui définit si les lignes de stats de tendances sont affichées ou non.

In [5]:
df.columns

Index(['survived', 'pclass', 'sex', 'age', 'sibsp', 'parch', 'fare',
       'embarked', 'class', 'who', 'adult_male', 'deck', 'embark_town',
       'alive', 'alone'],
      dtype='object')

In [6]:
# Exemple de personnalisation de l'analyse univariée
stat = stat_univariee(df['fare'], hue=df['embark_town'], hist_bins=50, lorenz=False)
stat

<stat_univar.stat_univariee at 0x27e32ad6d40>

**Démo**
--------------

In [7]:
# Si vous ne voulez pas sauvegarder la figure il est possible de l'utiliser directement
stat_univariee(df)

100%|██████████| 15/15 [00:07<00:00,  1.96series/s]


<stat_univar.stat_univariee at 0x27e16a0a3e0>

In [8]:
# Exemple de personnalisation de l'analyse univariée
stat_univariee(df.age, hist_bins=40)

<stat_univar.stat_univariee at 0x27e25bf4730>

In [9]:
stat_univariee(df.age, df['class'], figsize=(30, 13), text_frontsize=16, ratio_boxplot=1.5)

<stat_univar.stat_univariee at 0x27e1b646470>

In [10]:
# Permet le traçage de marqueurs sur la courbe de Lorenz
stat_univariee(df.fare, 
               lorenz_xticks=[0.92], 
               lorenz_yticks=[])

<stat_univar.stat_univariee at 0x27e1b829450>