# Des affichages utiles pour les DataFrames

Quelques affichages avec des outils de sélection adaptés.

In [1]:
import numpy as np
import pandas as pd
import tabata as tbt

In [2]:
%reload_ext autoreload
%autoreload 2

## Récupération d'un DataFrame exemple

In [3]:
storename = "data/in/AFL1EB.h5"
ds = tbt.Opset(storename)

In [4]:
df = ds[4]
df.head()

Unnamed: 0_level_0,ALT[m],Tisa[K],TAS[m/s],Vz[m/s],Masse[kg],F[N]
record_04,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2012-08-03 01:24:00,-7.607808,830.008941,0.0,-5.884575e-16,14637.674998,0.0
2012-08-03 01:24:01,-7.607808,830.008941,0.0,-5.631412e-16,14637.674998,0.0
2012-08-03 01:24:02,-7.607808,830.008941,0.0,-5.378249e-16,14637.674998,0.0
2012-08-03 01:24:03,-7.607808,830.008941,0.0,-5.125086e-16,14637.674998,0.0
2012-08-03 01:24:04,-7.607808,830.008941,0.0,-4.871922e-16,14637.674998,0.0


## Affichage simplifié des DataFrames
Deux fonction simplifient l'affichage d'un opset.

* `selplot(df,[variable])`affiche un DataFrame variable par variable.
* `byunitplot(df,[yunit],[xunit],[title])` affiche le DataFrame en sélectionnant les variables, unité par unité sur le même graphe.
* `groupplot(df,standardize)` superposition de courbes.
* `doubleplot(df1,df2|col)` affichage lié de deux graphes empilés.

### Affichage des courbes une à une.
On peut préciser une partie du nom de la variable.

In [5]:
import plotly.io as pio

In [6]:
pio.renderers

Renderers configuration
-----------------------
    Default renderer: 'vscode'
    Available renderers:
        ['plotly_mimetype', 'jupyterlab', 'nteract', 'vscode',
         'notebook', 'notebook_connected', 'kaggle', 'azure', 'colab',
         'cocalc', 'databricks', 'json', 'png', 'jpeg', 'jpg', 'svg',
         'pdf', 'browser', 'firefox', 'chrome', 'chromium', 'iframe',
         'iframe_connected', 'sphinx_gallery', 'sphinx_gallery_png']

In [11]:
b = tbt.selplot(df,"V")
b

VBox(children=(interactive(children=(Dropdown(description='Variable :', index=3, options=('ALT[m]', 'Tisa[K]',…

In [10]:
b

VBox(children=(interactive(children=(Dropdown(description='Variable :', index=3, options=('ALT[m]', 'Tisa[K]',…

In [None]:
tbt.selplotc(df,"V")

### Affichage par unité

In [None]:
tbt.byunitplot(df,'m/s')

### Affichage de toutes les variables sur le même axe.

In [None]:
tbt.groupplot(df,standardize=True)

### Affichage superposé de deux sous-graphes liés

In [None]:
tbt.doubleplot(df,'ALT',0.3,title="Simple double plot")

In [None]:
tbt.doubleplot(df[['ALT[m]']],df[['TAS[m/s]','Vz[m/s]']],title="Double plot")

## Affichage temporel
Cet affichage permet d'observer une partie du signal assez facilement et offre des options de zoom rapides.

In [None]:
tbt.tsplot(df,'ALT',"Altitude")

## Analyse en composantes principales
L'idée est d'afficher les poids des variables dans le cercle défini par deux composantes principales.

* Le second paramètre de la fonction est soit None, soit une pca établie sur des données standardisées.
* Le troisième paramètre, vaut 0 par défaut, mais s'il est positif et entre 0 et 1, alors un échantillonnage de données est affiché en superposition du graphique.

In [None]:
tbt.pcacircle(df,None,0.5)

_Jérôme Lacaille (YOR)_