# Présentation Plotly

In [None]:
#pip install plotly
#conda install -c plotly plotly

#### Liens utiles :
- Site : https://plotly.com/python/
- figure reference : https://plotly.com/python/reference/index/
- API : https://plotly.com/python-api-reference/index.html
- px : https://plotly.com/python-api-reference/plotly.express.html

### Plusieurs "niveaux" dans Plotly :
Des submlodules :
- plotly.express
- plotly.graph_objects
- plotly.subplots
- plotly.figure_factory
- plotly.io

# Demo

In [None]:
import pandas as pd
import plotly.express as px

## Reprise des exemples en ligne :
https://plotly.com/python/plotly-express/

In [None]:
import plotly.express as px
df = px.data.iris()
fig = px.scatter(df, x="sepal_width", y="sepal_length", color="species")
fig.show()

In [None]:
## Autre exemple si besoin :
# import plotly.express as px
# df = px.data.iris()
# fig = px.scatter(df, x="sepal_width", y="sepal_length", color="species", marginal_y="violin",
#            marginal_x="box", trendline="ols", template="simple_white")
# fig.show()

In [None]:
poke = pd.read_csv("../data/pokemon_data.csv")

In [None]:
# Recréer la figure mais avec des pokemons.
# Croiser "HP" et "Attack
# Séparer par le fait que le pokemon soit legendaire ou non





In [None]:
## La solution si jamais :
# import plotly.express as px
# fig = px.scatter(poke, x="HP", y="Attack", color="Legendary")
# fig.show()

## Toute première démo de la séance 1 :

#### Dynamique temporelle

In [None]:
# charger les données
df = pd.read_csv("../data/data_tweets.csv")

In [None]:
## Regarder les infos sur resample :
# df.resample?

In [None]:
# le souci c'est que la date n'est pas un datetime :
df["date"].dtype

In [None]:
## si on tente ça, ça foire en raison du format:
#df.resample('W', on='date').size()

In [None]:
# Passer la date au bon format
df['date_format'] = pd.to_datetime(df['date'])

In [None]:
df["date_format"].dtype

In [None]:
# On peut maintenant resampler
df.resample('W', on='date_format').size()

In [None]:
# et on peut représenter ça graphiquement
fig = px.bar(df.resample('W', on='date_format').size()) # regrouper par semaine et comptez le nombre de tweets

fig.show() # Afficher le graphique

In [None]:
# l'help de px.bar
px.bar?

## Customiser

In [None]:
# soit on ajoute directement des éléments lors de la création :
fig_test = px.bar(df.resample('W', on='date_format').size(),
       labels={'value': 'nombre de tweets', 'date': 'date'},
       range_x=['2023-02', '2023-06'])
fig_test.show()

In [None]:
# Ou alors on peut faire un .update_layout() après la création du graphique :

# Si on est d'humeur fancy et que l'on veut améliorer le graphique
fig.update_layout(title='Nombre de tweets par semaine', # ajouter un titre
                  xaxis_title='Date', yaxis_title='Nombre de tweets', # renommer les étiquettes d'axes
                  template='plotly_white', # changer le style du graphique
                  showlegend=False) # masquer la légende

# Afficher le graphique
fig.show()

## Enregistrer

### En image fixe :
Normalement nécessaire d'installer kaleido si il ne l'est pas déjà.

In [None]:
## cf. la doc :
## The kaleido package has no dependencies and can be installed using pip...

#pip install -U kaleido

## or conda.

#conda install -c conda-forge python-kaleido


In [None]:
#fig.write_image("fig1.png")

Souvent le résultat brut est un peu moche :  
ajouter quelques paramètrès permet d'améliorer le rendu.
- scale (qualité de l'image)
- width
- height

In [None]:
# fig.write_image("fig2.png",
#                 width=800,
#                 height=450,
#                 scale=4
#                )

### En html :

In [None]:
#fig.write_html("file.html")