# Visualisation des données avec Plotly

A présent que vous savez manipuler les données avec pandas, vous allez apprendre à représenter les données sous forme de jolis graphiques à l'aide de la bibliothèque **Plotly Express**.  
On utilisera le fichier **clean_travel_data.csv** comme base.

Pour vous aider, voici la documentation officielle de Plotly :  
https://plotly.com/python/plotly-express/

N'hésitez pas à rechercher les fonctions, paramètres et exemples nécessaires pour réaliser les tâches demandées.  

Chaque cellule de code est précédée d'une cellule TODO indiquant la liste des objectifs à atteindre.

Répondez également aux quelques petites questions des TODO s'il y en a.

In [1]:
# Il faut installer la bibliothèque plotly. On verra comment faire ça proprement plus tard.
!pip install plotly[express]



# 1. Nombre total de photos par ville

**TODO**

- Importer plotly.express sous le nom px
- Créer un graphique en barres représentant le total de photos par ville
- Trier les villes selon le nombre de photos de manière décroissante
- Afficher le graphique

In [2]:
# Write your code here

# Import de pandas (lecture csv) et plotly (graph)
import plotly.express as px
import pandas as pd

# Création d'un dataframe
df_trips = pd.read_csv('clean_travel_data.csv')

# Variable pour la somme des photos par ville
photos_par_ville = df_trips.groupby('city', as_index=False)['photos'].sum()
# Variable pour le tri décroissant
photos_par_ville = photos_par_ville.sort_values(by="photos", ascending=False)
# Paramétrage du graphique en barre
fig = px.bar(photos_par_ville, x='city', y='photos', color='city', title='Total des photos prises par ville', labels={'city': 'ville', 'photos': 'Nombre total'})

fig.show()

# 2. Répartition des humeurs (mood) en camembert

**TODO**

- Créer un graphique en camembert basé sur la répartition des humeurs (colonne mood)
- Afficher les pourcentages sur chaque tranche
- Afficher le graphique

In [3]:
# Write your code here
# Variable répartition des moods (avec retrait des noms de colonnes)
mood_camembert = df_trips['mood'].value_counts().reset_index()
# Ajout d'un d'index (nouveau noms de colonne)
mood_camembert.columns = ['mood', 'count']
# Paramètrage du graphique
fig = px.pie(mood_camembert, names='mood', values='count',
             title = 'Répartition des humeurs',
             labels={"mood": "humeur"},
             hole=0)
# Permet d'afficher le pourcentage associé à son nom d'humeur
fig.update_traces(textinfo="percent+label")

fig.show()

# 3. Évolution du nombre de photos dans le temps

**TODO**

- Créer un graphique en ligne avec la date sur l'axe des x et le nombre de photos sur l'axe des y
- Colorer les lignes ou points selon la météo (weather)
- Afficher le graphique
- Que remarquez vous ? Qu'auriez du vous faire ?

In [None]:
# Write your code here
import pandas as pd
import plotly.express as px
#  Conversion des dates en datetime (suite à une ValueError - aidé par ChatGPT)
df_trips['date'] = pd.to_datetime(df_trips['date'])

# Conversion des valeurs numériques négatives à 0
df_trips['photos'] = df_trips['photos'].where(df_trips['photos'] > 0, 0)

# Variable sélectionnant les dates
df_trips = df_trips.sort_values('date')



fig = px.line(df_trips, x='date', y='photos', color='weather',
              title='Nombre de photos par date',
              labels={'date': 'Date', 'photos': 'Nombre de photos'}
            )
fig.show()

# Remarque : Le graphique est peu lisible, les lignes sont très fines et donc difficile à consulter. Peut-être adapter le graphique sous un autre format ?
# Traiter les valeurs erronnées (NaN, négatives...)

# 4. Distribution du nombre de photos selon la météo

**TODO**

- Créer un diagramme en boîte (box plot) pour visualiser la répartition du nombre de photos selon la météo
- Afficher le graphique
- Quelles conclusions tirez-vous de ce graphe ?

In [5]:
# Write your code here
import pandas as pd
import plotly.express as px
# Créer le diagramme en boîte
fig = px.box(df_trips, x="weather", y="photos", color="weather",
             title="Répartition du nombre de photos selon la météo",
             labels={"weather": "Météo", "photos": "Nombre de photos"})

# Afficher le graphique
fig.show()

# 5. Nuage de points photos vs humeur

**TODO**

- Créer un graphique de type scatter plot avec mood en abscisse et photos en ordonnée
- Ajouter une info-bulle avec les noms de ville
- Afficher le graphique

In [6]:
# Write your code here

fig = px.scatter(df_trips, x='mood', y='photos',
                 title='Nombre de photos selon le mood',
                 color='city',
                 labels={'city': 'Villes', 'mood': 'Humeurs', 'photos': 'Nombres de photos'})
fig.show()