# Visualisation des données avec Plotly

A présent que vous savez manipuler les données avec pandas, vous allez apprendre à représenter les données sous forme de jolis graphiques à l'aide de la bibliothèque **Plotly Express**.  
On utilisera le fichier **clean_travel_data.csv** comme base.

Pour vous aider, voici la documentation officielle de Plotly :  
https://plotly.com/python/plotly-express/

N'hésitez pas à rechercher les fonctions, paramètres et exemples nécessaires pour réaliser les tâches demandées.  

Chaque cellule de code est précédée d'une cellule TODO indiquant la liste des objectifs à atteindre.

Répondez également aux quelques petites questions des TODO s'il y en a.

In [None]:
# Il faut installer la bibliothèque plotly. On verra comment faire ça proprement plus tard.
import pandas as pd
import plotly.express as px
!pip install --upgrade nbformat
!pip install ipython

: 

# 1. Nombre total de photos par ville

**TODO**

- Importer plotly.express sous le nom px
- Créer un graphique en barres représentant le total de photos par ville
- Trier les villes selon le nombre de photos de manière décroissante
- Afficher le graphique

In [None]:
import plotly.express as px        
import pandas as pd               

# Charger les données depuis le fichier CSV
data = pd.read_csv("clean_travel_data.csv")

# Regrouper les données par ville et calculer le total de photos par ville
photos_par_ville = data.groupby("city", as_index=False)["photos"].sum()

# Trier les villes par nombre de photos (ordre décroissant)
photos_par_ville = photos_par_ville.sort_values(by="photos", ascending=False)

# Créer un graphique
fig = px.bar(
    photos_par_ville,
    x="city",
    y="photos",
    title="Nombre total de photos par ville (tri décroissant)",
    labels={"city": "Ville", "photos": "Nombre de photos"}
)


fig.show()


# 2. Répartition des humeurs (mood) en camembert

**TODO**

- Créer un graphique en camembert basé sur la répartition des humeurs (colonne mood)
- Afficher les pourcentages sur chaque tranche
- Afficher le graphique

In [None]:
# Création du graphique
fig = px.pie(data,                 # Utilise les données du DataFrame 'data'
             names='mood',         # Catégories affichées dans le camembert (ici, les différentes humeurs)
             title='Répartition des humeurs',  # Titre du graphique
             hole=0.1)               # Valeur 0 
# Affichage des % sur chaque part du camembert
fig.update_traces(textinfo='percent+label')  # Affiche le pourcentage et le nom de chaque humeur

# Affichage du graphique
fig.show()  # Ouvre le graphique interactif (dans un notebook ou navigateur)


# 3. Évolution du nombre de photos dans le temps

**TODO**

- Créer un graphique en ligne avec la date sur l'axe des x et le nombre de photos sur l'axe des y
- Colorer les lignes ou points selon la météo (weather)
- Afficher le graphique
- Que remarquez vous ? Qu'auriez du vous faire ?

In [None]:
import pandas as pd              # Bibliothèque pour manipuler les données sous forme de tableau
import plotly.express as px      # Bibliothèque pour créer des graphiques interactifs

# Charger les données depuis le fichier CSV
data = pd.read_csv("clean_travel_data.csv")  # Le fichier doit contenir au moins les colonnes : date, photos, weather

# Modifier la valeur (ville = Grenoble, date = 2024-12-10 par exemple)
data.loc[(data['city'] == 'Grenoble') & (data['date'] == '2024-12-10'), 'photos'] = 15

# Vérifier la modification
print(data[data['city'] == 'Grenoble'])

# Créer un graphique en ligne  pour visualiser le nombre de photos en fonction de la date et de la météo
fig = px.line(
    data,                        
    x='date',                   
    y='photos',                  
    color='weather',             
    title='Nombre de photos par date selon la météo',  # Titre du graphique
    labels={
        'date': 'Date', 
        'photos': 'Nombre de photo', 
        'weather': 'Météo'
    }  
)

# Afficher le graphique interactif
fig.show()

# Analyse des observations (commentaires) :
# - On remarque que le nombre de photos varie selon la météo.
# - Il faudrait corriger les valeurs négatives et les données manquantes.
# - Supprimer ou ajuster les données incomplètes (ex : météo = "unknown").
# - Les jours


# 4. Distribution du nombre de photos selon la météo

**TODO**

- Créer un diagramme en boîte (box plot) pour visualiser la répartition du nombre de photos selon la météo
- Afficher le graphique
- Quelles conclusions tirez-vous de ce graphe ?

In [None]:
# Convertir la colonne 'date' au format datetime (utile pour les analyses temporelles)
data['date'] = pd.to_datetime(data['date']) 

# Charger les données depuis le fichier CSV
data = pd.read_csv("clean_travel_data.csv")  
# Créer un box plot pour analyser la répartition du nombre de photos en fonction de la météo
fig = px.box(
    data,                       
    x='weather',                 #les différentes conditions météo 
    y='photos',                  #nombre de photos prises
    color='weather',            
    title='Répartition du nombre de photos selon la météo',  # Titre du graphique
    labels={
        'weather': 'Météo',
        'photos': 'Nombre de photos'
    }  # Étiquettes personnalisées pour les axes
)

# Afficher le graphique interactif
fig.show()


# 5. Nuage de points photos vs humeur

**TODO**

- Créer un graphique de type scatter plot avec mood en abscisse et photos en ordonnée
- Ajouter une info-bulle avec les noms de ville
- Afficher le graphique

In [None]:
# Charger les données
data = pd.read_csv("clean_travel_data.csv")

# Créer le scatter plot
fig = px.scatter(
    data,
    x='mood',
    y='photos',
    hover_name='city', 
    color= 'weather',
    title='Photos par humeur selon les villes',
    labels={'mood': 'Humeur', 'photos': 'Nombre de photos'}
)
fig.show()

: 