# Visualisation des données avec Plotly

A présent que vous savez manipuler les données avec pandas, vous allez apprendre à représenter les données sous forme de jolis graphiques à l'aide de la bibliothèque **Plotly Express**.  
On utilisera le fichier **clean_travel_data.csv** comme base.

Pour vous aider, voici la documentation officielle de Plotly :  
https://plotly.com/python/plotly-express/

N'hésitez pas à rechercher les fonctions, paramètres et exemples nécessaires pour réaliser les tâches demandées.  

Chaque cellule de code est précédée d'une cellule TODO indiquant la liste des objectifs à atteindre.

Répondez également aux quelques petites questions des TODO s'il y en a.

In [1]:
# Il faut installer la bibliothèque plotly. On verra comment faire ça proprement plus tard.
!pip install plotly




[notice] A new release of pip is available: 23.0.1 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


# 1. Nombre total de photos par ville

**TODO**

- Importer plotly.express sous le nom px
- Créer un graphique en barres représentant le total de photos par ville
- Trier les villes selon le nombre de photos de manière décroissante
- Afficher le graphique

In [1]:
%pip install nbformat
import plotly.express as px
import pandas as pd

# Vérifier la présence du fichier
import os
if not os.path.exists("clean_travel_data.csv"):
    print("Le fichier clean_travel_data.csv est introuvable. Veuillez le générer avec le notebook pandas.")
else:
    # Charger les données nettoyées
    df = pd.read_csv("clean_travel_data.csv")
    print(df.head())  # Vérifie que le DataFrame n'est pas vide

    # Calculer le total de photos par ville et trier
    photos_by_city = df.groupby("city")["photos"].sum().sort_values(ascending=False).reset_index()

    # Créer le graphique en barres
    fig = px.bar(photos_by_city, x="city", y="photos", title="Total de photos par ville")

    # Afficher le graphique
    fig.show()

Collecting nbformat
  Downloading nbformat-5.10.4-py3-none-any.whl (78 kB)
     ---------------------------------------- 0.0/78.5 kB ? eta -:--:--
     ---------------------------------------- 78.5/78.5 kB 2.1 MB/s eta 0:00:00
Collecting jsonschema>=2.6
  Downloading jsonschema-4.24.0-py3-none-any.whl (88 kB)
     ---------------------------------------- 0.0/88.7 kB ? eta -:--:--
     ---------------------------------------- 88.7/88.7 kB 4.9 MB/s eta 0:00:00
Collecting fastjsonschema>=2.15
  Downloading fastjsonschema-2.21.1-py3-none-any.whl (23 kB)
Collecting jsonschema-specifications>=2023.03.6
  Downloading jsonschema_specifications-2025.4.1-py3-none-any.whl (18 kB)
Collecting referencing>=0.28.4
  Downloading referencing-0.36.2-py3-none-any.whl (26 kB)
Collecting rpds-py>=0.7.1
  Downloading rpds_py-0.26.0-cp310-cp310-win_amd64.whl (231 kB)
     ---------------------------------------- 0.0/231.3 kB ? eta -:--:--
     ---------------------------- --------- 174.1/231.3 kB 5.3 MB/s et


[notice] A new release of pip is available: 23.0.1 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


        city        date  weather     mood  photos
0      Paris  2024-03-15    sunny    happy     150
1      Paris  2024-03-20   cloudy  excited     130
2       Lyon  2024-04-10   cloudy  curious      80
3       Lyon  2024-04-15    sunny   joyful      95
4  Marseille  2024-05-05  unknown      sad      25


# 2. Répartition des humeurs (mood) en camembert

**TODO**

- Créer un graphique en camembert basé sur la répartition des humeurs (colonne mood)
- Afficher les pourcentages sur chaque tranche
- Afficher le graphique

In [2]:
# Créer un graphique en camembert basé sur la répartition des humeurs
fig = px.pie(df, names="mood", title="Répartition des humeurs", hole=0.3)

# Afficher les pourcentages sur chaque tranche
fig.update_traces(textinfo='percent+label')

# Afficher le graphique
fig.show()

# 3. Évolution du nombre de photos dans le temps

**TODO**

- Créer un graphique en ligne avec la date sur l'axe des x et le nombre de photos sur l'axe des y
- Colorer les lignes ou points selon la météo (weather)
- Afficher le graphique
- Que remarquez vous ? Qu'auriez du vous faire ?

In [3]:
# Créer un graphique en ligne avec la date et le nombre de photos, coloré selon la météo
fig = px.line(df, x="date", y="photos", color="weather", title="Évolution du nombre de photos dans le temps")

# Afficher le graphique
fig.show()
# Remarque : On peut observer des variations selon la météo. Il aurait fallu vérifier le format de la date et l'ordre des données.

# 4. Distribution du nombre de photos selon la météo

**TODO**

- Créer un diagramme en boîte (box plot) pour visualiser la répartition du nombre de photos selon la météo
- Afficher le graphique
- Quelles conclusions tirez-vous de ce graphe ?

In [4]:
# Diagramme en boîte pour visualiser la répartition du nombre de photos selon la météo
fig = px.box(df, x="weather", y="photos", title="Distribution du nombre de photos selon la météo")

# Afficher le graphique
fig.show()
# Conclusion : Certaines météos favorisent plus de photos (ex : sunny).

# 5. Nuage de points photos vs humeur

**TODO**

- Créer un graphique de type scatter plot avec mood en abscisse et photos en ordonnée
- Ajouter une info-bulle avec les noms de ville
- Afficher le graphique

In [5]:
# Scatter plot avec mood en abscisse et photos en ordonnée, info-bulle avec les noms de ville
fig = px.scatter(df, x="mood", y="photos", hover_data=["city"], title="Photos vs humeur")

# Afficher le graphique
fig.show()