# Visualisation des données avec Plotly

A présent que vous savez manipuler les données avec pandas, vous allez apprendre à représenter les données sous forme de jolis graphiques à l'aide de la bibliothèque **Plotly Express**.  
On utilisera le fichier **clean_travel_data.csv** comme base.

Pour vous aider, voici la documentation officielle de Plotly :  
https://plotly.com/python/plotly-express/

N'hésitez pas à rechercher les fonctions, paramètres et exemples nécessaires pour réaliser les tâches demandées.  

Chaque cellule de code est précédée d'une cellule TODO indiquant la liste des objectifs à atteindre.

Répondez également aux quelques petites questions des TODO s'il y en a.

In [None]:
# Il faut installer la bibliothèque plotly. On verra comment faire ça proprement plus tard.
!pip install plotly

# 1. Nombre total de photos par ville

**TODO**

- Importer plotly.express sous le nom px
- Créer un graphique en barres représentant le total de photos par ville
- Trier les villes selon le nombre de photos de manière décroissante
- Afficher le graphique

In [None]:
%pip install plotly

import plotly.express as px
import pandas as pd 

# Load the cleaned travel data
df_trips = pd.read_csv("clean_travel_data.csv")

# Group by city and sum photos
photos_per_city = df_trips.groupby('city')['photos'].sum().reset_index()

# 🔽 Sort cities by number of photos in descending order
photos_per_city = photos_per_city.sort_values(by='photos', ascending=False)

# Create the bar chart using Plotly
fig = px.bar(
    photos_per_city,
    x='city',
    y='photos',
    title='Total number of photos per city by : saleh chanselme',
    labels={
        'city': 'City',
        'photos': 'Number of photos'
    }
)

# Display the chart in the default web browser
fig.show(renderer="browser")



Note: you may need to restart the kernel to use updated packages.


# 2. Répartition des humeurs (mood) en camembert

**TODO**

- Créer un graphique en camembert basé sur la répartition des humeurs (colonne mood)
- Afficher les pourcentages sur chaque tranche
- Afficher le graphique

In [None]:
# Create the pie chart and show percentage labels directly
fig = px.pie(
    df_trips,
    names='mood',
    title='Distribution of Moods During Trips by : saleh chanselme',
    hole=0,  # Full pie (not donut)
)

# Show percentage on each slice
fig.update_traces(textinfo='percent+label')  # Show both % and label (e.g., happy: 50%)

# Show the chart in the browser
fig.show(renderer="browser")

# 3. Évolution du nombre de photos dans le temps

**TODO**

- Créer un graphique en ligne avec la date sur l'axe des x et le nombre de photos sur l'axe des y
- Colorer les lignes ou points selon la météo (weather)
- Afficher le graphique
- Que remarquez vous ? Qu'auriez du vous faire ?

In [28]:
# Ensure 'date' is datetime
df_trips['date'] = pd.to_datetime(df_trips['date'])

# Create line chart colored by weather
fig = px.line(
    df_trips,
    x='date',
    y='photos',
    color='weather',  # 👈 color lines or points by weather
    title='Number of Photos Over Time by Weather by : saleh chanselme',
    labels={
        'date': 'Date',
        'photos': 'Number of Photos',
        'weather': 'Weather'
    }
)

# Show chart
fig.show(renderer="browser")

#Je remarque que les lignes sont parfois brisées ou superposées, car il y a plusieurs entrées pour la même date avec des météos différentes.
#J’aurais dû regrouper les données par date et météo, ou utiliser un graphique à points (scatter plot) pour une meilleure lisibilité.

# 4. Distribution du nombre de photos selon la météo

**TODO**

- Créer un diagramme en boîte (box plot) pour visualiser la répartition du nombre de photos selon la météo
- Afficher le graphique
- Quelles conclusions tirez-vous de ce graphe ?

In [None]:
# Créer le box plot
fig = px.box(
    df_trips,
    x='weather',          # Catégories : météo
    y='photos',           # Valeurs : nombre de photos
    title='Répartition du nombre de photos selon la météo',
    labels={
        'weather': 'Météo',
        'photos': 'Nombre de photos'
    }
)

# Afficher le graphique
fig.show(renderer="browser")

# Le diagramme en boîte montre que certaines conditions météo (comme sunny) sont associées à un plus grand 
# nombre de photos, avec une médiane plus élevée et des valeurs maximales plus importantes.
# En revanche, par temps rainy ou cloudy, le nombre de photos est généralement plus faible et plus concentré.
# On peut donc en conclure que la météo influence le comportement des voyageurs concernant la prise de photos.

# 5. Nuage de points photos vs humeur

**TODO**

- Créer un graphique de type scatter plot avec mood en abscisse et photos en ordonnée
- Ajouter une info-bulle avec les noms de ville
- Afficher le graphique

In [30]:
# Create scatter plot with city names in the tooltip
fig = px.scatter(
    df_trips,
    x='mood',
    y='photos',
    title='Number of Photos by Mood',
    labels={
        'mood': 'Mood',
        'photos': 'Number of Photos'
    },
    hover_data=['city']  #add city to the tooltip
)

# Show the chart
fig.show(renderer="browser")