# Visualisation des donn√©es avec Plotly

A pr√©sent que vous savez manipuler les donn√©es avec pandas, vous allez apprendre √† repr√©senter les donn√©es sous forme de jolis graphiques √† l'aide de la biblioth√®que **Plotly Express**.  
On utilisera le fichier **clean_travel_data.csv** comme base.

Pour vous aider, voici la documentation officielle de Plotly :  
https://plotly.com/python/plotly-express/

N'h√©sitez pas √† rechercher les fonctions, param√®tres et exemples n√©cessaires pour r√©aliser les t√¢ches demand√©es.  

Chaque cellule de code est pr√©c√©d√©e d'une cellule TODO indiquant la liste des objectifs √† atteindre.

R√©pondez √©galement aux quelques petites questions des TODO s'il y en a.

In [None]:
# Il faut installer la biblioth√®que plotly. On verra comment faire √ßa proprement plus tard.
!pip install plotly

# 1. Nombre total de photos par ville

**TODO**

- Importer plotly.express sous le nom px
- Cr√©er un graphique en barres repr√©sentant le total de photos par ville
- Trier les villes selon le nombre de photos de mani√®re d√©croissante
- Afficher le graphique

In [None]:
%pip install plotly

import plotly.express as px
import pandas as pd 

# Load the cleaned travel data
df_trips = pd.read_csv("clean_travel_data.csv")

# Group by city and sum photos
photos_per_city = df_trips.groupby('city')['photos'].sum().reset_index()

# üîΩ Sort cities by number of photos in descending order
photos_per_city = photos_per_city.sort_values(by='photos', ascending=False)

# Create the bar chart using Plotly
fig = px.bar(
    photos_per_city,
    x='city',
    y='photos',
    title='Total number of photos per city by : saleh chanselme',
    labels={
        'city': 'City',
        'photos': 'Number of photos'
    }
)

# Display the chart in the default web browser
fig.show(renderer="browser")



Note: you may need to restart the kernel to use updated packages.


# 2. R√©partition des humeurs (mood) en camembert

**TODO**

- Cr√©er un graphique en camembert bas√© sur la r√©partition des humeurs (colonne mood)
- Afficher les pourcentages sur chaque tranche
- Afficher le graphique

In [None]:
# Create the pie chart and show percentage labels directly
fig = px.pie(
    df_trips,
    names='mood',
    title='Distribution of Moods During Trips by : saleh chanselme',
    hole=0,  # Full pie (not donut)
)

# Show percentage on each slice
fig.update_traces(textinfo='percent+label')  # Show both % and label (e.g., happy: 50%)

# Show the chart in the browser
fig.show(renderer="browser")

# 3. √âvolution du nombre de photos dans le temps

**TODO**

- Cr√©er un graphique en ligne avec la date sur l'axe des x et le nombre de photos sur l'axe des y
- Colorer les lignes ou points selon la m√©t√©o (weather)
- Afficher le graphique
- Que remarquez vous ? Qu'auriez du vous faire ?

In [28]:
# Ensure 'date' is datetime
df_trips['date'] = pd.to_datetime(df_trips['date'])

# Create line chart colored by weather
fig = px.line(
    df_trips,
    x='date',
    y='photos',
    color='weather',  # üëà color lines or points by weather
    title='Number of Photos Over Time by Weather by : saleh chanselme',
    labels={
        'date': 'Date',
        'photos': 'Number of Photos',
        'weather': 'Weather'
    }
)

# Show chart
fig.show(renderer="browser")

#Je remarque que les lignes sont parfois bris√©es ou superpos√©es, car il y a plusieurs entr√©es pour la m√™me date avec des m√©t√©os diff√©rentes.
#J‚Äôaurais d√ª regrouper les donn√©es par date et m√©t√©o, ou utiliser un graphique √† points (scatter plot) pour une meilleure lisibilit√©.

# 4. Distribution du nombre de photos selon la m√©t√©o

**TODO**

- Cr√©er un diagramme en bo√Æte (box plot) pour visualiser la r√©partition du nombre de photos selon la m√©t√©o
- Afficher le graphique
- Quelles conclusions tirez-vous de ce graphe ?

In [None]:
# Cr√©er le box plot
fig = px.box(
    df_trips,
    x='weather',          # Cat√©gories : m√©t√©o
    y='photos',           # Valeurs : nombre de photos
    title='R√©partition du nombre de photos selon la m√©t√©o',
    labels={
        'weather': 'M√©t√©o',
        'photos': 'Nombre de photos'
    }
)

# Afficher le graphique
fig.show(renderer="browser")

# Le diagramme en bo√Æte montre que certaines conditions m√©t√©o (comme sunny) sont associ√©es √† un plus grand 
# nombre de photos, avec une m√©diane plus √©lev√©e et des valeurs maximales plus importantes.
# En revanche, par temps rainy ou cloudy, le nombre de photos est g√©n√©ralement plus faible et plus concentr√©.
# On peut donc en conclure que la m√©t√©o influence le comportement des voyageurs concernant la prise de photos.

# 5. Nuage de points photos vs humeur

**TODO**

- Cr√©er un graphique de type scatter plot avec mood en abscisse et photos en ordonn√©e
- Ajouter une info-bulle avec les noms de ville
- Afficher le graphique

In [30]:
# Create scatter plot with city names in the tooltip
fig = px.scatter(
    df_trips,
    x='mood',
    y='photos',
    title='Number of Photos by Mood',
    labels={
        'mood': 'Mood',
        'photos': 'Number of Photos'
    },
    hover_data=['city']  #add city to the tooltip
)

# Show the chart
fig.show(renderer="browser")