# Visualisation des données avec Plotly

A présent que vous savez manipuler les données avec pandas, vous allez apprendre à représenter les données sous forme de jolis graphiques à l'aide de la bibliothèque **Plotly Express**.  
On utilisera le fichier **clean_travel_data.csv** comme base.

Pour vous aider, voici la documentation officielle de Plotly :  
https://plotly.com/python/plotly-express/

N'hésitez pas à rechercher les fonctions, paramètres et exemples nécessaires pour réaliser les tâches demandées.  

Chaque cellule de code est précédée d'une cellule TODO indiquant la liste des objectifs à atteindre.

Répondez également aux quelques petites questions des TODO s'il y en a.

In [2]:
# Il faut installer la bibliothèque plotly. On verra comment faire ça proprement plus tard.
!pip install plotly
!pip install nbformat --upgrade 

Collecting nbformat
  Downloading nbformat-5.10.4-py3-none-any.whl.metadata (3.6 kB)
Collecting fastjsonschema>=2.15 (from nbformat)
  Downloading fastjsonschema-2.21.1-py3-none-any.whl.metadata (2.2 kB)
Collecting jsonschema>=2.6 (from nbformat)
  Downloading jsonschema-4.24.0-py3-none-any.whl.metadata (7.8 kB)
Collecting attrs>=22.2.0 (from jsonschema>=2.6->nbformat)
  Downloading attrs-25.3.0-py3-none-any.whl.metadata (10 kB)
Collecting jsonschema-specifications>=2023.03.6 (from jsonschema>=2.6->nbformat)
  Downloading jsonschema_specifications-2025.4.1-py3-none-any.whl.metadata (2.9 kB)
Collecting referencing>=0.28.4 (from jsonschema>=2.6->nbformat)
  Downloading referencing-0.36.2-py3-none-any.whl.metadata (2.8 kB)
Collecting rpds-py>=0.7.1 (from jsonschema>=2.6->nbformat)
  Downloading rpds_py-0.26.0-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (4.2 kB)
Collecting typing-extensions>=4.4.0 (from referencing>=0.28.4->jsonschema>=2.6->nbformat)
  Downloading t

# 1. Nombre total de photos par ville

**TODO**

- Importer plotly.express sous le nom px
- Créer un graphique en barres représentant le total de photos par ville
- Trier les villes selon le nombre de photos de manière décroissante
- Afficher le graphique

In [5]:
# Write your code here

import pandas as pd
import plotly.express as px

df_trips = pd.read_csv("clean_travel_data.csv")

photos_per_city = df_trips.groupby('city')['photos'].sum()
photos_per_city = photos_per_city.sort_values(ascending=False)
photos_per_city = photos_per_city.reset_index()  # Transforme en DataFrame

fig = px.bar(
    photos_per_city,
    x="city",
    y="photos",
    title="Nombre total de photos par ville",
    labels={'city': 'Ville', 'photos': 'Nombre de photos'}
)
fig.show()



# 2. Répartition des humeurs (mood) en camembert

**TODO**

- Créer un graphique en camembert basé sur la répartition des humeurs (colonne mood)
- Afficher les pourcentages sur chaque tranche
- Afficher le graphique

In [13]:
# Write your code here

import pandas as pd
import plotly.express as px

df_trips = pd.read_csv("clean_travel_data.csv")

fig = px.pie(df_trips, names='mood', title='Répartition des humeurs (mood)', labels={'mood': 'Humeur'},)

fig.show()

# 3. Évolution du nombre de photos dans le temps

**TODO**

- Créer un graphique en ligne avec la date sur l'axe des x et le nombre de photos sur l'axe des y
- Colorer les lignes ou points selon la météo (weather)
- Afficher le graphique
- Que remarquez vous ? Qu'auriez du vous faire ?

In [18]:
# Write your code here

import pandas as pd
import plotly.express as px

df_trips = pd.read_csv("clean_travel_data.csv")

df_trips['date'] = pd.to_datetime(df_trips['date'])

fig = px.line(df_trips, x='date', y='photos', color='weather', markers=True, title="Évolution du nombre de photos dans le temps selon la météo", labels={'photos': 'Nombre de photos', 'date': 'Date', 'weather': 'Météo'})

fig.show()

# On remarque que Grenoble a des photos 'négatifs', -15).
# Il aurait fallu vérifier les valeurs défectueuses.

# 4. Distribution du nombre de photos selon la météo

**TODO**

- Créer un diagramme en boîte (box plot) pour visualiser la répartition du nombre de photos selon la météo
- Afficher le graphique
- Quelles conclusions tirez-vous de ce graphe ?

In [None]:
# Write your code here

import pandas as pd
import plotly.express as px

df_trips = pd.read_csv("clean_travel_data.csv")

fig = px.box(df_trips, x='weather', y='photos', title='Distribution du nombre de photos selon la météo', labels={'photos': 'Nombre de photos', 'weather': 'Météo'})

fig.show()

# On remarque que il sont plus de photos prises pour certain type de meteo.
# Les valeurs défectueuses s'affichent et faussent la visualisation.

# 5. Nuage de points photos vs humeur

**TODO**

- Créer un graphique de type scatter plot avec mood en abscisse et photos en ordonnée
- Ajouter une info-bulle avec les noms de ville
- Afficher le graphique

In [None]:
# Write your code here

import pandas as pd
import plotly.express as px

df_trips = pd.read_csv("clean_travel_data.csv")

fig = px.scatter(df_trips, x='mood', y='photos', hover_name='city', color='mood', title='Nombre de photos selon l\'humeur', labels={'photos': 'Nombre de photos', 'mood': 'Humeur'})

fig.show()