# Visualisation des données avec Plotly

A présent que vous savez manipuler les données avec pandas, vous allez apprendre à représenter les données sous forme de jolis graphiques à l'aide de la bibliothèque **Plotly Express**.  
On utilisera le fichier **clean_travel_data.csv** comme base.

Pour vous aider, voici la documentation officielle de Plotly :  
https://plotly.com/python/plotly-express/

N'hésitez pas à rechercher les fonctions, paramètres et exemples nécessaires pour réaliser les tâches demandées.  

Chaque cellule de code est précédée d'une cellule TODO indiquant la liste des objectifs à atteindre.

Répondez également aux quelques petites questions des TODO s'il y en a.

In [1]:
# Il faut installer la bibliothèque plotly. On verra comment faire ça proprement plus tard.
!pip install plotly

Collecting plotly
  Downloading plotly-6.2.0-py3-none-any.whl.metadata (8.5 kB)
Collecting narwhals>=1.15.1 (from plotly)
  Downloading narwhals-1.45.0-py3-none-any.whl.metadata (11 kB)
Downloading plotly-6.2.0-py3-none-any.whl (9.6 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m9.6/9.6 MB[0m [31m10.0 MB/s[0m eta [36m0:00:00[0ma [36m0:00:01[0m
[?25hDownloading narwhals-1.45.0-py3-none-any.whl (371 kB)
Installing collected packages: narwhals, plotly
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2/2[0m [plotly]2m1/2[0m [plotly]
[1A[2KSuccessfully installed narwhals-1.45.0 plotly-6.2.0


# 1. Nombre total de photos par ville

**TODO**

- Importer plotly.express sous le nom px
- Créer un graphique en barres représentant le total de photos par ville
- Trier les villes selon le nombre de photos de manière décroissante
- Afficher le graphique

In [7]:
# Write your code here

import pandas as pd
import plotly.express as px

# charger les données depuis le fichier csv
df_trips_ploty = pd.read_csv("travel_data.csv")

# Regrouper les données et faire la sommes des photos par ville
photos_per_city = df_trips_ploty.groupby("city")["photos"].sum().reset_index()

# Tri des villes selon nombre de photos décroissante
photos_per_city = photos_per_city.sort_values(by="photos", ascending=False)

# Créer un graphique
fig = px.bar (
    photos_per_city,
       x = "city",
       y = "photos",
       title = "Nombre de photos pris par ville",
       labels = {"photos": " Nombre de photos", "city": "Ville"},
       )

fig.show()


# 2. Répartition des humeurs (mood) en camembert

**TODO**

- Créer un graphique en camembert basé sur la répartition des humeurs (colonne mood)
- Afficher les pourcentages sur chaque tranche
- Afficher le graphique

In [8]:
# Write your code here

# répartition des humeurs : 
mood_count = df_trips_ploty["mood"].value_counts(). reset_index()

# Créer un graphique sur la répartition des humeurs :
fig = px.pie (
    mood_count,
    names = "mood",
    values = "count",
    title = " La répartition des humeurs pendant le voyage",
    color_discrete_sequence=px.colors.qualitative.Pastel,
)

# Afficher les pourcentages sur chaque tranche:
fig.update_traces(textinfo='percent+label')

# Afficher le graohique :
fig.show()


# 3. Évolution du nombre de photos dans le temps

**TODO**

- Créer un graphique en ligne avec la date sur l'axe des x et le nombre de photos sur l'axe des y
- Colorer les lignes ou points selon la météo (weather)
- Afficher le graphique
- Que remarquez vous ? Qu'auriez du vous faire ?s

In [9]:
# Write your code here

import pandas as pd
import plotly.express as px

# grouper par date et faire la somme des photos
date_photos = df_trips_ploty.groupby("date")["photos"].sum().reset_index()

# créer le graphique en ligne
fig = px.line(
    date_photos,
    x="date",
    y="photos",
    title="Évolution du nombre de photos prises dans le temps",
    markers=True
)

fig.show()
   # remarque


# 4. Distribution du nombre de photos selon la météo

**TODO**

- Créer un diagramme en boîte (box plot) pour visualiser la répartition du nombre de photos selon la météo
- Afficher le graphique
- Quelles conclusions tirez-vous de ce graphe ?

In [None]:
# Write your code here
import pandas as pd
import plotly.express as px

df_trips_ploty = pd.read_csv("travel_data.csv")

fig = px.box(
    df_trips_ploty,
    x="weather",     
    y="photos",      
    title="Répartition du nombre de photos selon la météo",
    points="all"
)  

fig.show()

# La conclusion que je peux tirer de cet graphe est qu'il y'a eu plus de photos prise en temps ensoleillé que durant les temps pluvieuse et pour la visualisation 
# cet type de graphe est moins pertinente. 

# 5. Nuage de points photos vs humeur

**TODO**

- Créer un graphique de type scatter plot avec mood en abscisse et photos en ordonnée
- Ajouter une info-bulle avec les noms de ville
- Afficher le graphique

In [16]:
# Write your code here

import pandas as pd
import plotly.express as px

df_trips_ploty = pd.read_csv("travel_data.csv")

# Création du graphique et info-bulle avec les noms de villes
fig = px.scatter (
    df_trips_ploty,
    x= "mood",
    y= "photos",
    hover_name= "city",
    title= "Répartition des photos en fonction des humeurs"
)

# Afficher le graphique 

fig.show()
