In [None]:
import pandas as pd
import plotly.express as px

In [2]:
# Chargemet du dataset
df_final = pd.read_csv('../data/world_happiness_2015-2019_combined.csv')

In [3]:
# --- DÉFINITION DE LA CHARTE GRAPHIQUE PLOTLY ---

# 1. Palettes de couleurs
CONTINUOUS_PALETTE = 'Viridis' # Pour les scores (PIB, Bonheur...)
CATEGORICAL_PALETTE = 'Safe' # Pour les catégories (Régions...)

# 2. Template de Layout
# C'est le dictionnaire à réutiliser
GLOBAL_TEMPLATE_LAYOUT = dict(
    # Le thème de base (fond blanc, grilles légères)
    template='plotly_white', 
    
    # Définition des polices
    font=dict(
        family="Arial, sans-serif",
        size=12,
        color="#333333" # Gris très foncé, plus doux que le noir
    ),
    
    # Titre principal
    title=dict(
        font=dict(size=20, weight="bold"),
        x=0.5, # Centrer le titre
        xanchor='center'
    ),
    
    # Axes X et Y
    xaxis=dict(
        title_font=dict(size=14, weight="bold"),
        tickfont=dict(size=12),
        gridcolor='#EAEAEA', # Grille très claire
        zerolinecolor='#DDDDDD' # Ligne du zéro
    ),
    yaxis=dict(
        title_font=dict(size=14, weight="bold"),
        tickfont=dict(size=12),
        gridcolor='#EAEAEA',
    ),
    
    # Légende (pour les catégories)
    legend=dict(
        orientation='h', # Légende horizontale
        yanchor='bottom',
        y=1.02, # Placée juste au-dessus du graphique
        xanchor='right',
        x=1,
        title_text='' # Cacher le titre de la légende (souvent redondant)
    ),
    
    # Interactivité (la partie la plus importante)
    hovermode='closest', # Montre l'infobulle de l'élément le plus proche
    
    # Style de l'infobulle (hover)
    hoverlabel=dict(
        bgcolor="white",
        font_size=12,
        font_family="Arial, sans-serif"
    )
)

print("Charte graphique et template Plotly chargés.")

Charte graphique et template Plotly chargés.


In [None]:
# Premières données sur notre dataframe
print(f"Les dimensions du dataframe : {df_final.shape}")
df_final.info()
df_final.head()

In [None]:
# choropleth() : Carte mondiale du score de bonheur avec gradients de couleur
# Création du graphique de base

# Recherche des bornes globales du score (Echelle de coloration)
global_min_score = df_final['Score'].min()
global_max_score = df_final['Score'].max()
print(f"Échelle de score globale fixée de {global_min_score:.2f} à {global_max_score:.2f}")

fig = px.choropleth(
    df_final,
    locations='Country',
    locationmode='country names', # Mode de lecture des pays

    color='Score', # Metrique a colorer

    # Bases de l'animation
    animation_frame='Year', # Animation basée sur les années
    animation_group='Country', # Liaison des pays entre les animations

    # Valeurs hoover
    hover_name='Country',
    hover_data={
        'Region': True,
        'Rank': True,
        'GDP_per_Capita': ':.2f',
        'Year': True,
        'Country': False},

    color_continuous_scale=CONTINUOUS_PALETTE,
    range_color = [global_min_score, global_max_score],

    title='Évolution du Score de Bonheur dans le Monde (2015-2019)'
)

# Application de notre template
fig.update_layout(GLOBAL_TEMPLATE_LAYOUT)

# Personnalisation de la carte
fig.update_layout(
    geo=dict(
        showframe=False,
        showcoastlines=False,
        projection_type='natural earth'
    )
)

fig.show()

In [None]:
# Nuage des points scatter() : Relation PIB bonheur avec hover interactif

# Recherche des bornes globales des axes X et Y
# Ajout  d'une petite marge (ex: * 0.95 et * 1.05) pour que les points ne soient pas collés aux bords.
global_min_gdp = df_final['GDP_per_Capita'].min() * 0.9
global_max_gdp = df_final['GDP_per_Capita'].max() * 1.05

global_min_score = df_final['Score'].min() * 0.9
global_max_score = df_final['Score'].max() * 1.05

print(f"Axe X (PIB) fixé de {global_min_gdp:.2f} à {global_max_gdp:.2f}")
print(f"Axe Y (Score) fixé de {global_min_score:.2f} à {global_max_score:.2f}")

fig = px.scatter(
    df_final,

    x='GDP_per_Capita',
    y='Score',

    color='Region', # Metrique à colorier
    size='Social_Support', # Changer la taille des points

    hover_name='Country',

    # Les arguments d'animations
    animation_frame = 'Year',       
    animation_group = 'Country',      
    
    # Application des bornes
    range_x = [global_min_gdp, global_max_gdp],
    range_y = [global_min_score, global_max_score],
                                        
    title = 'Évolution du Bonheur vs. PIB (2015-2019)',
    # Pour de plus jolies étiquettes
    labels = { 
        'GDP_per_Capita': 'PIB par Habitant',
        'Score': 'Score de Bonheur'}
)

# Application de notre template
fig.update_layout(GLOBAL_TEMPLATE_LAYOUT)

fig.update_layout(
    title_x=0.5,        # Recentrage du titre
    title_y=0.05,       # Positionne le titre verticalement (5% du bas)
    title_yanchor='top'   # Ancrage du titre à cette position
)

fig.show()

In [None]:
# Diagramme en barre bar() des top 10 des pays

# Liste de nos dataframes a concatener (top 10) ===============================================================
# Preparation des données
top_to_concat = []

# top des pays par PIB 2015
top_10_2015 = df_final[df_final['Year']==2015].sort_values("GDP_per_Capita", ascending=False).head(10)
top_to_concat.append(top_10_2015)

# top des pays par PIB 2016
top_10_2016 = df_final[df_final['Year']==2016].sort_values("GDP_per_Capita", ascending=False).head(10)
top_to_concat.append(top_10_2016)

# top des pays par PIB 2017
top_10_2017 = df_final[df_final['Year']==2017].sort_values("GDP_per_Capita", ascending=False).head(10)
top_to_concat.append(top_10_2017)

# top des pays par PIB 2018
top_10_2018 = df_final[df_final['Year']==2018].sort_values("GDP_per_Capita", ascending=False).head(10)
top_to_concat.append(top_10_2018)

# top des pays par PIB 2019
top_10_2019 = df_final[df_final['Year']==2019].sort_values("GDP_per_Capita", ascending=False).head(10)
top_to_concat.append(top_10_2019)

# dataframe final
top_10_final = pd.concat(top_to_concat, ignore_index=True)
top_10_final

# ===========================================================================================================

# Recherche de l'echelle pour l'axe X
max_gdp = top_10_final['GDP_per_Capita'].max() * 1.05 # 5% de marge
min_gdp = 0 # Les barres commencent à 0

fig = px.bar(
    top_10_final,
    x='GDP_per_Capita',
    y='Country',
    orientation='h',

    # Parametres animations
    animation_frame='Year',
    animation_group='Country',

    color='Region',
    hover_name='Country',

    # Appplication de l'echelle sur l'axe X
    range_x=[min_gdp, max_gdp],

    title='Top 10 des Pays par PIB par Habitant (2015-2019)',
    labels={
        'GDP_per_Capita':'PIB par habitants',
        'Country':'Pays'
    }
)

# Application de notre template
fig.update_layout(GLOBAL_TEMPLATE_LAYOUT)

# Ajouter du tri des barres (l'effet "Race")
fig.update_layout(yaxis_categoryorder='total ascending')

fig.update_layout(
    title_x=0.5,        # Recentrage du titre
    title_y=0.95,       # Positionne le titre verticalement
    title_yanchor='top'   # Ancrage du titre à cette position
)

fig.show()

In [None]:
# Diagramme en barre bar() des flop 10 des pays

# Liste de nos dataframes a concatener (flop 10) ===============================================================
# Preparation des données
flop_to_concat = []

# flop des pays par PIB 2015
flop_10_2015 = df_final[df_final['Year']==2015].sort_values("GDP_per_Capita", ascending=True).head(10)
flop_to_concat.append(flop_10_2015)

# flop des pays par PIB 2016
flop_10_2016 = df_final[df_final['Year']==2016].sort_values("GDP_per_Capita", ascending=True).head(10)
flop_to_concat.append(flop_10_2016)

# flop des pays par PIB 2017
flop_10_2017 = df_final[df_final['Year']==2017].sort_values("GDP_per_Capita", ascending=True).head(10)
flop_to_concat.append(flop_10_2017)

# flop des pays par PIB 2018
flop_10_2018 = df_final[df_final['Year']==2018].sort_values("GDP_per_Capita", ascending=True).head(10)
flop_to_concat.append(flop_10_2018)

# flop des pays par PIB 2019
flop_10_2019 = df_final[df_final['Year']==2019].sort_values("GDP_per_Capita", ascending=True).head(10)
flop_to_concat.append(flop_10_2019)

# dataframe final
flop_10_final = pd.concat(flop_to_concat, ignore_index=True)
flop_10_final

# ===========================================================================================================

# Recherche de l'echelle pour l'axe X
max_gdp = flop_10_final['GDP_per_Capita'].max() * 1.05 # 5% de marge
min_gdp = 0 # Les barres commencent à 0


fig = px.bar(
    flop_10_final,
    x='GDP_per_Capita',
    y='Country',
    orientation='h',

    # Parametres animations
    animation_frame='Year',
    animation_group='Country',

    color='Region',
    hover_name='Country',

    # Appplication de l'echelle sur l'axe X
    range_x=[min_gdp, max_gdp],

    title='Flop 10 des Pays par PIB par Habitant (2015-2019)',
    labels={
        'GDP_per_Capita':'PIB par habitants',
        'Country':'Pays'
    }
)

# Application de notre template
fig.update_layout(GLOBAL_TEMPLATE_LAYOUT)

# Ajouter du tri des barres (l'effet "Race")
fig.update_layout(yaxis_categoryorder='total ascending')

fig.update_layout(
    title_x=0.5,        # Recentrage du titre
    title_y=0.95,       # Positionne le titre verticalement
    title_yanchor='top'   # Ancrage du titre à cette position
)

fig.show()

In [None]:
# heatmap() Corrélation entre indicateurs

# 1. Préparation des données : Création la matrice de corrélation
numeric_cols = ['Score', 'GDP_per_Capita', 'Social_Support', 'Health_Life_Expectancy', 'Freedom', 'Trust_Government_Corruption', 'Generosity']
corr_matrix = df_final[numeric_cols].corr()

# 2. Création de la heatmap interactive
fig = px.imshow(
    img = corr_matrix,                     # 1. Les données
    
    x = corr_matrix.columns,             # 2. Les étiquettes de l'axe X
    y = corr_matrix.index,               # 3. Les étiquettes de l'axe Y
    
    color_continuous_scale = 'RdBu',       # 4. Palette Rouge-Bleu (adaptée à la corrélation)
    color_continuous_midpoint = 0,         # 5. Centrer la couleur sur 0
    zmin = -1, zmax = 1,                 # 6. Bornes de -1 à +1
    
    text_auto = True,                    # 7. Afficher les valeurs (équivalent de 'annot')
    aspect = "auto",                     # 8. Rendre la heatmap rectangulaire
    
    title = 'Matrice de Corrélation Interactive'
)

# 9. (LA PARTIE TECHNIQUE) : Formater le texte pour n'avoir que 2 décimales
# '%{z:.2f}' veut dire : "prends la valeur (z) et formate-la (f) avec 2 décimales"
fig.update_traces(texttemplate="%{z:.2f}")

# Application de notre template
fig.update_layout(GLOBAL_TEMPLATE_LAYOUT)

fig.update_layout(
    title_x=0.5,        # Recentrage du titre
    title_y=0.95,       # Positionne le titre verticalement (5% du bas)
    title_yanchor='top'   # Ancrage du titre à cette position
)

fig.show()

In [None]:
# line() : evolution temporelle
countries_to_plot = [
    'France', 
    'United States', 
    'China', 
    'India', 
    'Nigeria',
    'Brazil'
]

# On filtre le DataFrame pour ne garder que ces pays
df_filtered = df_final[df_final['Country'].isin(countries_to_plot)]


# Création le graphique
fig = px.line(
    df_filtered,  
    
    x='Year',           
    y='GDP_per_Capita', 
    
    color='Country',    
    markers=True,     
    
    hover_name='Country',
    title='Évolution du PIB par Habitant (2015-2019)',
    labels={
        'GDP_per_Capita': 'PIB par Habitant',
        'Year': 'Année'
    }
)

# Application de notre template
fig.update_layout(GLOBAL_TEMPLATE_LAYOUT)

fig.update_layout(
    title_x=0.5,
    title_y=0.9, # Un peu plus bas pour la lisibilité
    title_yanchor='top'
)

fig.show()