In [1]:
import pandas as pd
import plotly.express as px

# Lire le fichier CSV dans un DataFrame
df = pd.read_csv('dataset_reformate2.csv')

# Filtrer les lignes où la colonne 'pays' contient le mot 'Total'
df_filtered = df[~df['pays'].str.contains('Total')]

# Calculer la moyenne de 'nombre_total' pour chaque 'pays' pour toutes les dates
df_mean = df_filtered.groupby('pays')['nombre_total'].mean().reset_index()

# Créer la carte choroplèthe avec la moyenne
fig = px.choropleth(df_mean,
                    locations='pays',
                    locationmode='country names',
                    color='nombre_total',
                    hover_name='pays',
                    color_continuous_scale=px.colors.sequential.Plasma,
                    title="Mean of the number of immigrants by country from 2014 to 2024",
                    # Améliorations pour la présentation:
                    # Labels in english
                    labels={'pays': 'Country', 'nombre_total': 'Mean of the number of immigrants'},
                    #labels={'nombre_total': 'Nombre moyen d\'immigrés'},  # Etiquette plus claire
                    projection="natural earth",  # Projection plus esthétique
                    height=600,  # Ajuster la hauteur pour une meilleure lisibilité
                    width=1000  # Ajuster la largeur pour une meilleure lisibilité
                    )

# Améliorer l'apparence du titre
fig.update_layout(
    title_font_size=24,  # Augmenter la taille de la police du titre
    title_x=0.5,  # Centrer le titre
    title_xanchor='center'  # Centrer le titre horizontalement
)

# Améliorer l'apparence de la légende
fig.update_layout(
    coloraxis_colorbar=dict(
        # Add english title
        title="Mean of the number of immigrants",
        title_side='right',  # Position du titre de la légende
        ticks='outside',  # Position des graduations
        ticklen=5,  # Longueur des graduations
        thicknessmode="pixels", thickness=20,  # Epaisseur de la légende
        lenmode="pixels", len=300  # Longueur de la légende
    )
)

# Afficher la carte
fig.show()

In [5]:
import pandas as pd
import plotly.express as px

# Lire le fichier CSV dans un DataFrame
df = pd.read_csv('dataset_reformate2.csv')

# Filtrer les lignes où la colonne 'pays' contient le mot 'Total'
df_filtered = df[~df['pays'].str.contains('Total')]

# Calculer la somme de 'nombre_total' pour chaque 'pays' pour toutes les dates
df_sum = df_filtered.groupby('pays')['nombre_total'].sum().reset_index()

# Calculer le pourcentage pour chaque pays
df_sum['percentage'] = (df_sum['nombre_total'] / df_sum['nombre_total'].sum()) * 100

# Créer une nouvelle colonne 'pays_regroupé'
df_sum['pays_regroupé'] = df_sum.apply(lambda row: 'AUTRES' if row['percentage'] < 3 else row['pays'], axis=1)

# Regrouper les pays inférieurs à 3%
df_grouped = df_sum.groupby('pays_regroupé')['nombre_total'].sum().reset_index()

# Créer le graphique en anneau
fig = px.pie(df_grouped, 
             values='nombre_total', 
             names='pays_regroupé', 
             hole=0.5,  # Pour créer l'anneau
             color_discrete_sequence=px.colors.qualitative.Pastel,  # Couleurs pastel
             labels={'pays_regroupé': ''}  # Enlever les labels du plot
             )  

# Améliorer l'apparence du graphique
fig.update_traces(textposition='inside', textinfo='percent')  # Enlever les labels du plot
fig.update_layout(title="Proportion du nombre total d'immigrés par pays pour toutes les dates",
                  title_font_size=20,
                  title_x=0.5, 
                  title_xanchor='center',
                  showlegend=True,   # Afficher la légende
                  legend=dict(
                      orientation="v",  # Orientation verticale
                      yanchor="top", y=0.99,  # Positionnement en haut
                      xanchor="left", x=0.01  # Positionnement à gauche
                  ))

# Afficher le graphique
fig.show()