In [65]:
import pandas as pd
import plotly.graph_objects as go
import plotly.express as px

In [66]:
df = pd.read_csv("./data/raw/candidats-eur-2024.csv", delimiter=";")

In [67]:
df.describe(include="all")

Unnamed: 0,Code circonscription,Circonscription,Numéro de panneau,Libellé de la liste,Tête de liste,Ordre,Sexe,Nom sur le bulletin de vote,Prénom sur le bulletin de vote,Date de naissance,Profession,Code personnalité,Sortant
count,3078,3078,3078.0,3078,38,3078.0,3078,3078,3078,3078,3078,73,52
unique,1,1,,38,1,,2,2756,1068,2861,41,7,1
top,FE,France entière,,POUR UNE HUMANITE SOUVERAINE,OUI,,M,MARTIN,Pierre,10/02/1989,(33) - Cadre de la fonction publique,RPE,OUI
freq,3078,3078,,81,38,,1546,9,35,3,247,52,52
mean,,,19.5,,,41.0,,,,,,,
std,,,10.967638,,,23.384703,,,,,,,
min,,,1.0,,,1.0,,,,,,,
25%,,,10.0,,,21.0,,,,,,,
50%,,,19.5,,,41.0,,,,,,,
75%,,,29.0,,,61.0,,,,,,,


In [68]:
df.head()

Unnamed: 0,Code circonscription,Circonscription,Numéro de panneau,Libellé de la liste,Tête de liste,Ordre,Sexe,Nom sur le bulletin de vote,Prénom sur le bulletin de vote,Date de naissance,Profession,Code personnalité,Sortant
0,FE,France entière,1,POUR UNE HUMANITE SOUVERAINE,OUI,1,M,DEHER-LESAINT,Léopold-Edouard,16/10/1947,"(35) - Profession de l'information, des arts e...",,
1,FE,France entière,1,POUR UNE HUMANITE SOUVERAINE,,2,F,BOULOGNE,Sandra,22/06/1976,(22) - Commerçant et assimilé,,
2,FE,France entière,1,POUR UNE HUMANITE SOUVERAINE,,3,M,AJ,Rodrigue,23/05/1981,(47) - Technicien,,
3,FE,France entière,1,POUR UNE HUMANITE SOUVERAINE,,4,F,JOBY,Valente,20/07/1939,(75) - Ancienne profession intermédiaire,,
4,FE,France entière,1,POUR UNE HUMANITE SOUVERAINE,,5,M,MAYOUTE,Richard,21/12/1966,(22) - Commerçant et assimilé,,


In [69]:
df_sex_by_list = df.groupby(["Libellé de la liste"])["Sexe"].value_counts(
    normalize=True
)

In [70]:
df_sex_by_list

Libellé de la liste                                                            Sexe
"POUR LE PAIN, LA PAIX, LA LIBERTÉ !" PRÉSENTÉE PAR LE PARTI DES TRAVAILLEURS  F       0.506173
                                                                               M       0.493827
ALLIANCE RURALE                                                                M       0.506173
                                                                               F       0.493827
BESOIN D'EUROPE                                                                F       0.506173
                                                                                         ...   
RÉVEILLER L'EUROPE                                                             F       0.493827
ÉCOLOGIE AU CENTRE                                                             M       0.506173
                                                                               F       0.493827
ÉQUINOXE : ÉCOLOGIE PRATIQUE ET RENOUVEAU DÉMOCRATIQ

In [71]:
traces = []
for data_config in [
    {"cat": "M", "color": "#ee5a45", "name": "Masculin"},
    {"cat": "F", "color": "#1e8f89", "name": "Féminin"},
]:
    data = df_sex_by_list[:, data_config["cat"]].sort_index() * 100
    trace = go.Bar(
        y=data.index,
        x=data,
        orientation="h",
        marker_color=data_config["color"],
        name=data_config["name"],
    )
    traces.append(trace)
fig = go.Figure(traces)
fig.update_layout(
    barmode="stack",
    plot_bgcolor="white",
    height=1000,
    title="La parité est elle respectée au sein des listes ?",
    title_font_family="Segoe UI",
    title_x=0.5,
    title_xanchor="center",
)
fig.add_vline(x=50, annotation_text="50%", annotation_position="top")
fig.update_xaxes(ticksuffix="%")
fig.show()

In [41]:
df["age"] = (
    pd.Timestamp.now() - pd.to_datetime(df["Date de naissance"], format="%d/%m/%Y")
).dt.components.days // 365

In [63]:
df["age"].mean()

49.82033788174139

In [42]:
bins = [18, 30, 40, 50, 60, 70, 120]
labels = ["18-29", "30-39", "40-49", "50-59", "60-69", "70+"]

# Ajouter une colonne pour les tranches d'âges
df["Tranche d'âge"] = pd.cut(df["age"], bins=bins, labels=labels, right=False)

In [44]:
df["Tranche d'âge"].value_counts()

Tranche d'âge
50-59    759
60-69    594
40-49    592
30-39    484
18-29    355
70+      294
Name: count, dtype: int64

In [45]:
df_age_by_list = df.groupby(["Libellé de la liste"])["Tranche d'âge"].value_counts(
    normalize=True
)

In [46]:
df_age_by_list

Libellé de la liste                                                            Tranche d'âge
"POUR LE PAIN, LA PAIX, LA LIBERTÉ !" PRÉSENTÉE PAR LE PARTI DES TRAVAILLEURS  18-29            0.308642
                                                                               30-39            0.172840
                                                                               40-49            0.172840
                                                                               60-69            0.160494
                                                                               50-59            0.148148
                                                                                                  ...   
ÉQUINOXE : ÉCOLOGIE PRATIQUE ET RENOUVEAU DÉMOCRATIQUE                         30-39            0.271605
                                                                               50-59            0.185185
                                                                   

In [62]:
traces = []
for data_config in [
    {"cat": "18-29", "color": "#ee5a45", "name": "18-29 ans"},
    {"cat": "30-39", "color": "#1e8f89", "name": "30-39 ans"},
    {"cat": "40-49", "color": "#1e8f89", "name": "40-49 ans"},
    {"cat": "50-59", "color": "#1e8f89", "name": "50-59 ans"},
    {"cat": "60-69", "color": "#1e8f89", "name": "60-69 ans"},
    {"cat": "70+", "color": "#1e8f89", "name": "70 ans et plus"},
]:
    data = df_age_by_list[:, data_config["cat"]].sort_index() * 100
    trace = go.Bar(
        x=data.index,
        y=data,
        name=data_config["name"],
    )
    traces.append(trace)
fig = go.Figure(traces)
fig.update_layout(
    barmode="stack",
    plot_bgcolor="white",
    height=1000,
    title="Distribution das ages",
    title_font_family="Segoe UI",
    title_x=0.5,
    title_xanchor="center",
    legend_orientation="h",
    legend_y=1.2,
)
fig.update_yaxes(ticksuffix="%")
fig.show()