In [75]:
import pandas as pd
import plotly.graph_objects as go
import plotly.express as px
import json

In [66]:
df = pd.read_csv("./data/raw/candidats-eur-2024.csv", delimiter=";")

In [67]:
df.describe(include="all")

Unnamed: 0,Code circonscription,Circonscription,Numéro de panneau,Libellé de la liste,Tête de liste,Ordre,Sexe,Nom sur le bulletin de vote,Prénom sur le bulletin de vote,Date de naissance,Profession,Code personnalité,Sortant
count,3078,3078,3078.0,3078,38,3078.0,3078,3078,3078,3078,3078,73,52
unique,1,1,,38,1,,2,2756,1068,2861,41,7,1
top,FE,France entière,,POUR UNE HUMANITE SOUVERAINE,OUI,,M,MARTIN,Pierre,10/02/1989,(33) - Cadre de la fonction publique,RPE,OUI
freq,3078,3078,,81,38,,1546,9,35,3,247,52,52
mean,,,19.5,,,41.0,,,,,,,
std,,,10.967638,,,23.384703,,,,,,,
min,,,1.0,,,1.0,,,,,,,
25%,,,10.0,,,21.0,,,,,,,
50%,,,19.5,,,41.0,,,,,,,
75%,,,29.0,,,61.0,,,,,,,


In [68]:
df.head()

Unnamed: 0,Code circonscription,Circonscription,Numéro de panneau,Libellé de la liste,Tête de liste,Ordre,Sexe,Nom sur le bulletin de vote,Prénom sur le bulletin de vote,Date de naissance,Profession,Code personnalité,Sortant
0,FE,France entière,1,POUR UNE HUMANITE SOUVERAINE,OUI,1,M,DEHER-LESAINT,Léopold-Edouard,16/10/1947,"(35) - Profession de l'information, des arts e...",,
1,FE,France entière,1,POUR UNE HUMANITE SOUVERAINE,,2,F,BOULOGNE,Sandra,22/06/1976,(22) - Commerçant et assimilé,,
2,FE,France entière,1,POUR UNE HUMANITE SOUVERAINE,,3,M,AJ,Rodrigue,23/05/1981,(47) - Technicien,,
3,FE,France entière,1,POUR UNE HUMANITE SOUVERAINE,,4,F,JOBY,Valente,20/07/1939,(75) - Ancienne profession intermédiaire,,
4,FE,France entière,1,POUR UNE HUMANITE SOUVERAINE,,5,M,MAYOUTE,Richard,21/12/1966,(22) - Commerçant et assimilé,,


In [69]:
df_sex_by_list = df.groupby(["Libellé de la liste"])["Sexe"].value_counts(
    normalize=True
)

In [70]:
df_sex_by_list

Libellé de la liste                                                            Sexe
"POUR LE PAIN, LA PAIX, LA LIBERTÉ !" PRÉSENTÉE PAR LE PARTI DES TRAVAILLEURS  F       0.506173
                                                                               M       0.493827
ALLIANCE RURALE                                                                M       0.506173
                                                                               F       0.493827
BESOIN D'EUROPE                                                                F       0.506173
                                                                                         ...   
RÉVEILLER L'EUROPE                                                             F       0.493827
ÉCOLOGIE AU CENTRE                                                             M       0.506173
                                                                               F       0.493827
ÉQUINOXE : ÉCOLOGIE PRATIQUE ET RENOUVEAU DÉMOCRATIQ

In [71]:
traces = []
for data_config in [
    {"cat": "M", "color": "#ee5a45", "name": "Masculin"},
    {"cat": "F", "color": "#1e8f89", "name": "Féminin"},
]:
    data = df_sex_by_list[:, data_config["cat"]].sort_index() * 100
    trace = go.Bar(
        y=data.index,
        x=data,
        orientation="h",
        marker_color=data_config["color"],
        name=data_config["name"],
    )
    traces.append(trace)
fig = go.Figure(traces)
fig.update_layout(
    barmode="stack",
    plot_bgcolor="white",
    height=1000,
    title="La parité est elle respectée au sein des listes ?",
    title_font_family="Segoe UI",
    title_x=0.5,
    title_xanchor="center",
)
fig.add_vline(x=50, annotation_text="50%", annotation_position="top")
fig.update_xaxes(ticksuffix="%")
fig.show()

In [41]:
df["age"] = (
    pd.Timestamp.now() - pd.to_datetime(df["Date de naissance"], format="%d/%m/%Y")
).dt.components.days // 365

In [63]:
df["age"].mean()

49.82033788174139

In [42]:
bins = [18, 30, 40, 50, 60, 70, 120]
labels = ["18-29", "30-39", "40-49", "50-59", "60-69", "70+"]

# Ajouter une colonne pour les tranches d'âges
df["Tranche d'âge"] = pd.cut(df["age"], bins=bins, labels=labels, right=False)

In [44]:
df["Tranche d'âge"].value_counts()

Tranche d'âge
50-59    759
60-69    594
40-49    592
30-39    484
18-29    355
70+      294
Name: count, dtype: int64

In [45]:
df_age_by_list = df.groupby(["Libellé de la liste"])["Tranche d'âge"].value_counts(
    normalize=True
)

In [46]:
df_age_by_list

Libellé de la liste                                                            Tranche d'âge
"POUR LE PAIN, LA PAIX, LA LIBERTÉ !" PRÉSENTÉE PAR LE PARTI DES TRAVAILLEURS  18-29            0.308642
                                                                               30-39            0.172840
                                                                               40-49            0.172840
                                                                               60-69            0.160494
                                                                               50-59            0.148148
                                                                                                  ...   
ÉQUINOXE : ÉCOLOGIE PRATIQUE ET RENOUVEAU DÉMOCRATIQUE                         30-39            0.271605
                                                                               50-59            0.185185
                                                                   

In [62]:
traces = []
for data_config in [
    {"cat": "18-29", "color": "#ee5a45", "name": "18-29 ans"},
    {"cat": "30-39", "color": "#1e8f89", "name": "30-39 ans"},
    {"cat": "40-49", "color": "#1e8f89", "name": "40-49 ans"},
    {"cat": "50-59", "color": "#1e8f89", "name": "50-59 ans"},
    {"cat": "60-69", "color": "#1e8f89", "name": "60-69 ans"},
    {"cat": "70+", "color": "#1e8f89", "name": "70 ans et plus"},
]:
    data = df_age_by_list[:, data_config["cat"]].sort_index() * 100
    trace = go.Bar(
        x=data.index,
        y=data,
        name=data_config["name"],
    )
    traces.append(trace)
fig = go.Figure(traces)
fig.update_layout(
    barmode="stack",
    plot_bgcolor="white",
    height=1000,
    title="Distribution das ages",
    title_font_family="Segoe UI",
    title_x=0.5,
    title_xanchor="center",
    legend_orientation="h",
    legend_y=1.2,
)
fig.update_yaxes(ticksuffix="%")
fig.show()

# Données accessibilité-RGPD-Eco-Index


In [76]:
data = json.load(open("data/complete/program-accessibilite-rgpd-ecoindex.json"))

In [97]:
df = pd.DataFrame(data["data"])

In [98]:
df_clean = df.drop_duplicates("nomListe").sort_values(
    "emicentre_position", ascending=False
)

In [107]:
df_clean

Unnamed: 0,nomListe,website_url,numPanneau,has_pdf,has_falc,has_falc_acc,has_pdf_acc,pdf,falc_acc,pdf_acc,falc,lighthouse_acc,rgpd_mentions_legales,rgpd_politiques_confidentialite,ecoindex_score,ecoindex_grade,ecoindex_ges,color,emicentre_position
30,LIBERTÉ DÉMOCRATIQUE FRANÇAISE,https://www.groupe-ldf.fr/,38,True,False,False,True,0,0,1-liste-38-acc,0,0.91,1,1,37.0,E,2.26,#404040,100
23,FRANCE LIBRE,https://francelibre-2024.fr,30,True,True,False,False,1-liste-30,0,0,1-liste-30-falc,0.89,1,1,12.0,F,2.76,#404040,100
18,NON ! PRENONS-NOUS EN MAINS,https://pnem.eu/,25,True,True,True,False,1-liste-25,1-liste-25-falc-acc,0,0,1.0,1,1,68.0,C,1.64,#404040,100
1,"LA FRANCE FIERE, MENEE PAR MARION MARECHAL ET ...",https://votezmarion.fr,3,True,True,False,False,1-liste-3,0,0,1-liste-3-falc,0.96,1,1,38.0,E,2.24,#404040,100
3,LA FRANCE REVIENT ! AVEC JORDAN BARDELLA ET MA...,https://vivementle9juin.fr,5,True,True,False,False,1-liste-5,0,0,1-liste-5-falc,0.63,1,1,65.0,C,1.7,#0D378A,90
11,"LISTE ASSELINEAU-FREXIT, POUR LE POUVOIR D'ACH...",https://www.upr.fr/actualite/profession-de-foi...,15,False,False,False,False,0,0,0,0,0.74,1,1,32.0,E,2.36,#118088,80
13,LA DROITE POUR FAIRE ENTENDRE LA VOIX DE LA FR...,https://republicains.fr/programme-2024,18,True,True,False,False,1-liste-18,0,0,1-liste-18-falc,0.76,1,1,59.0,C,1.82,#0066CC,50
12,POUR UNE AUTRE EUROPE,https://pouruneautreeurope.fr,17,True,True,True,True,0,1-liste-17-falc-acc,1-liste-17-acc,0,0.88,1,1,72.0,B,1.56,#adc1fd,30
15,NOUS LE PEUPLE,https://www.nous-le-peuple.fr/,21,True,True,False,False,1-liste-21,0,0,1-liste-21-falc,0.89,1,1,37.0,E,2.26,#ffc0c0,30
7,BESOIN D'EUROPE,https://besoindeurope.fr,11,True,True,True,False,1-liste-11,1-liste-11-falc-acc,0,0,0.97,1,1,47.0,D,2.06,#ffeb00,30


In [152]:
df_clean[["emicentre_position", "nomListe"]].to_numpy()

array([[100, 'LIBERTÉ DÉMOCRATIQUE FRANÇAISE'],
       [100, 'FRANCE LIBRE'],
       [100, 'NON ! PRENONS-NOUS EN MAINS'],
       [100,
        'LA FRANCE FIERE, MENEE PAR MARION MARECHAL ET SOUTENUE PAR ÉRIC ZEMMOUR'],
       [90, 'LA FRANCE REVIENT ! AVEC JORDAN BARDELLA ET MARINE LE PEN'],
       [80,
        "LISTE ASSELINEAU-FREXIT, POUR LE POUVOIR D'ACHAT ET POUR LA PAIX"],
       [50,
        'LA DROITE POUR FAIRE ENTENDRE LA VOIX DE LA FRANCE EN EUROPE'],
       [30, 'POUR UNE AUTRE EUROPE'],
       [30, 'NOUS LE PEUPLE'],
       [30, "BESOIN D'EUROPE"],
       [20, 'ALLIANCE RURALE'],
       [0, 'POUR UNE DEMOCRATIE REELLE : DECIDONS NOUS-MEMES !'],
       [0, 'ESPERANTO LANGUE COMMUNE'],
       [0, 'PARTI PIRATE'],
       [0, 'PARTI ANIMALISTE - LES ANIMAUX COMPTENT, VOTRE VOIX AUSSI'],
       [0, 'DEFENDRE LES ENFANTS'],
       [0, 'LA RUCHE CITOYENNE'],
       [-30, 'ÉCOLOGIE AU CENTRE'],
       [-30, 'EUROPE TERRITOIRES ÉCOLOGIE'],
       [-30, 'ÉQUINOXE : ÉCOLOGIE PRATIQU

In [182]:
traces = []
trace = go.Bar(
    y=df_clean["nomListe"],
    x=df_clean["ecoindex_score"],
    marker_color=df_clean["color"],
    orientation="h",
    text=df_clean["ecoindex_score"],
    texttemplate="%{x}",
    hovertemplate="La site de liste %{y} a un score EcoIndex de %{x}",
)
traces.append(trace)

fig = go.Figure(traces)
fig.update_layout(
    showlegend=False,
    plot_bgcolor="white",
    height=1000,
    title="Quelle liste a le site l'impact environnemental le plus contenu ?<br><sup>Basé sur l'EcoIndex, plus le score est haut, plus l'impact environemental est contenu.</sup>",
    margin_t=120,
)
fig.update_xaxes(
    title="Score EcoIndex",
    range=[0, 100],
    showgrid=True,
    gridcolor="black",
    griddash="dot",
    linewidth=1,
    linecolor="black",
)
fig.add_hrect(
    y0=-0.6,
    y1=4.5,
    annotation_text="Extreme Droite",
    annotation_position="right",
    annotation_textangle=-90,
    fillcolor="#505050",
    opacity=0.25,
    line_width=0,
    layer="below",
)
fig.show()

In [191]:
traces = []
trace = go.Bar(
    y=df_clean["nomListe"],
    x=df_clean["lighthouse_acc"] * 100,
    marker_color=df_clean["color"],
    orientation="h",
    text=df_clean["ecoindex_score"],
    texttemplate="%{x}",
    hovertemplate="La site de liste %{y} a un score EcoIndex de %{x}",
)
traces.append(trace)

fig = go.Figure(traces)
fig.update_layout(
    showlegend=False,
    plot_bgcolor="white",
    height=1000,
    title="Quelle liste a le site le plus accessible ?",
    margin_t=120,
)
fig.update_xaxes(
    title="Score Lighthouse",
    range=[0, 100],
    showgrid=True,
    gridcolor="black",
    griddash="dot",
    linewidth=1,
    linecolor="black",
)
fig.show()

In [193]:
data_full = json.load(open("data/complete/program-with-dashlord.json"))

In [194]:
df_full = pd.DataFrame(data_full["data"])

In [197]:
df_full["num_trackers"] = df_full["dashlord"].apply(
    lambda x: len(x.get("thirdparties", {}).get("trackers", [])) if x else 0
)

In [199]:
df_full.sample(5)

Unnamed: 0,nomTeteListe,prenomTeteListe,pdf,falc_acc,pdf_acc,falc,numPanneau,nomListe,has_pdf,has_falc,has_falc_acc,has_pdf_acc,contact_mail,website_url,parite,professions,age,hasTech,dashlord,num_trackers
26,ELMAYAN,Lorys,1-liste-32,0,0,1-liste-32-falc,32,LA RUCHE CITOYENNE,True,True,False,False,[laruchecitoyenne@gmail.com],[https://www.laruchecitoyenne.eu/],"{'F': 50.6, 'M': 49.4}",{'Personne diverse sans activité professionnel...,"{'50-59': 40.7, '40-49': 27.2, '60-69': 18.5, ...",0,"{'404': [], 'url': 'https://www.laruchecitoyen...",25
21,GLUCKSMANN,Raphaël,0,1-liste-27-falc-acc,1-liste-27-acc,0,27,RÉVEILLER L'EUROPE,True,True,True,True,[],[https://www.glucksmann2024.eu/],"{'M': 50.6, 'F': 49.4}","{'Cadre de la fonction publique': 33.3, 'Cadre...","{'50-59': 28.4, '40-49': 25.9, '30-39': 18.5, ...",0,,0
18,LABIB,Selma,1-liste-22,0,0,0,22,"POUR UN MONDE SANS FRONTIERES NI PATRONS, URGE...",True,False,False,False,[],[https://npa-revolutionnaires.org],"{'F': 50.6, 'M': 49.4}","{'Elève, étudiant': 16.0, 'Professeur, profess...","{'30-39': 33.3, '18-29': 25.9, '40-49': 23.5, ...",0,"{'404': None, 'url': 'https://npa-revolutionna...",11
10,CHOLLEY,Marine,1-liste-13,1-liste-13-falc-acc,0,0,13,ÉQUINOXE : ÉCOLOGIE PRATIQUE ET RENOUVEAU DÉMO...,True,True,True,False,[],[https://parti-equinoxe.fr/],"{'F': 50.6, 'M': 49.4}",{'Ingénieur et cadre technique d'entreprise': ...,"{'18-29': 37.0, '30-39': 29.6, '50-59': 19.8, ...","{'name': 'falc_acc', 'occurence': 1}","{'404': None, 'url': 'https://parti-equinoxe.f...",3
12,ASSELINEAU,François,0,0,0,0,15,"LISTE ASSELINEAU-FREXIT, POUR LE POUVOIR D'ACH...",False,False,False,False,[],[https://www.upr.fr/actualite/profession-de-fo...,"{'M': 50.6, 'F': 49.4}","{'Ancien cadre': 13.6, 'Professeur, profession...","{'60-69': 43.2, '40-49': 18.5, '70+': 14.8, '3...",0,"{'404': None, 'url': 'https://www.upr.fr/actua...",0


In [203]:
df_full = df_full.merge(df, on="nomListe")

In [205]:
df_full = df_full.drop_duplicates("nomListe").sort_values(
    "emicentre_position", ascending=False
)

In [209]:
df_full["num_trackers"]

30     18
23    144
18     22
1      30
3      73
11      0
13     25
12      5
15     77
7      81
22     28
0      66
29      0
6       0
5      23
27      1
25     25
28    355
24    151
9       3
10    135
14    176
8      63
4      29
19      0
20      0
2       8
17    198
26      8
16     11
Name: num_trackers, dtype: int64

In [217]:
traces = []
trace = go.Bar(
    y=df_full["nomListe"],
    x=df_full["num_trackers"],
    marker_color=df_full["color"],
    orientation="h",
    text=df_full["num_trackers"],
    textposition="outside",
)
traces.append(trace)

fig = go.Figure(traces)
fig.update_layout(
    showlegend=False,
    plot_bgcolor="white",
    height=1000,
    title="Quelle liste a le site avec le plus de trackers ?",
    margin_t=120,
)
fig.update_xaxes(
    title="Nombre de trackers",
    showgrid=True,
    gridcolor="black",
    griddash="dot",
    linewidth=1,
    linecolor="black",
    range=[0, max(df_full["num_trackers"]) * 1.1],
)
fig.show()