# Projet Diversité et inclusion en entreprise #

**Problématique : Comment les différents aspects sociaux et professionnels (rémunération, formation, conditions de travail, handicap, absentéisme, etc.) influencent-ils la structure et l’évolution des effectifs d’EDF SA sur une période donnée ?**

*Respect de la PEP-8*

In [33]:
%load_ext pycodestyle_magic
%pycodestyle_on

The pycodestyle_magic extension is already loaded. To reload it, use:
  %reload_ext pycodestyle_magic


In [2]:
import pandas as pd

#### 1) Comparaison de l'ecart salarial homme/femme selon l'annee ####

In [75]:
salaire = pd.read_csv("data/promotion.csv", delimiter=";")
salaire = salaire[salaire['Type de contrat']=="Statutaire"]
salaire = salaire[salaire['Indicateur']=='Rémunération mensuelle moyenne brute']
salaire = salaire[(salaire['Collège']=='Cadre') | (salaire['Collège']=='Maitrise') | (salaire['Collège']=='Execution')]
salaire = salaire.drop(columns=['Perimètre juridique', 'Perimètre spatial',
       'Spatial perimeter', 'Indicateur', 'Indicator', 'Type de contrat',
       'Type of contract', 'Employee category', 'Plage M3E',
       'M3E classification', 'Gender', 'Unité', 'Unit',
       'Chapitre du bilan social'])
salaire = salaire.rename(columns={'Valeur': 'Salaire mensuel moyen brut'})
salaire

Unnamed: 0,Année,Collège,Genre,Salaire mensuel moyen brut
6,2023,Cadre,Femme,7175.0
7,2023,Maitrise,Homme,4990.0
46,2023,Maitrise,Femme,4279.0
47,2023,Execution,Homme,3894.0
48,2023,Execution,Femme,3290.0
60,2023,Cadre,Homme,7842.0
74,2022,Maitrise,Homme,4521.0
99,2022,Cadre,Homme,7353.0
100,2022,Maitrise,Femme,3913.0
101,2022,Execution,Homme,3546.0


#### 2) Corrélation entre formation et promotions ####

Ici, nous allons analyser l'effet des formations (nombre d'heures, nombre d'employés ayant été upgrade) avec une petite comparaison entre hommes et femmes

Graphique 1 : 

In [8]:
promotion = pd.read_csv("data/promotion.csv", delimiter=";")
promotion = promotion[promotion["Indicateur"]=="Promotions dans un collège supérieur"]
promotion = promotion[promotion["Type de contrat"]=="Statutaire"]
drop = ['Perimètre juridique', 'Unité', 'Perimètre spatial',
       'Spatial perimeter', 'Indicator',
       'Type of contract', 'Employee category', 'Plage M3E',
       'M3E classification', 'Gender', 'Unit',
       'Chapitre du bilan social', 'Type de contrat', 'Indicateur']
promotion = promotion.drop(columns=drop)
promotion = promotion.groupby(["Année", "Collège", "Genre"]).sum().reset_index()
promotion = promotion.rename(columns={'Collège': 'Evolution'})
promotion['Collège'] = 'Exécution'
promotion.loc[promotion['Evolution'] == 'Maîtrise vers Cadre', 'Collège'] = 'Maitrise'

In [9]:
formation = pd.read_csv("data/formation.csv", delimiter = ";")
formation = formation[(formation["Collège"] == "Maitrise") | (formation["Collège"] == "Exécution")]
formation = formation[formation["Indicateur"] == "Salariés ayant suivi au moins un stage"]
drop = ['Perimètre juridique', 'Unité', 'Perimètre spatial',
       'Spatial perimeter', 'Indicator',
       'Employee category', 'Plage M3E', 'M3E classification',
       'Gender', 'Unit', 'Chapitre du bilan social']
formation = formation.drop(columns=drop)

In [118]:
df1_2 = pd.merge(promotion, formation, on=['Année','Collège','Genre'], how='inner')
df1_2 = df1_2.rename(columns={'Valeur_x': 'Nombre Evolutions'})
df1_2 = df1_2.rename(columns={'Valeur_y': 'Population formee'})
df1_2

Unnamed: 0,Année,Evolution,Genre,Nombre Evolutions,Collège,Indicateur,Population formee,Unité
0,2017,Exécution vers Maîtrise,Femme,118.0,Exécution,Salariés ayant suivi au moins un stage,2508.0,Nombre
1,2017,Exécution vers Maîtrise,Homme,269.0,Exécution,Salariés ayant suivi au moins un stage,3620.0,Nombre
2,2017,Maîtrise vers Cadre,Femme,152.0,Maitrise,Salariés ayant suivi au moins un stage,8103.0,Nombre
3,2017,Maîtrise vers Cadre,Homme,445.0,Maitrise,Salariés ayant suivi au moins un stage,20045.0,Nombre
4,2018,Exécution vers Maîtrise,Femme,103.0,Exécution,Salariés ayant suivi au moins un stage,2334.0,Nombre
5,2018,Exécution vers Maîtrise,Homme,251.0,Exécution,Salariés ayant suivi au moins un stage,3550.0,Nombre
6,2018,Maîtrise vers Cadre,Femme,165.0,Maitrise,Salariés ayant suivi au moins un stage,7683.0,Nombre
7,2018,Maîtrise vers Cadre,Homme,441.0,Maitrise,Salariés ayant suivi au moins un stage,19607.0,Nombre
8,2019,Exécution vers Maîtrise,Femme,132.0,Exécution,Salariés ayant suivi au moins un stage,1670.0,Nombre
9,2019,Exécution vers Maîtrise,Homme,339.0,Exécution,Salariés ayant suivi au moins un stage,2888.0,Nombre


In [87]:
import pandas as pd
import plotly.express as px

# Transformer les données en format long
df_long = df1_2.melt(
    id_vars=['Année', 'Evolution', 'Genre'], 
    value_vars=['Nombre Evolutions', 'Population formee'], 
    var_name='Type de Valeur', 
    value_name='Valeur'
)

# Créer le graphique
fig = px.line(
    df_long,
    x='Année',
    y='Valeur',
    color='Evolution',  # Couleurs différenciées par évolution
    line_dash='Type de Valeur',  # Style de ligne différencié par type de valeur
    facet_row='Genre',  # Séparer les graphiques pour Femme (haut) et Homme (bas)
    title="Corrélation entre le nombre de personnes formées et les évolutions",
    labels={'Valeur': 'Valeur', 'Année': 'Année', 'Type de Valeur': 'Type'},
    height=800
)

# Définir les options du menu déroulant
dropdown_buttons = [
    dict(label="Exécution vers Maîtrise",
         method="update",
         args=[{"visible": ['Exécution vers Maîtrise' in trace.name for trace in fig.data]},
               {"title": "Corrélation pour l'évolution : Exécution vers Maîtrise"}]),
    dict(label="Maîtrise vers Cadre",
         method="update",
         args=[{"visible": ['Maîtrise vers Cadre' in trace.name for trace in fig.data]},
               {"title": "Corrélation pour l'évolution : Maîtrise vers Cadre"}])
]

# Initialiser les courbes visibles pour "Exécution vers Maîtrise" (par défaut)
default_visible = ['Exécution vers Maîtrise' in trace.name for trace in fig.data]
fig.for_each_trace(lambda trace: trace.update(visible='legendonly'))  # Masquer toutes les traces par défaut
for trace, visible in zip(fig.data, default_visible):
    trace.visible = True if visible else 'legendonly'

# Mettre à jour la mise en page pour inclure le menu déroulant
fig.update_layout(
    updatemenus=[
        dict(
            buttons=dropdown_buttons,
            direction="down",
            showactive=True,
            x=1.35,  # Position horizontale
            xanchor="right",
            y=1.1,  # Position verticale
            yanchor="top"
        )
    ],
    legend_title="Évolution et Type de Valeur"
)

# Afficher le graphique
fig.show()

#### 3) Impact des conditions de travail sur l’absentéisme ET LES DE;ISSIONS####

nuage de points


In [140]:
maladie = pd.read_csv("data/absences.csv", delimiter=";")
maladie = maladie[maladie["Type de contrat"]=="Statutaires"]
drop = ['Perimètre juridique', 'Perimètre spatial',
       'Spatial perimeter', 'Indicator',
       'Type of contract', 'Employee category', 'Gender',
       'Unit', 'Type de contrat', 'Unité', 'Chapitre du bilan social', 'Genre']
maladie = maladie.drop(columns=drop)
maladie = maladie[maladie["Indicateur"] == "Absence pour maladie"]
maladie = maladie.groupby(["Année", "Collège", "Indicateur"]).sum().reset_index()
maladie = maladie.rename(columns={'Valeur': 'Total des heures d\'arret maladie'})
maladie = maladie.drop(columns=['Indicateur'])
maladie

Unnamed: 0,Année,Collège,Total des heures d'arret maladie
0,2017,Cadre,1081209.0
1,2017,Exécution,756905.0
2,2017,Maîtrise,2330284.0
3,2018,Cadre,1118943.0
4,2018,Exécution,702581.0
5,2018,Maîtrise,2288034.0
6,2019,Cadre,1110863.0
7,2019,Exécution,582413.0
8,2019,Maîtrise,2191619.0
9,2020,Cadre,1073816.0


In [138]:
vacances = pd.read_csv("data/absences.csv", delimiter=";")
vacances = vacances[vacances["Type de contrat"]=="Statutaires"]
drop = ['Perimètre juridique', 'Perimètre spatial',
       'Spatial perimeter', 'Indicator',
       'Type of contract', 'Employee category', 'Gender',
       'Unit', 'Type de contrat', 'Chapitre du bilan social', 'Genre']
vacances = vacances.drop(columns=drop)
vacances = vacances[vacances["Indicateur"] == "Absence pour congés autorisés"]
vacances = vacances.groupby(["Année", "Collège", "Indicateur", "Unité"]).sum().reset_index()
vacances = vacances.rename(columns={'Valeur': 'Total des heures de congés'})
vacances = vacances.drop(columns=['Indicateur', 'Unité'])
vacances

Unnamed: 0,Année,Collège,Total des heures de congés
0,2017,Cadre,327130.0
1,2017,Exécution,71491.0
2,2017,Maîtrise,362252.0
3,2018,Cadre,350507.0
4,2018,Exécution,69055.0
5,2018,Maîtrise,370494.0
6,2019,Cadre,270791.0
7,2019,Exécution,51543.0
8,2019,Maîtrise,311058.0
9,2020,Cadre,235808.0


In [142]:
df3 = pd.merge(maladie, vacances, on=['Année','Collège'], how='inner')

Unnamed: 0,Année,Collège,Total des heures d'arret maladie,Total des heures de congés
0,2017,Cadre,1081209.0,327130.0
1,2017,Exécution,756905.0,71491.0
2,2017,Maîtrise,2330284.0,362252.0
3,2018,Cadre,1118943.0,350507.0
4,2018,Exécution,702581.0,69055.0
5,2018,Maîtrise,2288034.0,370494.0
6,2019,Cadre,1110863.0,270791.0
7,2019,Exécution,582413.0,51543.0
8,2019,Maîtrise,2191619.0,311058.0
9,2020,Cadre,1073816.0,235808.0


In [155]:
# Créer le nuage de points
fig = px.scatter(
    df3,
    x="Total des heures de congés",
    y="Total des heures d'arret maladie",
    facet_col="Collège",
    color="Collège",
    title="Nuage de points : Heures de congés vs Heures d'arrêt maladie",
    labels={"Heures de congés": "Heures de congés", "Heures d'arrêt maladie": "Heures d'arrêt maladie"},
)

# Afficher le graphique
fig.show()

#### 4) Focus sur les salariés non-statuaires ####

https://ufpi.reference-syndicale.fr/2017/06/stop-aux-cdi-non-statutaires-a-tous-les-etages/

un grqphiaue qvec deux courbes et une liste de choix en fonction

In [154]:
statut = pd.read_csv("data/promotion.csv", delimiter=";")
statut = statut[statut['Indicateur']=='Rémunération mensuelle moyenne brute']
statut = statut[statut["Plage M3E"].isna()]
statut = statut.drop(columns=['Perimètre juridique', 'Perimètre spatial',
       'Spatial perimeter', 'Indicateur', 'Indicator',
       'Type of contract', 'Employee category', 'Plage M3E',
       'M3E classification', 'Gender', 'Unité', 'Unit',
       'Chapitre du bilan social'])
statut = statut.groupby(["Année", "Type de contrat", "Collège"])["Valeur"].sum().reset_index()
statut = statut.rename(columns={'Valeur': 'Salaire mensuel brut moyen (€)'})
statut.head(10)

Unnamed: 0,Année,Type de contrat,Collège,Salaire mensuel brut moyen (€)
0,2017,Non statutaire CDD,Cadre,6807.0
1,2017,Non statutaire CDD,Execution,2319.0
2,2017,Non statutaire CDD,Maitrise,2673.0
3,2017,Non statutaire CDI,Cadre,21809.0
4,2017,Non statutaire CDI,Execution,2492.0
5,2017,Non statutaire CDI,Maitrise,7094.0
6,2017,Statutaire,Cadre,12933.0
7,2017,Statutaire,Execution,5534.0
8,2017,Statutaire,Maitrise,7443.0
9,2018,Non statutaire CDD,Cadre,6455.0


In [108]:
# Créer le graphique avec une liste de sélection pour le Collège
fig = px.line(
    statut,
    x="Année",
    y="Salaire mensuel brut moyen (€)",
    color="Type de contrat",
    line_group="Collège",
    title="Salaire par année et type de contrat",
    labels={"Salaire": "Salaire (€)", "Année": "Année"},
)

# Ajouter une liste de sélection (Filtre interactif)
fig.update_layout(
    updatemenus=[
        dict(
            buttons=[
                dict(
                    label=college,
                    method="update",
                    args=[{"visible": statut["Collège"] == college}, {"title": f"Collège: {college}"}],
                )
                for college in statut["Collège"].unique()
            ],
            direction="down",
            showactive=True,
            x=0.1,
            y=1.15,
        )
    ]
)

fig.show()