# Import du fichier et analyse globale

In [1]:
import pandas as pd
import builtins
import plotly.express as px
import seaborn as sns
import matplotlib.pyplot as plt
from plotly.subplots import make_subplots
import plotly.graph_objects as go

In [2]:
url = f"https://docs.google.com/spreadsheets/d/1PIMO76csrwWa7eRCZHQziJQvqGMy7M_EpZLblZjRFMU/gviz/tq?tqx=out:csv&sheet=dataset_clean"
df = pd.read_csv(url)
df

Unnamed: 0,age,attrition,deplacements_pro,service,trajet_quotidien_en_miles,num_niveau_detude,domaine_detude,identifiant_employe,num_satisfaction_environnement,genre,...,pourcentage_augmentation,niveau_carriere,temps_de_formation,anciennete,anciennete_poste,derniere_promotion,annees_avec_manager,prenom,nom,email
0,41,Oui,Rare,Ventes,1,2,Sciences,1,2,Femme,...,11 - 12,06 - 10,0,06 - 10,03 - 05,0 - 02,03 - 05,Rose,Atkins,r.atkins@ibm-data.com
1,49,Non,Fréquent,R&D,8,1,Sciences,2,3,Homme,...,21 +,06 - 10,01 - 03,06 - 10,06 - 10,0 - 02,06 - 10,Timothy,Davis,t.davis@ibm-data.com
2,37,Oui,Rare,R&D,2,2,Autre,4,4,Homme,...,15 - 20,06 - 10,01 - 03,0 - 02,0 - 02,0 - 02,0 - 02,Harold,Newman,h.newman@ibm-data.com
3,33,Non,Fréquent,R&D,3,4,Sciences,5,4,Femme,...,11 - 12,06 - 10,01 - 03,06 - 10,06 - 10,03 - 05,0 - 02,Michelle,Olson,m.olson@ibm-data.com
4,27,Non,Rare,R&D,2,1,Médecine,7,1,Homme,...,11 - 12,06 - 10,01 - 03,0 - 02,0 - 02,0 - 02,0 - 02,Richard,Riley,r.riley@ibm-data.com
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1465,36,Non,Fréquent,R&D,23,2,Médecine,2061,3,Homme,...,15 - 20,10 - 20,01 - 03,03 - 05,0 - 02,0 - 02,03 - 05,Ricky,Johnson,r.johnson1@ibm-data.com
1466,39,Non,Rare,R&D,6,1,Médecine,2062,4,Homme,...,15 - 20,06 - 10,04 +,06 - 10,06 - 10,0 - 02,06 - 10,Carlos,Holmes,c.holmes@ibm-data.com
1467,27,Non,Rare,R&D,4,3,Sciences,2064,2,Homme,...,15 - 20,06 - 10,0,06 - 10,0 - 02,0 - 02,03 - 05,Alejandro,Mclaughlin,a.mclaughlin@ibm-data.com
1468,49,Non,Fréquent,Ventes,2,3,Médecine,2065,4,Homme,...,13 - 14,10 - 20,01 - 03,06 - 10,06 - 10,0 - 02,06 - 10,Roger,Green,r.green@ibm-data.com


In [57]:
df.columns.tolist()


['age',
 'attrition',
 'deplacements_pro',
 'service',
 'trajet_quotidien_en_miles',
 'num_niveau_detude',
 'domaine_detude',
 'identifiant_employe',
 'num_satisfaction_environnement',
 'genre',
 'num_implication',
 'num_niveau_hierarchique',
 'poste',
 'num_satisfaction_travail',
 'situation',
 'salaire_mensuel',
 'num_nb_entreprises',
 'heures_sup',
 'num_pourcentage_augmentation',
 'num_performance',
 'num_satisfaction_relation',
 'num_taux_daction',
 'tt_annee_travail',
 'num_temps_de_formation',
 'num_equilibre_pro_perso',
 'annees_dans_entreprise',
 'annees_poste_actuel',
 'annees_depuis_promotion',
 'num_annees_avec_manager',
 'num_attrition',
 'niveau_detude',
 'satisfaction_environnement',
 'implication',
 'niveau_hierarchique',
 'satisfaction_travail',
 'performance',
 'satisfaction_relation',
 'taux_daction',
 'equilibre_pro_perso',
 'categorie_age',
 'categorie_trajet',
 'statut',
 'categorie_salaire',
 'nb_entreprises',
 'pourcentage_augmentation',
 'niveau_carriere',
 'te

# Analyse des catégories le plus impactantes VS âge

In [123]:
colormap = ["#1d70c2", "#f87575", "#513b56"]

performance_distribution = df.groupby(["categorie_age", "performance"]).size().reset_index(name='count')

fig = px.bar(
    performance_distribution,
    x="categorie_age",
    y="count",
    color="performance",
    color_discrete_map={
        "Très élevée": colormap[0],
        "Élevée": colormap[1]
    },
    title="Niveau de performance selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de vote",
        "performance": "Niveau de performance de 1 à 4"
    },
    barmode='stack'
)
fig.update_traces(texttemplate="%{y}", textposition="inside")
fig.show()

Performance VS les tranches d'âge : les 25- 34 ans et 35-44 ans se sentent plus performants, ce qui est à nuancer car ils sont surreprésentés.

In [125]:
colormap = ["#1d70c2", "#f87575", "#513b56"]

deplacements_pro_distribution = df.groupby(["categorie_age", "deplacements_pro"]).size().reset_index(name='count')

fig = px.bar(
    deplacements_pro_distribution,
    x="categorie_age",
    y="count",
    color="deplacements_pro",
    color_discrete_map={
        "Rare": colormap[0],
        "Fréquent": colormap[1],
        "Aucun": colormap[2]
    },
    title="Nombre de déplacements professionnels par tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de déplacement",
        "deplacements_pro": "Déplacements professionnels"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Les déplacements professionnels VS les tranches d'âge : les déplacements restent rares.

In [127]:
colormap = ["#1d70c2", "#f87575", "#513b56"]

service_distribution = df.groupby(["categorie_age", "service"]).size().reset_index(name='count')

fig = px.bar(
    service_distribution,
    x="categorie_age",
    y="count",
    color="service",
    color_discrete_map={
        "R&D": colormap[0],
        "Ventes": colormap[1],
        "RH": colormap[2]
    },
    title="Répartitions par service et par tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "service": "Service"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Service VS l'age : plutot egaux entre eux.

In [129]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136", "#f0ebd8"]

def categorize_implication(num):
    if num == 1:
        return "0-10"
    elif num == 2:
        return "10-15"
    elif num == 3:
        return "15-20"
    elif num == 4:
        return "20+"
    return None

df['niveau_implication_categorise'] = df['num_implication'].apply(categorize_implication)

niveau_detude_distribution = df.groupby(["categorie_age", "niveau_implication_categorise"]).size().reset_index(name='count')

fig = px.bar(
    niveau_detude_distribution,
    x="categorie_age",
    y="count",
    color="niveau_implication_categorise",
    color_discrete_map={
      "0-10": colormap[0],
      "10-15": colormap[1],
      "15-20": colormap[2],
      "20+": colormap[3]
    },
    title="Niveau d'implication selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "niveau_implication_categorise": "Niveau d'implication"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()



Niveau d'implication vs l'age : ce sont les 25-34 ans qui se sentent le moins impliqués.

In [113]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136", "#f0ebd8"]

niveau_detude_distribution = df.groupby(["categorie_age", "niveau_detude"]).size().reset_index(name='count')

fig = px.bar(
    niveau_detude_distribution,
    x="categorie_age",
    y="count",
    color="niveau_detude",
    color_discrete_sequence=colormap,
    title="Nombre de déplacements pro par age",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de déplacement",
        "niveau_detude": "Déplacement professionnel selon la tranche d'âge"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Niveau d'étude VS les tranches d'age : pas vraiment parlant car sur-représentation des 25 - 34 ans et 35 - 44 ans.

In [62]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136", "#f0ebd8"]

niveau_detude_distribution = df.groupby(["categorie_age", "genre"]).size().reset_index(name='count')

fig = px.bar(
    niveau_detude_distribution,
    x="categorie_age",
    y="count",
    color="genre",
    color_discrete_sequence=colormap,
    title="Répartition Homme-Femme selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "genre": "Genre"
    },
    barmode='stack'
)
fig.update_traces(texttemplate="%{y}", textposition="inside")
fig.show()

Répartition Homme-Femme VS la tranche d'age : pas vraiment parlant car sur-représentation des 25 - 34 ans et 35 - 44 ans.

In [112]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136", "#f0ebd8"]

def categorize_implication(num):
    if num == 1:
        return "0-1"
    elif num == 2:
        return "1-2"
    elif num == 3:
        return "2-3"
    elif num == 4:
        return "3-4"
    return None

df['niveau_implication_categorise'] = df['num_implication'].apply(categorize_implication)

niveau_detude_distribution = df.groupby(["categorie_age", "niveau_implication_categorise"]).size().reset_index(name='count')

fig = px.bar(
    niveau_detude_distribution,
    x="categorie_age",
    y="count",
    color="niveau_implication_categorise",
    color_discrete_map={
      "0-1": colormap[0],
      "1-2": colormap[1],
      "2-3": colormap[2],
      "3-4": colormap[3]
    },
    title="Niveau d'implication selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "niveau_implication_categorise": "Niveau d'implication"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Niveau d'implication VS Tranche d'age : 25-34 qui se sentent le moins impliqué.

In [111]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136"]

def categorize_Hierarchie(num):
    if num == 1:
        return "0-1"
    elif num == 2:
        return "1-2"
    elif num == 3:
        return "2-3"
    elif num == 4:
        return "3-4"
    return None

df['niveau_hierarchique_categorise'] = df['num_niveau_hierarchique'].apply(categorize_Hierarchie)

num_hierarchique_distribution = df.groupby(["categorie_age", "niveau_hierarchique_categorise"]).size().reset_index(name='count')

fig = px.bar(
    num_hierarchique_distribution,
    x="categorie_age",
    y="count",
    color="niveau_hierarchique_categorise",
    color_discrete_map={
      "0-1": colormap[0],
      "1-2": colormap[1],
      "2-3": colormap[2],
      "3-4": colormap[3]
    },
    title="Niveau hiérarchique selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "niveau_hierarchique_categorise": "Niveau Hiérarchique"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Niveau Hiérarchique VS la tranche d'âge : on en apprend plus sur la composition de la masse salariale et le niveau de chaque poste.

In [131]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136", "#f0ebd8"]

niveau_detude_distribution = df.groupby(["poste","categorie_age",]).size().reset_index(name='count')

fig = px.bar(
    niveau_detude_distribution,
    x="poste",
    y="count",
    color="categorie_age",
    color_discrete_sequence=colormap,
    title="Répartition des postes selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "poste": "Postes"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Poste VS la tranche d'âge : Sur représentations des Chercheurs, Responsables commerciaux et Technicien de laboratoire.

In [109]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136"]

def categorize_satisfaction(num):
    if num == 1:
        return "0-1"
    elif num == 2:
        return "1-2"
    elif num == 3:
        return "2-3"
    elif num == 4:
        return "3-4"
    return None

df['niveau_satisfaction_categorise'] = df['num_satisfaction_travail'].apply(categorize_satisfaction)

num_hierarchique_distribution = df.groupby(["categorie_age", "niveau_satisfaction_categorise"]).size().reset_index(name='count')

fig = px.bar(
    num_hierarchique_distribution,
    x="categorie_age",
    y="count",
    color="niveau_satisfaction_categorise",
    color_discrete_map={
      "0-1": colormap[0],
      "1-2": colormap[1],
      "2-3": colormap[2],
      "3-4": colormap[3]
    },
    title="Niveau de satisfaction selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "niveau_satisfaction_categorise": "Niveau de satisfaction de 1-4"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Niveau de satisfaction vs la tranche d'âge : les 25 - 34 ans et 35 - 44 ans ont un indice de satisfaction à 1 relativement élevé.

In [119]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136"]

sat_relation_distribution = df.groupby(["categorie_age","satisfaction_relation"]).size().reset_index(name='count')

fig = px.bar(
    sat_relation_distribution,
    x="categorie_age",
    y="count",
    color="satisfaction_relation",
    color_discrete_map={
       "Faible" : colormap[0],
       "Moyenne": colormap[1],
       "Élevée": colormap[2],
       "Très élevée": colormap[3]
    },
    title="Indice relationnel selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "satisfaction_relation": "Indice relationnel"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Niveau de satifaction interprofessionnel VS les tranches d'âge : les 25 - 34 ans et 35 - 44 ans ont un indice de interprofessionnel à 1 relativement élevé.

In [120]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136"]

sat_environnement_distribution = df.groupby(["categorie_age","satisfaction_environnement"]).size().reset_index(name='count')

fig = px.bar(
   sat_environnement_distribution,
    x="categorie_age",
    y="count",
    color="satisfaction_environnement",
    color_discrete_map={
       "Faible" : colormap[0],
       "Moyenne": colormap[1],
       "Élevée": colormap[2],
       "Très élevée": colormap[3]
    },
    title="Indice de satifaction sur l'environnement professionnel selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "satisfaction_environnement": "Indice satifaction environnement"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Indice de satifaction environnement VS les tranches d'âge : les 25 - 34 ans et 35 - 44 ans ont un indice de interprofessionnel à 1 relativement élevé.

In [121]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136"]

sat_travail_distribution = df.groupby(["categorie_age","satisfaction_travail"]).size().reset_index(name='count')

fig = px.bar(
   sat_travail_distribution,
    x="categorie_age",
    y="count",
    color="satisfaction_travail",
    color_discrete_map={
       "Faible" : colormap[0],
       "Moyenne": colormap[1],
       "Élevée": colormap[2],
       "Très élevée": colormap[3]
    },
    title="Indice de satifaction sur la mission selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "satisfaction_travail": "Indice satifaction de la mission"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Indice de satifaction travail VS les tranches d'âge : les 25 - 34 ans et 35 - 44 ans ont un Indice satifaction de la mission faible relativement élevé.

In [107]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136", "#f0ebd8"]

niveau_detude_distribution = df.groupby(["situation","categorie_age",]).size().reset_index(name='count')

fig = px.bar(
    niveau_detude_distribution,
    x="categorie_age",
    y="count",
    color="situation",
    color_discrete_map={
       "Célibataire" : colormap[0],
       "Marié(e)": colormap[1],
       "Divorcé(e)": colormap[2]
    },
    title="Situation selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "poste": "Poste"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Situation Vs la tranche d'age : une majorité de l'effectifs est célibataire ou marié.

In [85]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136", "#f0ebd8", "#3D315B", "#BADEFC", "#C49BBB", "#FFC6D9"]

salary_age_distribution = df.groupby(["categorie_salaire", "categorie_age"]).size().reset_index(name='count')

fig = px.bar(
    salary_age_distribution,
    x="categorie_salaire",
    y="count",
    color="categorie_age",
    color_discrete_map={
      "24 et moins": colormap[0],
      "25 - 34": colormap[1],
      "35 - 44": colormap[2],
      "45 - 54": colormap[3],
      "55 et plus": colormap[4]
    },
    title="Niveau de salaire mensuel selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "categorie_salaire": "Niveau de salaire mensuel"
    },
    barmode='stack'
)
fig.update_traces(texttemplate="%{y}", textposition="inside")
fig.show()

Salaire mensuel VS les tranches d'âge

In [88]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136", "#f0ebd8", "#3D315B", "#BADEFC", "#C49BBB", "#FFC6D9"]


salary_age_distribution = df.groupby(["categorie_age", "heures_sup"]).size().reset_index(name='count')

fig = px.bar(
    salary_age_distribution,
    x="categorie_age",
    y="count",
    color="heures_sup",
    color_discrete_map={
      "Non": colormap[0],
      "Oui": colormap[1]
    },
    title="Répartition des heures supplémentaires selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "heures_sup": "Heures supplémentaires"
    },
    barmode='stack'
)
fig.update_traces(texttemplate="%{y}", textposition="inside")
fig.show()

Heures supplémentaires par tranche d'âge : la proportion reste identique en fonction des tranches d'âge.

In [106]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136", "#f0ebd8", "#3D315B", "#BADEFC", "#C49BBB", "#FFC6D9"]

def categorize_augmentation(num):
    if 0 <= num <= 13:
        return "0-13"
    elif 14 <= num <= 18:
        return "14-18"
    elif 19 <= num <= 22:
        return "19-22"
    elif num > 22:
        return "22+"
    return None

df['num_pourcentage_augmentation_cat'] = df['num_pourcentage_augmentation'].apply(categorize_augmentation)

augmentation_distribution = df.groupby(["categorie_age", "num_pourcentage_augmentation_cat"]).size().reset_index(name='count')

fig = px.bar(
    augmentation_distribution,
    x="categorie_age",
    y="count",
    color="num_pourcentage_augmentation_cat",
    color_discrete_map={
      "0-13": colormap[0],
      "14-18": colormap[1],
      "19-22": colormap[2],
      "22+": colormap[3]
    },
    title="Pourcentage d'augmentation selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "num_pourcentage_augmentation_cat": "Pourcentage d'augmentation" # Corrected label key
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Pourcentage d'augmentation vs l'âge : sur représentation donc pas d'informations qui sautent aux yeux.

In [105]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136", "#f0ebd8", "#3D315B", "#BADEFC", "#C49BBB", "#FFC6D9"]


colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136"]

def categorie_action(num):
    if num == 1:
        return "0-1"
    elif num == 2:
        return "1-2"
    elif num == 3:
        return "2-3"
    elif num == 4:
        return "3-4"
    return None

df['action_cat'] = df['num_taux_daction'].apply(categorie_action)

action_distribution = df.groupby(["categorie_age", "action_cat"]).size().reset_index(name='count')

fig = px.bar(
    action_distribution,
    x="categorie_age",
    y="count",
    color="action_cat",
    color_discrete_map={
      "0-1": colormap[0],
      "1-2": colormap[1],
      "2-3": colormap[2],
      "3-4": colormap[3]
    },
    title="Taux d'action selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "action_cat": "Taux d'action de 1-3"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Taux d'action VS l'âge

In [104]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#6a0136", "#f0ebd8", "#3D315B", "#BADEFC", "#C49BBB", "#FFC6D9"]

anciennete_distribution = df.groupby(["categorie_age","anciennete"]).size().reset_index(name='count')

fig = px.bar(
    anciennete_distribution,
    x="categorie_age",
    y="count",
    color="anciennete",
    color_discrete_map={
      "0 - 02": colormap[0],
      "03 - 05": colormap[1],
      "06 - 10": colormap[2],
      "10 - 20": colormap[3],
      "21+": colormap[4]
    },
    title="répartition de l'ancienneté de l'effectif selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "anciennete": "Ancienneté des collaborateurs"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Ancienneté par tranche d'âge : on remarque une belle proportion des 35 - 44 ans qui on fait toute leur carrière chez IBM.

In [103]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#f0ebd8", "#3D315B", "#BADEFC", "#C49BBB", "#FFC6D9"]

promotion_distribution = df.groupby(["categorie_age","derniere_promotion"]).size().reset_index(name='count')

fig = px.bar(
   promotion_distribution,
    x="categorie_age",
    y="count",
    color="derniere_promotion",
    color_discrete_map={
      "0 - 02": colormap[0],
      "03 - 05": colormap[1],
      "06 - 10": colormap[2],
      "10+": colormap[3]
    },
    title="répartition de l'ancienneté de l'effectif selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "anciennete": "Ancienneté des collaborateurs"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()

Ancienneté VS Age : comme vu sur unilatérale, l'effectif total passe rarement plus de 2 ans sans promotion.

In [None]:
colormap = ["#1d70c2", "#f87575", "#513b56", "#f0ebd8", "#3D315B", "#BADEFC", "#C49BBB", "#FFC6D9"]

promotion_distribution = df.groupby(["categorie_age","derniere_promotion"]).size().reset_index(name='count')

fig = px.bar(
   promotion_distribution,
    x="categorie_age",
    y="count",
    color="derniere_promotion",
    color_discrete_map={
      "0 - 02": colormap[0],
      "03 - 05": colormap[1],
      "06 - 10": colormap[2],
      "10+": colormap[3]
    },
    title="répartition de l'ancienneté de l'effectif selon la tranche d'âge",
    labels={
        "categorie_age": "Tranche d'âge",
        "count": "Nombre de personne",
        "anciennete": "Ancienneté des collaborateurs"
    },
    barmode='group'
)
fig.update_traces(texttemplate="%{y}", textposition="outside")
fig.show()