# ✅ Corrigé – Mini TP enrichi – Jour 3 : Visualisation des données RH

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Chargement et préparation des données
employes = pd.read_csv("employes.csv")
absences = pd.read_excel("absences.xlsx")

employes["Date_Embauche"] = pd.to_datetime(employes["Date_Embauche"])
absences["Date"] = pd.to_datetime(absences["Date"])
employes["Anciennete"] = 2025 - employes["Date_Embauche"].dt.year

## 1️⃣ Histogramme de l'ancienneté

In [None]:
plt.figure(figsize=(8, 5))
sns.histplot(employes["Anciennete"], bins=10)
plt.title("Répartition de l'ancienneté")
plt.xlabel("Ancienneté")
plt.ylabel("Nombre")
plt.tight_layout()
plt.savefig("figures/anciennete_hist.png")
plt.show()

## 2️⃣ Boxplot des salaires par service

In [None]:
plt.figure(figsize=(8, 5))
sns.boxplot(data=employes, x='Service', y='Salaire')
plt.xticks(rotation=45)
plt.title("Salaires par service")
plt.tight_layout()
plt.savefig("figures/salaires_boxplot.png")
plt.show()

## 3️⃣ Barplot du nombre d'employés par service

In [None]:
plt.figure(figsize=(7, 5))
sns.countplot(x='Service', data=employes)
plt.xticks(rotation=45)
plt.title("Effectifs par service")
plt.tight_layout()
plt.show()

## 4️⃣ Répartition hommes/femmes

In [None]:
plt.figure(figsize=(5, 5))
sns.countplot(x='Sexe', data=employes)
plt.title("Répartition hommes/femmes")
plt.tight_layout()
plt.show()

## 5️⃣ Courbe des absences cumulées

In [None]:
absences['Mois'] = absences['Date'].dt.to_period('M').astype(str)
mensuel = absences.groupby('Mois')['Duree'].sum().cumsum()
plt.figure(figsize=(8, 5))
mensuel.plot(marker='o')
plt.title("Absences cumulées")
plt.ylabel("Jours")
plt.xticks(rotation=45)
plt.tight_layout()
plt.savefig("figures/absences_cumulees.png")
plt.show()

## 6️⃣ Heatmap des absences par mois et service

In [None]:
merged = pd.merge(absences, employes[['ID', 'Service']], on='ID', how='left')
merged['Mois'] = merged['Date'].dt.to_period('M').astype(str)
pivot = merged.pivot_table(index='Service', columns='Mois', values='Duree', aggfunc='sum').fillna(0)
plt.figure(figsize=(10, 5))
sns.heatmap(pivot, annot=True, fmt='.0f', cmap='YlOrBr')
plt.title("Heatmap absences")
plt.tight_layout()
plt.savefig("figures/heatmap_absences.png")
plt.show()

## 7️⃣ Ancienneté moyenne par service

In [None]:
moy_ancien = employes.groupby('Service')['Anciennete'].mean().sort_values()
plt.figure(figsize=(8, 5))
sns.barplot(x=moy_ancien.values, y=moy_ancien.index)
plt.title("Ancienneté moyenne par service")
plt.xlabel("Ancienneté")
plt.tight_layout()
plt.show()

## 8️⃣ Salaire moyen par genre

In [None]:
moy_salaire = employes.groupby('Sexe')['Salaire'].mean().reset_index()
plt.figure(figsize=(6, 4))
sns.barplot(data=moy_salaire, x='Sexe', y='Salaire')
plt.title("Salaire moyen par genre")
plt.tight_layout()
plt.show()

## 9️⃣ Histogramme des salaires

In [None]:
plt.figure(figsize=(7, 5))
sns.histplot(employes['Salaire'], bins=15)
plt.title("Distribution des salaires")
plt.xlabel("Salaire")
plt.tight_layout()
plt.show()

## 🔟 Export de figures
(voir `plt.savefig()` plus haut dans chaque figure)