#  Importer les bibliothèques

In [None]:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

### 🟡 Partie 1 : Charger et explorer le fichier

In [None]:
df = pd.read_csv("employees2.csv")
print(df.head())
print(df.dtypes)
print(df.isnull().sum())

### 🟢 Partie 2 : Nettoyer les données

In [None]:
df["Age"] = df["Age"].fillna(df["Age"].median())
df["Salary"] = df.groupby("Department")["Salary"].transform(lambda x: x.fillna(x.mean()))
df["Age"] = df["Age"].astype(int)
df["Years_Experience"] = df["Years_Experience"].astype(int)
df["Salary"] = df["Salary"].astype(float)
df["Remote"] = df["Remote"].replace({"Yes": "Oui", "No": "Non"})
df["Ancienneté_Catégorie"] = "Junior"
df.loc[df["Years_Experience"] >= 3, "Ancienneté_Catégorie"] = "Intermédiaire"
df.loc[df["Years_Experience"] >= 8, "Ancienneté_Catégorie"] = "Senior"
df.loc[df["Years_Experience"] > 15, "Ancienneté_Catégorie"] = "Expert"

### 🔵 Partie 3 : Statistiques simples

In [None]:
print("Salaire moyen :", df["Salary"].mean())
print("Salaire max :", df["Salary"].max())
print(df.groupby("Department")["Salary"].mean())
print(df.groupby("Ancienneté_Catégorie")["Salary"].agg(["mean", "median"]))
print(df[df["Remote"] == "Oui"].groupby("Department").size())

### 🟠 Partie 4 : Tableaux croisés simples

In [None]:
df["Groupe_Age"] = pd.cut(df["Age"], [18, 30, 45, 60, 100], labels=["Jeune", "Adulte", "Senior", "Retraité"])
print(pd.pivot_table(df, values="Salary", index="Department", columns="Remote"))
print(pd.pivot_table(df, values="Years_Experience", index="Groupe_Age", columns="Department"))

### 🔴 Partie 5 : Calculs avec NumPy

In [None]:
df["Performance"] = "Bon"
df.loc[df["Salary"] >= 60000, "Performance"] = "Moyen"
df.loc[df["Salary"] >= 80000, "Performance"] = "Haut"
df["Profil"] = "Autre"
df.loc[(df["Age"] < 35) & (df["Years_Experience"] < 5), "Profil"] = "Jeune & Nouveau"
df.loc[(df["Age"] < 35) & (df["Years_Experience"] >= 5), "Profil"] = "Jeune & Expérimenté"
df.loc[(df["Age"] >= 35) & (df["Years_Experience"] < 5), "Profil"] = "Senior & Nouveau"
df.loc[(df["Age"] >= 35) & (df["Years_Experience"] >= 5), "Profil"] = "Senior & Expérimenté"
df["Diff_Salaire_Departement"] = df["Salary"] - df.groupby("Department")["Salary"].transform("mean")

### 🟣 Partie 6 : Graphiques simples

In [None]:
sns.histplot(df["Salary"], kde=True)
plt.title("Distribution des salaires")
plt.show()
sns.barplot(x="Department", y="Salary", data=df, estimator=np.mean)
plt.title("Salaire moyen par département")
plt.xticks(rotation=45)
plt.show()
sns.boxplot(x="Ancienneté_Catégorie", y="Salary", data=df)
plt.title("Salaires par ancienneté")
plt.show()