# Análisis de Rotación de Empleados – People Analytics

Este proyecto explora posibles factores que influyen en la rotación de empleados utilizando un dataset de IBM.  
Se analizan variables como el ingreso mensual, la satisfacción laboral, el desempeño y el departamento, con el objetivo de ofrecer información útil para la toma de decisiones en Recursos Humanos.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

# Configuración de estilo
sns.set(style="whitegrid")
plt.rcParams["figure.figsize"] = (10, 6)


In [None]:
# Cargar el dataset
df = pd.read_csv("WA_Fn-UseC_-HR-Employee-Attrition.csv")

# Mostrar las primeras filas
df.head()


In [None]:
# Verificar dimensiones del dataset
print("Filas y columnas:", df.shape)

# Verificar tipos de datos
df.info()

# Revisar valores nulos
print("\nValores nulos por columna:")
print(df.isnull().sum())


## 1. Rotación general de empleados


In [None]:
# Conteo de empleados que se fueron vs se quedaron
rotacion_counts = df["Attrition"].value_counts()
print("Conteo de empleados:")
print(rotacion_counts)

# Porcentaje
rotacion_percent = df["Attrition"].value_counts(normalize=True) * 100
print("\nPorcentaje de rotación:")
print(rotacion_percent)


In [None]:
# Gráfico de barras con Seaborn
sns.countplot(data=df, x="Attrition", hue="Attrition", palette="Set2")
plt.title("Distribución general de rotación (Attrition)")
plt.xlabel("¿Empleado se fue?")
plt.ylabel("Cantidad")
plt.show()

### Observaciones
- El **~16%** de los empleados han dejado la empresa.
- La mayoría permanece en sus puestos, pero esta tasa de rotación puede ser preocupante si afecta áreas clave o perfiles estratégicos.


## 2. Rotación vs Ingresos


In [None]:
# Estadísticas de ingresos según rotación
df.groupby("Attrition")["MonthlyIncome"].describe()


In [None]:
sns.boxplot(data=df, x="Attrition", y="MonthlyIncome", hue="Attrition", palette="Set3", dodge=False)
plt.title("Distribución de ingresos mensuales según rotación")
plt.xlabel("¿Empleado se fue?")
plt.ylabel("Ingreso mensual")
plt.show()

In [None]:
# Histograma de ingresos separados por grupo de rotación
sns.histplot(data=df, x="MonthlyIncome", hue="Attrition", kde=True, element="step", stat="density", common_norm=False)
plt.title("Distribución del ingreso mensual según rotación")
plt.xlabel("Ingreso mensual")
plt.ylabel("Densidad")
plt.show()


### Observaciones
- Los empleados que se fueron tienden a tener ingresos ligeramente más bajos en promedio.
- Sin embargo, también hay solapamiento: hay empleados con altos ingresos que se van, y bajos que se quedan.
- Esto sugiere que el ingreso puede ser un **factor relevante**, pero no el único.


## 3. Rotación vs Satisfacción laboral


In [None]:
# Promedio y estadísticas de satisfacción por grupo
df.groupby("Attrition")["JobSatisfaction"].describe()


In [None]:
# Tabla cruzada: rotación vs nivel de satisfacción (de 1 a 4)
pd.crosstab(df["JobSatisfaction"], df["Attrition"], normalize='index') * 100


In [None]:
# Recuento de satisfacción según rotación
sns.countplot(data=df, x="JobSatisfaction", hue="Attrition", palette="Set2")
plt.title("Nivel de satisfacción laboral según rotación")
plt.xlabel("Satisfacción laboral (1 = baja, 4 = alta)")
plt.ylabel("Cantidad de empleados")
plt.show()


In [None]:
sns.boxplot(data=df, x="Attrition", y="JobSatisfaction", hue="Attrition", palette="Set3", dodge=False)
plt.title("Distribución de satisfacción laboral según rotación")
plt.xlabel("¿Empleado se fue?")
plt.ylabel("Satisfacción laboral")
plt.show()

### Observaciones
- Los empleados con menor satisfacción laboral tienden a irse con mayor frecuencia.
- La mayoría de los que se quedan reportan niveles de satisfacción entre 3 y 4.
- Esto sugiere una **relación clara entre satisfacción laboral y rotación**.


## 4. Relación entre satisfacción laboral y desempeño


In [None]:
# Ver la correlación numérica entre ambas variables
correlacion = df["JobSatisfaction"].corr(df["PerformanceRating"])
print(f"Correlación entre satisfacción y desempeño: {correlacion:.2f}")


La correlación entre satisfacción y desempeño es nula (0.00), probablemente debido a la baja variabilidad en las evaluaciones de desempeño, ya que la mayoría de los empleados tienen un puntaje similar. Esto limita la capacidad de detectar una relación estadística significativa.


In [None]:
# Añadir un poco de "ruido" para que no se solapen los puntos
sns.stripplot(data=df, x="PerformanceRating", y="JobSatisfaction", hue="PerformanceRating", 
              palette="coolwarm", jitter=True, alpha=0.5, dodge=False, legend=False)
plt.title("Satisfacción laboral vs. Desempeño")
plt.xlabel("Desempeño (1 a 4)")
plt.ylabel("Satisfacción laboral (1 a 4)")
plt.show()

In [None]:
pd.crosstab(df["PerformanceRating"], df["JobSatisfaction"], normalize='index') * 100


### Observaciones
- No se observa una correlación fuerte entre satisfacción y desempeño.
- Los empleados con alto desempeño no necesariamente están más satisfechos.
- Esto puede indicar que **el reconocimiento o las condiciones laborales** son más importantes que el rendimiento en sí.


## 5. Rotación por Departamento


In [None]:
# Conteo absoluto
rotacion_departamento = pd.crosstab(df["Department"], df["Attrition"])
print(rotacion_departamento)

# Porcentaje de rotación dentro de cada departamento
rotacion_percent = pd.crosstab(df["Department"], df["Attrition"], normalize='index') * 100
print("\nPorcentaje de rotación por departamento:")
print(rotacion_percent)


In [None]:
# Gráfico de barras con porcentaje de empleados que se fueron por departamento
rotacion_percent["Yes"].plot(kind="bar", color="tomato", edgecolor="black")
plt.title("Porcentaje de rotación por departamento")
plt.ylabel("% de empleados que se fueron")
plt.xlabel("Departamento")
plt.xticks(rotation=45)
plt.ylim(0, 50)  # ajustable según tus datos
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.show()


### Observaciones
- Algunos departamentos muestran una tasa de rotación mucho más alta que otros.
- Identificar estos departamentos puede ayudar a enfocar acciones de retención más efectivas.


## 6. Conclusiones generales del análisis


### Conclusiones generales

- La tasa de rotación general es del ~16%, lo cual puede considerarse moderadamente alto.  
- Los empleados con **menores ingresos** tienden a dejar la empresa con más frecuencia, lo que sugiere una posible relación entre salario y retención.
- Existe una **clara relación entre la baja satisfacción laboral y la rotación**: los empleados menos satisfechos son los más propensos a irse.
- No se encontró correlación significativa entre **satisfacción y desempeño**. Esto podría deberse a la falta de variabilidad en las evaluaciones de desempeño.
- Algunos **departamentos presentan tasas de rotación más altas** que otros. Identificar y analizar estos focos puede ayudar a tomar decisiones estratégicas de retención.
- En conjunto, los resultados destacan la importancia de **evaluar factores emocionales y económicos** para retener el talento dentro de una organización.
