# Análise de Fatores de Evasão de Colaboradores — Um Estudo sobre Attrition

## 1. Introdução

O turnover de funcionários é uma das maiores preocupações de áreas de Recursos Humanos no ambiente corporativo, impactando custos, moral e produtividade. Utilizando o dataset público “IBM HR Analytics Employee Attrition & Performance”, exploraremos os principais fatores associados ao desligamento espontâneo dos colaboradores (“attrition”) e forneceremos subsídios para ações práticas de retenção.

Dataset: *IBM HR Analytics Employee Attrition & Performance*

Link: https://www.kaggle.com/datasets/pavansubhasht/ibm-hr-analytics-attrition-dataset

## 2. Importação e Visão Geral dos Dados

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Carregar dataset público da IBM
df = pd.read_csv('WA_Fn-UseC_-HR-Employee-Attrition.csv')

df.head(), df.info(), df.describe()

## 3. Panorama do Attrition e Perfil Funcional
Como está distribuída a evasão (“Attrition”) entre os funcionários?


In [None]:
# Taxa geral de attrition
print('Taxa de attrition (%):', df['Attrition'].value_counts(normalize=True)['Yes']*100)

In [None]:
# Distribuição por departamento e cargo
plt.figure(figsize=(10,5))
sns.countplot(x='Department', hue='Attrition', data=df)
plt.title('Attrition por Departamento')
plt.ylabel('Nº de Funcionários')
plt.show()

In [None]:
plt.figure(figsize=(12,5))
sns.countplot(y='JobRole', hue='Attrition', data=df, order=df['JobRole'].value_counts().index)
plt.title('Attrition por Cargo')
plt.xlabel('Nº de Funcionários')
plt.show()

Os departamentos de Vendas e cargos de Representantes de Vendas apresentam proporção significativamente maior de evasão.

## 4. Relação entre Satisfação, Tempo de Casa e Salário vs Attrition
Como a satisfação no trabalho, tempo e salário influenciam a evasão?

In [None]:
# Satisfação x Attrition
plt.figure(figsize=(7,4))
sns.boxplot(x='Attrition', y='JobSatisfaction', data=df)
plt.title('Satisfação no Trabalho e Attrition')
plt.show()

In [None]:
# Idade x Attrition
plt.figure(figsize=(7,4))
sns.boxplot(x='Attrition', y='Age', data=df)
plt.title('Idade e Attrition')
plt.show()

In [None]:
# Salário Mensal x Attrition
plt.figure(figsize=(7,4))
sns.boxplot(x='Attrition', y='MonthlyIncome', data=df)
plt.title('Salário Mensal e Attrition')
plt.show()

Há clara concentração de evasão entre funcionários mais jovens, com menor satisfação e salários mais baixos.

In [None]:
# Relação anos na empresa, salário e attrition
plt.figure(figsize=(8,6))
sns.scatterplot(x='YearsAtCompany', y='MonthlyIncome', hue='Attrition', data=df, alpha=0.7)
plt.title('Tempo de Casa vs Salário x Evasão')
plt.show()

Funcionários que permanecem poucos anos e têm salários menores tendem a pedir desligamento mais frequentemente.

## 5. Modelagem Simples: Fatores Críticos
Quais fatores mais influenciam o risco de evasão?

In [None]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.preprocessing import LabelEncoder

# Apenas variáveis mais relevantes
cols = ['Age','MonthlyIncome','JobSatisfaction','YearsAtCompany','DistanceFromHome','Attrition']
df_model = df[cols].dropna().copy()
df_model['Attrition'] = LabelEncoder().fit_transform(df_model['Attrition'])

X = df_model.drop('Attrition', axis=1)
y = df_model['Attrition']

model = DecisionTreeClassifier(max_depth=3, random_state=42)
model.fit(X,y)

# Feature importances
importances = pd.Series(model.feature_importances_, index=X.columns)
importances.sort_values().plot.barh(title='Fatores com mais peso para o Attrition', color='teal')
plt.show()

As variáveis mais relevantes para explicar evasão, segundo a árvore, são: Satisfação no Trabalho, Salário Mensal, Idade e Anos na Empresa.

## 6. Recomendações de Negócio

- Foco em ações de retenção para jovens talentos, especialmente nos departamentos/cargos críticos.
- Programas de engajamento e satisfação no trabalho.
- Revisão de políticas salariais para as faixas de menor remuneração.
- Análise periódica de risco de evasão ligada à satisfação e histórico do colaborador.

## 7. Conclusão e Próximos Passos

Neste notebook mostramos como a análise de dados pode fortalecer a tomada de decisão estratégica em RH. Recomendamos aprofundar a investigação em causas qualitativas e realizar análises preditivas regulares.