# An√°lise de Absentismo - Perfis Comportamentais

## Objetivo
Identificar e caracterizar **PERFIS** de colaboradores por comportamento de absentismo,
permitindo a√ß√µes dirigidas, mensur√°veis e eficazes.

## Metodologia
Em vez de listar estat√≠sticas gen√©ricas, agrupamos colaboradores ativos em **PERFIS**
com caracter√≠sticas comportamentais distintas - inspirado na an√°lise TAAG que funcionou bem.

---

## üìã Nota Importante

Este notebook foca em **perfis comportamentais**, n√£o em estat√≠sticas agregadas.

**Pr√©-requisito**: Execute primeiro o notebook `caracteriza√ß√£o.ipynb` para preparar os dados.

Ou execute as c√©lulas de prepara√ß√£o abaixo.

In [None]:
# Imports e configura√ß√µes
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
import warnings

warnings.filterwarnings('ignore')
pd.set_option('display.max_columns', None)
pd.set_option('display.float_format', lambda x: '%.2f' % x)

plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette('Set2')
plt.rcParams['figure.figsize'] = (14, 6)

print('‚úÖ Setup conclu√≠do!')

## 1. Prepara√ß√£o dos Dados

**Op√ß√£o A**: Carregar dados j√° preparados do notebook `caracteriza√ß√£o.ipynb`

**Op√ß√£o B**: Executar c√©lulas de prepara√ß√£o abaixo (copiar do outro notebook)

Para esta an√°lise precisamos do dataset agregado (`df_agregado`) e da tabela de m√©tricas
por colaborador ativo (`metricas_colaborador`).

## 2. Cria√ß√£o de Perfis Comportamentais

Vamos segmentar colaboradores ativos em **5 PERFIS** baseados em comportamento:

- **PERFIL 1: O Exemplar** - Raramente falta, sempre pontual
- **PERFIL 2: O Atrasado** - Atrasos frequentes, mas raramente falta
- **PERFIL 3: O Ausente Ocasional** - Algumas faltas, geralmente justificadas
- **PERFIL 4: O Faltoso Estrat√©gico** - Padr√£o de faltas √†s segundas/sextas
- **PERFIL 5: O Caso Cr√≠tico** - Faltas injustificadas frequentes ou padr√µes graves

### Crit√©rios de Classifica√ß√£o
Usamos regras simples e interpret√°veis (n√£o clustering) para m√°xima clareza.

In [None]:
# ASSUMINDO que 'metricas_colaborador' j√° existe (do notebook anterior)
# Se n√£o existir, precisa executar c√©lulas de prepara√ß√£o primeiro

def classificar_perfil(row):
    """
    Classifica colaborador em um dos 5 perfis baseado em regras.
    Ordem de prioridade: Cr√≠tico > Estrat√©gico > Atrasado > Ausente > Exemplar
    """
    
    # PERFIL 5: Caso Cr√≠tico (prioridade m√°xima)
    if row['faltas_injustificadas'] >= 10:
        return 5
    
    # PERFIL 4: Faltoso Estrat√©gico (‚â•30% faltas √†s segundas OU sextas, m√≠nimo 5 problemas)
    if row['total_problemas'] >= 5 and (row['pct_faltas_segundas'] >= 30 or row['pct_faltas_sextas'] >= 30):
        return 4
    
    # PERFIL 2: Atrasado (‚â•10 atrasos, poucas faltas)
    if row['atrasos'] >= 10 and row['total_faltas'] <= 5:
        return 2
    
    # PERFIL 3: Ausente Ocasional (entre 3 e 15 faltas, maioria justificadas)
    if 3 <= row['total_faltas'] <= 15 and row['faltas_justificadas'] > row['faltas_injustificadas']:
        return 3
    
    # PERFIL 1: Exemplar (tudo o resto - baixo absentismo)
    return 1

# Aplicar classifica√ß√£o
print('Classificando colaboradores em perfis...')
metricas_colaborador['perfil'] = metricas_colaborador.apply(classificar_perfil, axis=1)

# Distribui√ß√£o de perfis
print('\n' + '='*80)
print('üìä DISTRIBUI√á√ÉO DE PERFIS')
print('='*80)

dist_perfis = metricas_colaborador['perfil'].value_counts().sort_index()
total_ativos = len(metricas_colaborador)

nomes_perfis = {
    1: 'Exemplar',
    2: 'Atrasado',
    3: 'Ausente Ocasional',
    4: 'Faltoso Estrat√©gico',
    5: 'Caso Cr√≠tico'
}

for perfil, count in dist_perfis.items():
    pct = count / total_ativos * 100
    print(f'  PERFIL {perfil} - {nomes_perfis[perfil]}: {count:,} colaboradores ({pct:.1f}%)')

print('\n‚úÖ Classifica√ß√£o conclu√≠da!')

## 3. Caracteriza√ß√£o Detalhada por Perfil

Para cada perfil, apresentamos:
- **Quantidade** de colaboradores
- **Caracter√≠sticas** comportamentais m√©dias
- **Onde est√£o** concentrados (opera√ß√µes/segmentos)
- **Impacto** estimado
- **Recomenda√ß√µes** de a√ß√£o

In [None]:
# Fun√ß√£o para caracterizar um perfil
def caracterizar_perfil(perfil_num, nome_perfil, dados):
    print('='*80)
    print(f'üìä PERFIL {perfil_num}: {nome_perfil.upper()}')
    print('='*80)
    
    # Filtrar colaboradores deste perfil
    perfil_data = dados[dados['perfil'] == perfil_num]
    n_colab = len(perfil_data)
    pct_total = n_colab / len(dados) * 100
    
    print(f'\n1Ô∏è‚É£ QUANTIDADE')
    print(f'   ‚Ä¢ {n_colab:,} colaboradores ({pct_total:.1f}% dos ativos)')
    
    print(f'\n2Ô∏è‚É£ CARACTER√çSTICAS COMPORTAMENTAIS (M√©dias)')
    print(f'   ‚Ä¢ Faltas injustificadas: {perfil_data["faltas_injustificadas"].mean():.1f}')
    print(f'   ‚Ä¢ Faltas justificadas: {perfil_data["faltas_justificadas"].mean():.1f}')
    print(f'   ‚Ä¢ Atrasos: {perfil_data["atrasos"].mean():.1f}')
    print(f'   ‚Ä¢ Taxa de absentismo: {perfil_data["taxa_absentismo"].mean():.1f}%')
    print(f'   ‚Ä¢ % faltas √†s segundas: {perfil_data["pct_faltas_segundas"].mean():.1f}%')
    print(f'   ‚Ä¢ % faltas √†s sextas: {perfil_data["pct_faltas_sextas"].mean():.1f}%')
    
    print(f'\n3Ô∏è‚É£ ONDE EST√ÉO (Top 5 Opera√ß√µes)')
    top_ops = perfil_data['operacao'].value_counts().head(5)
    for op, count in top_ops.items():
        pct = count / n_colab * 100
        print(f'   ‚Ä¢ {op}: {count} ({pct:.1f}%)')
    
    print(f'\n4Ô∏è‚É£ IMPACTO ESTIMADO')
    total_prob = perfil_data['total_problemas'].sum()
    print(f'   ‚Ä¢ Total de dias perdidos (faltas + atrasos): {total_prob:,} dias')
    print(f'   ‚Ä¢ Equivalente a ~{total_prob/220:.0f} anos de trabalho (considerando 220 dias √∫teis/ano)')
    
    print('\n' + '='*80 + '\n')

# Caracterizar cada perfil
nomes_perfis = {
    1: 'O Exemplar',
    2: 'O Atrasado',
    3: 'O Ausente Ocasional',
    4: 'O Faltoso Estrat√©gico',
    5: 'O Caso Cr√≠tico'
}

for perfil_num in sorted(nomes_perfis.keys()):
    if perfil_num in metricas_colaborador['perfil'].values:
        caracterizar_perfil(perfil_num, nomes_perfis[perfil_num], metricas_colaborador)

## 4. Visualiza√ß√µes - Perfis em Contexto

In [None]:
# Visualiza√ß√£o 1: Distribui√ß√£o de perfis (Pizza + Barras)
fig, axes = plt.subplots(1, 2, figsize=(16, 6))

# Pizza
dist_perfis = metricas_colaborador['perfil'].value_counts().sort_index()
labels = [f'P{i}: {nomes_perfis[i]}' for i in dist_perfis.index]
colors = ['#2ecc71', '#f39c12', '#3498db', '#e67e22', '#e74c3c']
axes[0].pie(dist_perfis.values, labels=labels, autopct='%1.1f%%', startangle=90, colors=colors[:len(dist_perfis)])
axes[0].set_title('Distribui√ß√£o de Colaboradores por Perfil', fontsize=14, fontweight='bold')

# Barras horizontais
axes[1].barh(labels, dist_perfis.values, color=colors[:len(dist_perfis)])
axes[1].set_xlabel('N√∫mero de Colaboradores')
axes[1].set_title('Contagem por Perfil', fontsize=14, fontweight='bold')
axes[1].grid(axis='x', alpha=0.3)

plt.tight_layout()
plt.show()

# Visualiza√ß√£o 2: Compara√ß√£o de m√©tricas por perfil
metricas_comp = metricas_colaborador.groupby('perfil')[[
    'faltas_injustificadas', 'faltas_justificadas', 'atrasos', 'taxa_absentismo'
]].mean()

fig, axes = plt.subplots(2, 2, figsize=(16, 10))
axes = axes.flatten()

metricas_nomes = {
    'faltas_injustificadas': 'Faltas Injustificadas (m√©dia)',
    'faltas_justificadas': 'Faltas Justificadas (m√©dia)',
    'atrasos': 'Atrasos (m√©dia)',
    'taxa_absentismo': 'Taxa de Absentismo (%)'
}

for i, (col, titulo) in enumerate(metricas_nomes.items()):
    metricas_comp[col].plot(kind='bar', ax=axes[i], color=colors[:len(metricas_comp)])
    axes[i].set_title(titulo, fontsize=12, fontweight='bold')
    axes[i].set_xlabel('Perfil')
    axes[i].set_ylabel('Valor')
    axes[i].grid(axis='y', alpha=0.3)
    axes[i].set_xticklabels([f'P{p}' for p in metricas_comp.index], rotation=0)

plt.tight_layout()
plt.show()

## 5. Recomenda√ß√µes por Perfil

A√ß√µes espec√≠ficas e mensur√°veis para cada perfil.

In [None]:
print('='*80)
print('üí° RECOMENDA√á√ïES POR PERFIL')
print('='*80)

recomendacoes = {
    1: {
        'titulo': 'PERFIL 1: O Exemplar',
        'acao': 'Manter e Reconhecer',
        'passos': [
            'N√£o requer a√ß√£o disciplinar',
            'Considerar para programas de reconhecimento',
            'Usar como refer√™ncia de boas pr√°ticas',
            'Monitorizar para detectar mudan√ßas de comportamento'
        ]
    },
    2: {
        'titulo': 'PERFIL 2: O Atrasado',
        'acao': 'Interven√ß√£o Preventiva',
        'passos': [
            'Implementar sistema de alertas autom√°tico ap√≥s 3 atrasos consecutivos',
            'Reuni√£o com supervisor para identificar causas (transporte, hor√°rio, etc.)',
            'Oferecer flexibilidade de hor√°rio quando poss√≠vel',
            'Escalonar para a√ß√£o disciplinar ap√≥s 15 atrasos sem justifica√ß√£o'
        ]
    },
    3: {
        'titulo': 'PERFIL 3: O Ausente Ocasional',
        'acao': 'Monitoriza√ß√£o e Suporte',
        'passos': [
            'Verificar se aus√™ncias s√£o concentradas (pode indicar problema espec√≠fico)',
            'Reuni√£o de check-in trimestral com RH',
            'Oferecer suporte se padr√£o m√©dico (muitas baixas)',
            'Estabelecer meta de redu√ß√£o de 20% no pr√≥ximo semestre'
        ]
    },
    4: {
        'titulo': 'PERFIL 4: O Faltoso Estrat√©gico',
        'acao': 'Interven√ß√£o Imediata',
        'passos': [
            'Reuni√£o disciplinar OBRIGAT√ìRIA com gestor + RH',
            'Apresentar dados concretos do padr√£o identificado',
            'Carta de advert√™ncia formal',
            'Plano de melhoria com metas claras (max 2 faltas/m√™s)',
            'Reavalia√ß√£o mensal obrigat√≥ria'
        ]
    },
    5: {
        'titulo': 'PERFIL 5: O Caso Cr√≠tico',
        'acao': 'Processo Disciplinar',
        'passos': [
            'In√≠cio IMEDIATO de processo disciplinar',
            'Reuni√£o formal com presen√ßa de representante legal se aplic√°vel',
            'Avaliar rescis√£o de contrato por justa causa',
            'Documentar todos os incidentes detalhadamente',
            'Considerar per√≠odo de prova de 30 dias como √∫ltima oportunidade'
        ]
    }
}

for perfil_num, info in recomendacoes.items():
    if perfil_num in metricas_colaborador['perfil'].values:
        n_colab = (metricas_colaborador['perfil'] == perfil_num).sum()
        print(f'\n{info["titulo"]} ({n_colab} colaboradores)')
        print(f'A√ß√£o: {info["acao"]}')
        print('Passos:')
        for i, passo in enumerate(info['passos'], 1):
            print(f'  {i}. {passo}')
        print()

print('='*80)

## 6. Sum√°rio Executivo

Vis√£o consolidada para apresenta√ß√£o √† dire√ß√£o.

In [None]:
print('='*80)
print('üìä SUM√ÅRIO EXECUTIVO - PERFIS DE ABSENTISMO')
print('='*80)

total_ativos = len(metricas_colaborador)
dist_perfis = metricas_colaborador['perfil'].value_counts().sort_index()

print(f'\n1Ô∏è‚É£ PANORAMA GERAL')
print(f'   ‚Ä¢ Total de colaboradores ativos analisados: {total_ativos:,}')
print(f'   ‚Ä¢ Identificados 5 perfis comportamentais distintos')
print(f'   ‚Ä¢ Per√≠odo de an√°lise: 18 meses (Jan 2024 - Jun 2025)')

print(f'\n2Ô∏è‚É£ DISTRIBUI√á√ÉO DOS PERFIS')
for perfil in sorted(dist_perfis.index):
    count = dist_perfis[perfil]
    pct = count / total_ativos * 100
    nome = nomes_perfis[perfil]
    print(f'   ‚Ä¢ Perfil {perfil} ({nome}): {count:,} ({pct:.1f}%)')

# Calcular colaboradores que requerem aten√ß√£o (perfis 2, 3, 4, 5)
atencao = metricas_colaborador[metricas_colaborador['perfil'].isin([2, 3, 4, 5])]
pct_atencao = len(atencao) / total_ativos * 100

print(f'\n3Ô∏è‚É£ FOCO DE ATEN√á√ÉO')
print(f'   ‚Ä¢ Colaboradores que requerem alguma forma de aten√ß√£o: {len(atencao):,} ({pct_atencao:.1f}%)')
print(f'   ‚Ä¢ Destes, casos cr√≠ticos (Perfil 4 e 5): {len(metricas_colaborador[metricas_colaborador["perfil"].isin([4, 5])]):,}')

# Impacto
dias_perdidos_atencao = atencao['total_problemas'].sum()
print(f'\n4Ô∏è‚É£ IMPACTO ESTIMADO (Perfis que Requerem Aten√ß√£o)')
print(f'   ‚Ä¢ Dias perdidos (faltas + atrasos): {dias_perdidos_atencao:,} dias')
print(f'   ‚Ä¢ Equivalente a: {dias_perdidos_atencao/220:.0f} anos de trabalho')

print(f'\n5Ô∏è‚É£ PR√ìXIMOS PASSOS RECOMENDADOS')
print('   1. Revisar lista de colaboradores Perfil 5 (Cr√≠tico) - A√ß√£o imediata')
print('   2. Iniciar reuni√µes disciplinares com Perfil 4 (Estrat√©gico)')
print('   3. Implementar sistema de alertas para Perfil 2 (Atrasado)')
print('   4. Agendar check-ins com Perfil 3 (Ausente Ocasional)')
print('   5. Reconhecer publicamente Perfil 1 (Exemplar)')

print('\n‚úÖ AN√ÅLISE CONCLU√çDA')
print('='*80)

---

## üì• Exporta√ß√£o de Dados

Para facilitar o trabalho dos RH, podemos exportar listas de colaboradores por perfil.

In [None]:
# Exportar colaboradores por perfil (opcional)
# Descomente as linhas abaixo para exportar

# for perfil_num in range(1, 6):
#     colaboradores_perfil = metricas_colaborador[metricas_colaborador['perfil'] == perfil_num]
#     filename = f'perfil_{perfil_num}_{nomes_perfis[perfil_num].replace(" ", "_")}.csv'
#     colunas_export = ['login', 'nome', 'operacao', 'segmento', 
#                       'faltas_injustificadas', 'faltas_justificadas', 'atrasos',
#                       'taxa_absentismo', 'pct_faltas_segundas', 'pct_faltas_sextas']
#     colaboradores_perfil[colunas_export].to_csv(filename, index=False, encoding='utf-8-sig')
#     print(f'‚úÖ Exportado: {filename} ({len(colaboradores_perfil)} colaboradores)')

print('üí° Descomente o c√≥digo acima para exportar listas por perfil')