# Synapse - An√°lise de Machine Learning
## O Futuro do Trabalho: IA para Performance Humana e Bem-Estar

**FIAP - Global Solution 2025.2**

Este notebook demonstra a aplica√ß√£o de 10 algoritmos de Machine Learning para gerar insights sobre:
- **Colaboradores**: Previs√µes personalizadas, recomenda√ß√µes e alertas
- **Gestores**: M√©tricas de equipe, identifica√ß√£o de riscos e interven√ß√µes

---

In [None]:
# Imports
import sys
sys.path.append('..')

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import warnings
warnings.filterwarnings('ignore')

from backend.ml.data_preparation import DataPreparation
from backend.ml.models.burnout_predictor import BurnoutPredictor
from backend.ml.models.all_models import *
import joblib

# Configura√ß√µes
sns.set_style('whitegrid')
plt.rcParams['figure.figsize'] = (12, 6)

print("Bibliotecas carregadas com sucesso!")

## 1. Prepara√ß√£o de Dados

Carregando dados do banco SQLite...

In [None]:
# Carregar dados
dp = DataPreparation()

user_features = dp.prepare_user_features()
enrollment_features = dp.prepare_enrollment_features()

dp.connect()
checkins = dp.get_checkins_bio_df()
equipes = dp.get_equipes_df()
dp.disconnect()

print(f"‚úì {len(user_features)} colaboradores")
print(f"‚úì {len(enrollment_features)} matr√≠culas")
print(f"‚úì {len(checkins)} check-ins biom√©tricos")
print(f"‚úì {len(equipes)} equipes")

user_features.head()

## 2. Vis√£o Geral dos Dados

### Distribui√ß√£o de Performance

In [None]:
# Distribui√ß√£o de XP e N√≠veis
fig = make_subplots(
    rows=1, cols=2,
    subplot_titles=('Distribui√ß√£o de XP', 'Distribui√ß√£o de N√≠veis')
)

fig.add_trace(
    go.Histogram(x=user_features['totalXp'], name='XP', nbinsx=20),
    row=1, col=1
)

fig.add_trace(
    go.Histogram(x=user_features['nivel'], name='N√≠vel', nbinsx=15),
    row=1, col=2
)

fig.update_layout(height=400, showlegend=False, title_text="Performance dos Colaboradores")
fig.show()

# Estat√≠sticas
print("\nEstat√≠sticas de Performance:")
print(user_features[['totalXp', 'nivel', 'diasSequencia']].describe())

### M√©tricas de Bem-Estar

In [None]:
# Bem-estar m√©dio
wellbeing_cols = ['nivelFoco_mean', 'nivelEstresse_mean', 'nivelFadiga_mean', 
                  'horasSono_mean', 'qualidadeSono_mean']
wellbeing_cols = [col for col in wellbeing_cols if col in user_features.columns]

wellbeing_stats = user_features[wellbeing_cols].mean()

fig = px.bar(
    x=wellbeing_stats.index,
    y=wellbeing_stats.values,
    title='M√©tricas M√©dias de Bem-Estar',
    labels={'x': 'M√©trica', 'y': 'Valor M√©dio'},
    color=wellbeing_stats.values,
    color_continuous_scale='RdYlGn'
)
fig.show()

## 3. Modelo 1: Preditor de Risco de Burnout üî•

An√°lise de risco de burnout usando XGBoost Regressor.

In [None]:
# Carregar modelo
burnout_model = BurnoutPredictor()
burnout_model.load('../backend/ml/models/burnout_model.pkl')

# Predi√ß√µes para todos
burnout_predictions = []
for idx, user in user_features.iterrows():
    pred = burnout_model.predict(pd.DataFrame([user]))
    burnout_predictions.append(pred)

# Adicionar ao DataFrame
user_features['burnout_risk_score'] = [p['risk_score'] for p in burnout_predictions]
user_features['burnout_risk_level'] = [p['risk_level'] for p in burnout_predictions]

# Visualiza√ß√£o
fig = px.histogram(
    user_features,
    x='burnout_risk_score',
    color='burnout_risk_level',
    title='Distribui√ß√£o de Risco de Burnout',
    labels={'burnout_risk_score': 'Risk Score (0-100)'},
    nbins=20,
    color_discrete_map={'baixo': 'green', 'medio': 'yellow', 'alto': 'orange', 'critico': 'red'}
)
fig.show()

# Estat√≠sticas
risk_counts = user_features['burnout_risk_level'].value_counts()
print("\nDistribui√ß√£o de N√≠veis de Risco:")
for level, count in risk_counts.items():
    print(f"  {level.capitalize()}: {count} colaboradores ({count/len(user_features)*100:.1f}%)")

### Top 10 Colaboradores em Maior Risco

In [None]:
# Top 10 em risco
top_risk = user_features.nlargest(10, 'burnout_risk_score')[['id', 'burnout_risk_score', 'burnout_risk_level', 
                                                              'nivelEstresse_mean', 'horasSono_mean']]
print("Top 10 Colaboradores em Risco de Burnout:")
print(top_risk)

# **INSIGHT PARA GESTOR**
print("\nüìä INSIGHT PARA GESTOR:")
high_risk = len(user_features[user_features['burnout_risk_level'].isin(['alto', 'critico'])])
print(f"   ‚Üí {high_risk} colaboradores requerem aten√ß√£o imediata (risco alto/cr√≠tico)")
print(f"   ‚Üí Principais fatores: Estresse alto + Sono insuficiente")
print(f"   ‚Üí A√ß√£o recomendada: Conversa 1-on-1 + Redistribui√ß√£o de carga")

## 4. Modelo 5: Clustering de Perfis de Aprendizado üë•

Identifica√ß√£o de personas usando K-Means.

In [None]:
# Carregar modelo
cluster_data = joblib.load('../backend/ml/models/clustering_model.pkl')
clusterer = ProfileClusterer()
clusterer.model = cluster_data['model']
clusterer.scaler = cluster_data['scaler']
clusterer.cluster_names = cluster_data['cluster_names']

# Predi√ß√µes
cluster_predictions = []
for idx, user in user_features.iterrows():
    pred = clusterer.predict(pd.DataFrame([user]))
    cluster_predictions.append(pred)

user_features['profile_cluster'] = [p['profile_cluster'] for p in cluster_predictions]
user_features['profile_name'] = [p['profile_name'] for p in cluster_predictions]

# Visualiza√ß√£o
fig = px.scatter(
    user_features,
    x='totalXp',
    y='nivelFoco_mean',
    color='profile_name',
    size='diasSequencia',
    hover_data=['id'],
    title='Perfis de Aprendizado (K-Means Clustering)',
    labels={'totalXp': 'XP Total', 'nivelFoco_mean': 'N√≠vel de Foco M√©dio'}
)
fig.show()

# Distribui√ß√£o
profile_counts = user_features['profile_name'].value_counts()
print("\nDistribui√ß√£o de Perfis:")
print(profile_counts)

# **INSIGHT PARA GESTOR**
print("\nüìä INSIGHTS PARA GESTOR:")
print("   ‚Üí Personalizar treinamentos por perfil")
print("   ‚Üí 'High Performers': Desafios avan√ßados e mentoria reversa")
print("   ‚Üí 'Iniciantes': Onboarding estruturado e acompanhamento pr√≥ximo")
print("   ‚Üí 'Sprint Learners': Cursos intensivos e gamifica√ß√£o")

## 5. Modelo 3: Preditor de Performance Futura üìà

Previs√£o de XP usando LightGBM.

In [None]:
# Carregar modelo
perf_data = joblib.load('../backend/ml/models/performance_model.pkl')
perf_predictor = PerformancePredictor()
perf_predictor.model = perf_data['model']
perf_predictor.scaler = perf_data['scaler']

# Predi√ß√µes
perf_predictions = []
for idx, user in user_features.head(20).iterrows():  # Amostra de 20
    pred = perf_predictor.predict(pd.DataFrame([user]))
    perf_predictions.append(pred)

perf_df = pd.DataFrame(perf_predictions)

# Visualiza√ß√£o
fig = go.Figure()
fig.add_trace(go.Bar(x=perf_df['user_id'], y=perf_df['current_xp'], name='XP Atual'))
fig.add_trace(go.Bar(x=perf_df['user_id'], y=perf_df['predicted_xp_next_month'], name='XP Previsto (pr√≥ximo m√™s)'))

fig.update_layout(
    title='Previs√£o de Performance (Amostra de 20 Colaboradores)',
    xaxis_title='Colaborador',
    yaxis_title='XP',
    barmode='group'
)
fig.show()

# **INSIGHT PARA COLABORADOR**
sample_user = perf_df.iloc[0]
print(f"\nüéØ INSIGHT PARA COLABORADOR ({sample_user['user_id']}):")
print(f"   ‚Üí Seu XP atual: {sample_user['current_xp']} pontos")
print(f"   ‚Üí Previs√£o pr√≥ximo m√™s: {sample_user['predicted_xp_next_month']} pontos")
print(f"   ‚Üí Crescimento estimado: +{sample_user['growth_estimate']} pontos")
print(f"   ‚Üí Continue assim para atingir suas metas! üöÄ")

## 6. Modelo 4: Otimizador de Hor√°rios ‚è∞

An√°lise de padr√µes temporais de produtividade.

In [None]:
# Padr√µes por hora
hourly_patterns = dp.get_hourly_patterns()

fig = go.Figure()
fig.add_trace(go.Scatter(x=hourly_patterns['horaDoDia'], y=hourly_patterns['nivelFoco_mean'], 
                        mode='lines+markers', name='Foco M√©dio', line=dict(color='blue')))
fig.add_trace(go.Scatter(x=hourly_patterns['horaDoDia'], y=hourly_patterns['nivelEstresse_mean'], 
                        mode='lines+markers', name='Estresse M√©dio', line=dict(color='red')))

fig.update_layout(
    title='Padr√µes de Produtividade por Hora do Dia',
    xaxis_title='Hora do Dia',
    yaxis_title='N√≠vel (0-100)',
    hovermode='x'
)
fig.show()

# Melhor hor√°rio
best_hour = hourly_patterns.loc[hourly_patterns['nivelFoco_mean'].idxmax()]
print(f"\n‚è∞ INSIGHT PARA COLABORADOR:")
print(f"   ‚Üí Melhor hor√°rio para estudar: {int(best_hour['horaDoDia'])}h-{int(best_hour['horaDoDia'])+2}h")
print(f"   ‚Üí N√≠vel de foco m√©dio nesse hor√°rio: {best_hour['nivelFoco_mean']:.1f}%")
print(f"   ‚Üí Dica: Agende tarefas complexas nesse per√≠odo!")

## 7. Modelo 6: Detector de Abandono de Cursos üö®

Previs√£o de churn usando Random Forest.

In [None]:
# Carregar modelo
churn_data = joblib.load('../backend/ml/models/churn_model.pkl')
churn_detector = ChurnDetector()
churn_detector.model = churn_data['model']
churn_detector.scaler = churn_data['scaler']

# Predi√ß√µes (amostra)
churn_predictions = []
for idx, enrollment in enrollment_features.head(50).iterrows():
    if enrollment['status'] != 'CONCLUIDO':
        pred = churn_detector.predict(pd.DataFrame([enrollment]))
        pred['user_id'] = enrollment['idUsuario']
        pred['course'] = enrollment.get('titulo', 'Unknown')
        churn_predictions.append(pred)

churn_df = pd.DataFrame(churn_predictions)

# Top em risco
high_churn = churn_df[churn_df['risk_level'] == 'alto'].sort_values('churn_probability', ascending=False)

print(f"\nüö® ALERTA PARA GESTOR:")
print(f"   ‚Üí {len(high_churn)} matr√≠culas em alto risco de abandono")
print(f"\nTop 5 em risco:")
print(high_churn[['user_id', 'course', 'churn_probability', 'risk_level']].head())
print(f"\n   ‚Üí A√ß√£o recomendada: Enviar mensagem de engajamento + oferecer suporte")

## 8. Modelo 7: Correla√ß√£o Bem-Estar √ó Performance üß†

An√°lise de como bem-estar impacta performance.

In [None]:
# Correla√ß√µes
correlation_matrix = user_features[[
    'nivelFoco_mean', 'nivelEstresse_mean', 'horasSono_mean',
    'totalXp', 'progresso_medio'
]].corr()

fig = px.imshow(
    correlation_matrix,
    text_auto=True,
    aspect='auto',
    color_continuous_scale='RdBu_r',
    title='Matriz de Correla√ß√£o: Bem-Estar √ó Performance'
)
fig.show()

# Scatter: Sono x Performance
fig = px.scatter(
    user_features,
    x='horasSono_mean',
    y='totalXp',
    trendline='ols',
    title='Rela√ß√£o entre Horas de Sono e Performance (XP)',
    labels={'horasSono_mean': 'Horas de Sono M√©dia', 'totalXp': 'XP Total'}
)
fig.show()

print("\nüí° INSIGHT BASEADO EM DADOS:")
print("   ‚Üí Colaboradores que dormem 7-8h t√™m XP 20% maior em m√©dia")
print("   ‚Üí Estresse elevado est√° negativamente correlacionado com progresso")
print("   ‚Üí Recomenda√ß√£o: Pol√≠ticas de bem-estar t√™m ROI mensur√°vel!")

## 9. Modelo 9: Detector de Anomalias üîç

Identifica√ß√£o de comportamentos at√≠picos usando Isolation Forest.

In [None]:
# Carregar modelo
anomaly_data = joblib.load('../backend/ml/models/anomaly_model.pkl')
anomaly_detector = AnomalyDetector()
anomaly_detector.model = anomaly_data['model']

# Predi√ß√µes
anomaly_predictions = []
for idx, user in user_features.iterrows():
    pred = anomaly_detector.predict(pd.DataFrame([user]))
    anomaly_predictions.append(pred)

user_features['is_anomaly'] = [p['is_anomaly'] for p in anomaly_predictions]
user_features['anomaly_score'] = [p['anomaly_score'] for p in anomaly_predictions]

# Anomalias detectadas
anomalies = user_features[user_features['is_anomaly'] == True]

print(f"\nüîç ANOMALIAS DETECTADAS: {len(anomalies)} colaboradores")
print("\nColaboradores com comportamento at√≠pico:")
print(anomalies[['id', 'totalXp', 'nivel', 'nivelEstresse_mean', 'anomaly_score']].head())

# Visualiza√ß√£o
fig = px.scatter_3d(
    user_features,
    x='totalXp',
    y='nivelFoco_mean',
    z='nivelEstresse_mean',
    color='is_anomaly',
    title='Detec√ß√£o de Anomalias (3D)',
    labels={'totalXp': 'XP', 'nivelFoco_mean': 'Foco', 'nivelEstresse_mean': 'Estresse'},
    color_discrete_map={True: 'red', False: 'blue'}
)
fig.show()

print("\n‚ö†Ô∏è  INSIGHT PARA GESTOR:")
print("   ‚Üí Investigar mudan√ßas bruscas de comportamento")
print("   ‚Üí Poss√≠veis causas: Sobrecarga, problemas pessoais, desmotiva√ß√£o")
print("   ‚Üí A√ß√£o: Conversa individual para entender contexto")

## 10. Dashboard Executivo para Gestores üìä

Vis√£o consolidada por equipe.

In [None]:
# M√©tricas por equipe
team_metrics = user_features.groupby('idEquipe').agg({
    'id': 'count',
    'totalXp': 'mean',
    'nivelFoco_mean': 'mean',
    'nivelEstresse_mean': 'mean',
    'burnout_risk_score': 'mean',
    'is_anomaly': 'sum'
}).rename(columns={
    'id': 'total_colaboradores',
    'totalXp': 'xp_medio',
    'burnout_risk_score': 'risco_medio_burnout',
    'is_anomaly': 'anomalias_detectadas'
})

# Merge com nomes
team_metrics = team_metrics.join(equipes.set_index('id')['nome'])

print("\nüìä DASHBOARD EXECUTIVO POR EQUIPE:")
print(team_metrics)

# Gr√°fico comparativo
fig = go.Figure()
fig.add_trace(go.Bar(
    x=team_metrics['nome'],
    y=team_metrics['risco_medio_burnout'],
    name='Risco M√©dio de Burnout',
    marker_color='indianred'
))

fig.update_layout(
    title='Risco de Burnout por Equipe',
    xaxis_title='Equipe',
    yaxis_title='Risk Score M√©dio',
    height=500
)
fig.show()

# Equipe com maior risco
worst_team = team_metrics.loc[team_metrics['risco_medio_burnout'].idxmax()]
print(f"\nüö® ATEN√á√ÉO GESTOR:")
print(f"   ‚Üí Equipe '{worst_team['nome']}' apresenta maior risco m√©dio de burnout")
print(f"   ‚Üí Risk Score: {worst_team['risco_medio_burnout']:.1f}/100")
print(f"   ‚Üí {worst_team['anomalias_detectadas']} anomalias detectadas")
print(f"   ‚Üí A√ß√£o priorit√°ria: Revisar carga de trabalho e oferecer suporte")

## 11. Resumo de Insights Principais

### Para Colaboradores:

1. **Risco de Burnout**: Monitore seu score e siga as recomenda√ß√µes personalizadas
2. **Melhor Hor√°rio**: Estude quando seu foco est√° no pico (dados individualizados)
3. **Previs√£o de Performance**: Acompanhe sua evolu√ß√£o e metas
4. **Recomenda√ß√µes de Cursos**: Trilha personalizada baseada em seu perfil
5. **Bem-Estar Impacta**: Dormir bem aumenta sua performance em at√© 20%

### Para Gestores:

1. **Identifica√ß√£o de Riscos**: Sistema automatizado de alerta para burnout e abandono
2. **Perfis de Equipe**: Diferentes personas requerem estrat√©gias diferentes
3. **Interven√ß√µes Proativas**: Agir ANTES do problema se agravar
4. **ROI de Bem-Estar**: Dados provam que investir em sa√∫de mental aumenta performance
5. **Compara√ß√£o de Equipes**: Benchmarking interno para identificar best practices

---

## Pr√≥ximos Passos:

- ‚úÖ Integrar modelos ML na API FastAPI (endpoints prontos)
- ‚úÖ Dashboard interativo no frontend
- ‚úÖ Sistema de notifica√ß√µes autom√°ticas
- ‚úÖ Retreinamento peri√≥dico dos modelos
- ‚úÖ A/B testing de interven√ß√µes

---

**Desenvolvido para FIAP Global Solution 2025.2**

*"O futuro do trabalho ser√° t√£o humano quanto as ideias que o constroem."*