# 📊 HR Analytics Dashboard

Benvenuto nel Dashboard HR Analytics! Questo notebook fornisce una panoramica completa delle metriche HR più importanti.

## 🎯 Obiettivi del Dashboard
- Monitorare le metriche chiave delle risorse umane
- Analizzare trend e pattern nei dati HR
- Fornire insights per decisioni strategiche

---

In [None]:
# 📦 Import delle librerie necessarie
# Per JupyterLite: installazione di seaborn se necessario
try:
    import seaborn as sns
except ImportError:
    import micropip
    await micropip.install('seaborn')
    import seaborn as sns

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from datetime import datetime, timedelta
import warnings
warnings.filterwarnings('ignore')

# Configurazione per i grafici
try:
    plt.style.use('seaborn-v0_8')
    if 'sns' in locals():
        sns.set_palette("husl")
except:
    plt.style.use('default')

print("✅ Librerie caricate con successo!")
print(f"📅 Dashboard aggiornato il: {datetime.now().strftime('%d/%m/%Y %H:%M')}")

## 🔍 Verifica Disponibilità Dati

Prima di procedere con l'analisi, verifichiamo la disponibilità dei file di dati.

In [None]:
# 🔍 Verifica disponibilità dei file di dati
import os

# Lista dei file di dati attesi
data_files = [
    'hr_data.csv'
]

print("📁 Verifica file di dati:")
print("-" * 40)

available_files = []
for file_path in data_files:
    if os.path.exists(file_path):
        print(f"✅ {file_path} - Disponibile")
        available_files.append(file_path)
    else:
        print(f"❌ {file_path} - Non trovato")

print(f"\n📊 File disponibili: {len(available_files)}/{len(data_files)}")

if len(available_files) == 0:
    print("\n⚠️  Nessun file di dati trovato. Utilizzeremo dati di esempio.")
else:
    print("\n🎉 Dati pronti per l'analisi!")

## 📊 Caricamento Dati

Carichiamo i dati HR per l'analisi.

In [None]:
# 📊 Caricamento dei dati HR
try:
    # Prova a caricare il file CSV
    df = pd.read_csv('hr_data.csv')
    print(f"✅ Dati caricati con successo!")
    print(f"📈 Dimensioni dataset: {df.shape[0]} righe, {df.shape[1]} colonne")
    
    # Mostra le prime righe
    print("\n🔍 Prime 5 righe del dataset:")
    display(df.head())
    
    # Informazioni sulle colonne
    print("\n📋 Informazioni sulle colonne:")
    print(df.info())
    
except FileNotFoundError:
    print("❌ File hr_data.csv non trovato")
    print("📝 Creazione dati di esempio...")
    
    # Crea dati di esempio
    np.random.seed(42)
    n_employees = 100
    
    df = pd.DataFrame({
        'ID_Dipendente': range(1, n_employees + 1),
        'Nome': [f'Dipendente_{i}' for i in range(1, n_employees + 1)],
        'Dipartimento': np.random.choice(['IT', 'HR', 'Finance', 'Marketing', 'Operations'], n_employees),
        'Posizione': np.random.choice(['Junior', 'Senior', 'Manager', 'Director'], n_employees),
        'Stipendio': np.random.normal(50000, 15000, n_employees).astype(int),
        'Età': np.random.randint(25, 65, n_employees),
        'Anni_Servizio': np.random.randint(1, 20, n_employees),
        'Performance_Score': np.random.uniform(1, 5, n_employees).round(2)
    })
    
    print(f"✅ Dati di esempio creati: {df.shape[0]} dipendenti")
    display(df.head())

## 📊 Analisi HR Dashboard

Analizziamo i dati HR con grafici e metriche chiave.

In [None]:
if df is not None:
    # Metriche chiave
    print('📊 METRICHE CHIAVE HR')
    print('=' * 50)
    print(f'👥 Totale Dipendenti: {len(df)}')
    
    if 'Dipartimento' in df.columns:
        print(f'🏢 Dipartimenti: {df["Dipartimento"].nunique()}')
        print(f'📈 Dipartimento più grande: {df["Dipartimento"].value_counts().index[0]} ({df["Dipartimento"].value_counts().iloc[0]} dipendenti)')
    
    if 'Età' in df.columns:
        print(f'🎂 Età media: {df["Età"].mean():.1f} anni')
        print(f'📊 Range età: {df["Età"].min()}-{df["Età"].max()} anni')
    
    if 'Stipendio' in df.columns:
        print(f'💰 Stipendio medio: €{df["Stipendio"].mean():,.0f}')
        print(f'💸 Range stipendi: €{df["Stipendio"].min():,.0f} - €{df["Stipendio"].max():,.0f}')
    
    if 'Performance_Score' in df.columns:
        print(f'⭐ Performance media: {df["Performance_Score"].mean():.2f}/5.00')

In [None]:
if df is not None:
    # Grafici HR
    fig, axes = plt.subplots(2, 2, figsize=(15, 12))
    
    # Distribuzione per dipartimento
    if 'Dipartimento' in df.columns:
        dept_counts = df['Dipartimento'].value_counts()
        axes[0,0].pie(dept_counts.values, labels=dept_counts.index, autopct='%1.1f%%')
        axes[0,0].set_title('📊 Distribuzione per Dipartimento')
    
    # Distribuzione stipendi
    if 'Stipendio' in df.columns:
        axes[0,1].hist(df['Stipendio'], bins=20, alpha=0.7, color='lightgreen')
        axes[0,1].set_title('💰 Distribuzione Stipendi')
        axes[0,1].set_xlabel('Stipendio (€)')
        axes[0,1].set_ylabel('Frequenza')
    
    # Età vs Performance
    if 'Età' in df.columns and 'Performance_Score' in df.columns:
        axes[1,0].scatter(df['Età'], df['Performance_Score'], alpha=0.6)
        axes[1,0].set_title('🎯 Età vs Performance')
        axes[1,0].set_xlabel('Età')
        axes[1,0].set_ylabel('Performance Score')
    
    # Stipendio per posizione
    if 'Posizione' in df.columns and 'Stipendio' in df.columns:
        pos_salary = df.groupby('Posizione')['Stipendio'].mean().sort_values(ascending=True)
        axes[1,1].barh(range(len(pos_salary)), pos_salary.values)
        axes[1,1].set_yticks(range(len(pos_salary)))
        axes[1,1].set_yticklabels(pos_salary.index)
        axes[1,1].set_title('💼 Stipendio Medio per Posizione')
        axes[1,1].set_xlabel('Stipendio Medio (€)')
    
    plt.tight_layout()
    plt.show()
    
    print('\n✅ Dashboard HR completato!')
    print(f'📅 Ultimo aggiornamento: {datetime.now().strftime("%d/%m/%Y %H:%M")}')