# üìä Lezione 18 ‚Äî Metriche di Valutazione per la Regressione

## üéØ Obiettivi della Lezione

In questa lezione imparerai:

1. **Perch√© non basta R¬≤** ‚Äî limiti e interpretazione
2. **MAE, MSE, RMSE** ‚Äî errori assoluti e quadratici
3. **MAPE** ‚Äî errore percentuale (interpretabilit√† business)
4. **Confronto tra metriche** ‚Äî quando usare quale
5. **Residui** ‚Äî analisi diagnostica del modello

---

## üß† Il Problema: Come Valuto un Modello di Regressione?

### Classificazione vs Regressione

| Classificazione | Regressione |
|-----------------|-------------|
| Predice classi discrete | Predice valori continui |
| Accuracy, Precision, Recall | MAE, MSE, R¬≤ |
| "Giusto o sbagliato" | "Quanto sbaglio?" |

### Domanda Chiave

> In regressione non c'√® "giusto/sbagliato". C'√® solo **quanto sei lontano** dal valore vero.

**Esempio:** Predici che una casa costa ‚Ç¨200.000, il prezzo reale √® ‚Ç¨210.000.
- Non √® "sbagliato" in senso assoluto
- L'errore √® ‚Ç¨10.000 (o 5%)

---

## 1Ô∏è‚É£ MAE ‚Äî Mean Absolute Error

### Formula

$$MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|$$

### Interpretazione

| Aspetto | Descrizione |
|---------|-------------|
| **Cosa misura** | Media degli errori assoluti |
| **Unit√†** | Stessa unit√† di y (‚Ç¨, kg, anni...) |
| **Range** | [0, ‚àû) ‚Äî 0 = perfetto |
| **Sensibilit√† outlier** | Bassa (robusto) |

### Pro e Contro

| ‚úÖ Pro | ‚ùå Contro |
|--------|----------|
| Facile da interpretare | Non penalizza grandi errori |
| Robusto agli outlier | Non differenziabile in 0 |
| Stessa scala di y | Pu√≤ sottovalutare errori gravi |

### Esempio Intuitivo

```
Predizioni: [100, 200, 150]
Valori veri: [110, 180, 160]
Errori: |110-100|=10, |180-200|=20, |160-150|=10
MAE = (10 + 20 + 10) / 3 = 13.33
```
‚Üí "In media, sbaglio di ‚Ç¨13.33"

---

## 2Ô∏è‚É£ MSE e RMSE ‚Äî Mean Squared Error

### Formule

$$MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$$

$$RMSE = \sqrt{MSE}$$

### Interpretazione

| Metrica | Unit√† | Sensibilit√† Outlier |
|---------|-------|---------------------|
| **MSE** | y¬≤ (es. ‚Ç¨¬≤) | ALTA |
| **RMSE** | y (es. ‚Ç¨) | ALTA |

### Perch√© RMSE invece di MSE?

- **MSE** √® in unit√† quadrate ‚Üí difficile da interpretare
- **RMSE** riporta alla scala originale ‚Üí confrontabile con MAE

### Esempio: Effetto Outlier

```
Scenario 1: errori = [10, 10, 10]
    MAE = 10, MSE = 100, RMSE = 10

Scenario 2: errori = [1, 1, 28]  (un outlier!)
    MAE = 10, MSE = 262, RMSE = 16.2
```
‚Üí MSE/RMSE **penalizzano molto** i grandi errori!

In [None]:
# ============================================
# DEMO: MAE vs MSE vs RMSE
# ============================================

import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import mean_absolute_error, mean_squared_error
import warnings
warnings.filterwarnings('ignore')

# Simuliamo previsioni di prezzi immobiliari
np.random.seed(42)

y_true = np.array([200, 250, 180, 320, 275, 190, 400, 350, 220, 280])  # Prezzi reali (k‚Ç¨)
y_pred = np.array([210, 240, 175, 310, 290, 200, 380, 340, 230, 270])  # Predizioni

# Calcolo metriche
mae = mean_absolute_error(y_true, y_pred)
mse = mean_squared_error(y_true, y_pred)
rmse = np.sqrt(mse)

print("=" * 60)
print("üìä CONFRONTO METRICHE DI ERRORE")
print("=" * 60)

print(f"\nüìå Dataset: Prezzi immobiliari (k‚Ç¨)")
print(f"   - Campioni: {len(y_true)}")
print(f"   - Prezzo medio reale: {y_true.mean():.1f}k‚Ç¨")

print(f"\nüìà Metriche:")
print(f"   MAE  = {mae:.2f}k‚Ç¨  (errore medio assoluto)")
print(f"   MSE  = {mse:.2f}k‚Ç¨¬≤ (errore quadratico medio)")
print(f"   RMSE = {rmse:.2f}k‚Ç¨  (radice di MSE)")

# Visualizzazione errori
errori = y_true - y_pred

fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Predizioni vs Valori Reali
ax1 = axes[0]
ax1.scatter(y_true, y_pred, s=100, alpha=0.7, c='steelblue', edgecolors='black')
ax1.plot([y_true.min(), y_true.max()], [y_true.min(), y_true.max()], 
         'r--', linewidth=2, label='Predizione perfetta')
ax1.set_xlabel('Prezzo Reale (k‚Ç¨)', fontsize=12)
ax1.set_ylabel('Prezzo Predetto (k‚Ç¨)', fontsize=12)
ax1.set_title('üéØ Predizioni vs Valori Reali', fontsize=14)
ax1.legend()
ax1.grid(True, alpha=0.3)

# Distribuzione errori
ax2 = axes[1]
bars = ax2.bar(range(len(errori)), errori, color=['green' if e >= 0 else 'red' for e in errori],
               edgecolor='black', alpha=0.7)
ax2.axhline(y=0, color='black', linewidth=1)
ax2.axhline(y=mae, color='blue', linestyle='--', linewidth=2, label=f'MAE = {mae:.1f}')
ax2.axhline(y=-mae, color='blue', linestyle='--', linewidth=2)
ax2.set_xlabel('Campione', fontsize=12)
ax2.set_ylabel('Errore (y_true - y_pred)', fontsize=12)
ax2.set_title('üìä Distribuzione Errori', fontsize=14)
ax2.legend()
ax2.grid(True, alpha=0.3, axis='y')

plt.tight_layout()
plt.show()

print("\nüí° Interpretazione:")
print(f"   - In media sbagliamo di {mae:.1f}k‚Ç¨ (MAE)")
print(f"   - RMSE ({rmse:.1f}k‚Ç¨) > MAE ‚Üí ci sono errori pi√π grandi della media")

---

## 3Ô∏è‚É£ R¬≤ ‚Äî Coefficiente di Determinazione

### Formula

$$R^2 = 1 - \frac{SS_{res}}{SS_{tot}} = 1 - \frac{\sum(y_i - \hat{y}_i)^2}{\sum(y_i - \bar{y})^2}$$

### Interpretazione

| Valore R¬≤ | Significato |
|-----------|-------------|
| **1.0** | Predizione perfetta |
| **0.8-1.0** | Ottimo |
| **0.6-0.8** | Buono |
| **0.4-0.6** | Moderato |
| **< 0.4** | Scarso |
| **< 0** | Peggio della media! |

### Cosa Significa R¬≤?

> **R¬≤ = 0.75** significa: "Il modello spiega il 75% della varianza di y"

**Attenzione:** R¬≤ pu√≤ essere ingannevole!
- Cresce sempre aggiungendo feature (usa **Adjusted R¬≤**)
- Non indica se il modello √® corretto, solo quanto "spiega"
- R¬≤ alto ‚â† buone predizioni (pu√≤ essere overfitting)

### Adjusted R¬≤

$$R^2_{adj} = 1 - (1 - R^2) \cdot \frac{n-1}{n-p-1}$$

Dove p = numero di feature. Penalizza l'aggiunta di feature inutili.

In [None]:
# ============================================
# DEMO: R¬≤ e Adjusted R¬≤
# ============================================

from sklearn.metrics import r2_score
from sklearn.linear_model import LinearRegression
from sklearn.datasets import make_regression

# Dataset sintetico
X, y = make_regression(n_samples=100, n_features=5, n_informative=3, 
                       noise=10, random_state=42)

# Modello
model = LinearRegression()
model.fit(X, y)
y_pred = model.predict(X)

# R¬≤
r2 = r2_score(y, y_pred)

# Adjusted R¬≤
n = len(y)
p = X.shape[1]
r2_adj = 1 - (1 - r2) * (n - 1) / (n - p - 1)

print("=" * 60)
print("üìä R¬≤ e ADJUSTED R¬≤")
print("=" * 60)

print(f"\nüìå Dataset:")
print(f"   - Campioni: {n}")
print(f"   - Feature: {p}")
print(f"   - Feature informative reali: 3")

print(f"\nüìà Metriche:")
print(f"   R¬≤     = {r2:.4f}")
print(f"   R¬≤ adj = {r2_adj:.4f}")

print(f"\nüí° Interpretazione:")
print(f"   - Il modello spiega {r2*100:.1f}% della varianza")
print(f"   - Adjusted R¬≤ penalizza le 2 feature non informative")

# Visualizzazione: cosa significa R¬≤
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Predizioni vs Reali
ax1 = axes[0]
ax1.scatter(y, y_pred, alpha=0.6, s=50, c='steelblue', edgecolors='black')
ax1.plot([y.min(), y.max()], [y.min(), y.max()], 'r--', linewidth=2, 
         label='Predizione perfetta')
ax1.set_xlabel('Valore Reale', fontsize=12)
ax1.set_ylabel('Valore Predetto', fontsize=12)
ax1.set_title(f'üéØ R¬≤ = {r2:.3f}', fontsize=14)
ax1.legend()
ax1.grid(True, alpha=0.3)

# R¬≤ con diversi livelli di rumore
noise_levels = [5, 20, 50, 100, 200]
r2_scores = []

for noise in noise_levels:
    X_temp, y_temp = make_regression(n_samples=100, n_features=3, n_informative=3,
                                      noise=noise, random_state=42)
    model_temp = LinearRegression()
    model_temp.fit(X_temp, y_temp)
    r2_scores.append(r2_score(y_temp, model_temp.predict(X_temp)))

ax2 = axes[1]
ax2.bar(range(len(noise_levels)), r2_scores, color='steelblue', edgecolor='black')
ax2.set_xticks(range(len(noise_levels)))
ax2.set_xticklabels([f'œÉ={n}' for n in noise_levels])
ax2.set_xlabel('Livello di Rumore', fontsize=12)
ax2.set_ylabel('R¬≤', fontsize=12)
ax2.set_title('üìâ R¬≤ diminuisce con il rumore', fontsize=14)
ax2.set_ylim(0, 1)
ax2.grid(True, alpha=0.3, axis='y')

for i, r in enumerate(r2_scores):
    ax2.text(i, r + 0.02, f'{r:.2f}', ha='center', fontsize=10)

plt.tight_layout()
plt.show()

---

## 4Ô∏è‚É£ MAPE ‚Äî Mean Absolute Percentage Error

### Formula

$$MAPE = \frac{100\%}{n} \sum_{i=1}^{n} \left| \frac{y_i - \hat{y}_i}{y_i} \right|$$

### Interpretazione

| Aspetto | Descrizione |
|---------|-------------|
| **Cosa misura** | Errore percentuale medio |
| **Unit√†** | Percentuale (%) |
| **Range** | [0%, ‚àû) |
| **Vantaggio** | Facilissimo da comunicare! |

### Pro e Contro

| ‚úÖ Pro | ‚ùå Contro |
|--------|----------|
| Intuitivo per il business | Non definito se y=0 |
| Scala-indipendente | Asimmetrico (sovrastima errori su valori piccoli) |
| Confrontabile tra dataset | Non usare se y pu√≤ essere 0 o negativo |

### Esempio Business

```
MAPE = 8%
```
‚Üí "In media, le nostre previsioni sbagliano dell'8%"

Questo lo capisce chiunque!

In [None]:
# ============================================
# DEMO: MAPE e confronto completo metriche
# ============================================

from sklearn.metrics import mean_absolute_percentage_error

# Usiamo il dataset prezzi di prima
print("=" * 60)
print("üìä MAPE ‚Äî ERRORE PERCENTUALE")
print("=" * 60)

# MAPE
mape = mean_absolute_percentage_error(y_true, y_pred) * 100  # in percentuale

print(f"\nüìå Dataset: Prezzi immobiliari")
print(f"   Prezzo medio: {y_true.mean():.0f}k‚Ç¨")

print(f"\nüìà Metriche a confronto:")
print(f"   MAE  = {mae:.2f}k‚Ç¨")
print(f"   RMSE = {rmse:.2f}k‚Ç¨")
print(f"   MAPE = {mape:.2f}%")
print(f"   R¬≤   = {r2_score(y_true, y_pred):.4f}")

# Visualizzazione confronto
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Errore assoluto vs percentuale
ax1 = axes[0]
errori_abs = np.abs(y_true - y_pred)
errori_perc = np.abs((y_true - y_pred) / y_true) * 100

x_pos = np.arange(len(y_true))
width = 0.35

bars1 = ax1.bar(x_pos - width/2, errori_abs, width, label='Errore Assoluto (k‚Ç¨)', 
                color='steelblue', edgecolor='black')
ax1_twin = ax1.twinx()
bars2 = ax1_twin.bar(x_pos + width/2, errori_perc, width, label='Errore % ', 
                     color='coral', edgecolor='black')

ax1.set_xlabel('Campione', fontsize=12)
ax1.set_ylabel('Errore Assoluto (k‚Ç¨)', color='steelblue', fontsize=12)
ax1_twin.set_ylabel('Errore Percentuale (%)', color='coral', fontsize=12)
ax1.set_title('üìä Errore Assoluto vs Percentuale', fontsize=14)

# Legenda combinata
lines1, labels1 = ax1.get_legend_handles_labels()
lines2, labels2 = ax1_twin.get_legend_handles_labels()
ax1.legend(lines1 + lines2, labels1 + labels2, loc='upper right')

# Riepilogo metriche
ax2 = axes[1]
metriche = ['MAE\n(k‚Ç¨)', 'RMSE\n(k‚Ç¨)', 'MAPE\n(%)', 'R¬≤']
valori = [mae, rmse, mape, r2_score(y_true, y_pred) * 100]  # R¬≤ scalato per visualizzazione
colori = ['#3498db', '#e74c3c', '#27ae60', '#9b59b6']

bars = ax2.bar(metriche, valori, color=colori, edgecolor='black')
ax2.set_ylabel('Valore', fontsize=12)
ax2.set_title('üìä Riepilogo Metriche', fontsize=14)

for bar, val in zip(bars, valori):
    ax2.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 1, 
             f'{val:.2f}', ha='center', fontsize=11, fontweight='bold')

plt.tight_layout()
plt.show()

print("\nüí° Per il business:")
print(f"   'Le nostre stime dei prezzi sbagliano in media del {mape:.1f}%'")

---

## 5Ô∏è‚É£ Analisi dei Residui

### Cosa Sono i Residui?

$$residuo_i = y_i - \hat{y}_i$$

I residui sono gli **errori** del modello. Analizzarli ci dice se il modello √® appropriato.

### Residui Ideali

Un buon modello ha residui che sono:

| Propriet√† | Cosa Significa | Come Verificare |
|-----------|----------------|-----------------|
| **Media zero** | Nessun bias sistematico | mean(residui) ‚âà 0 |
| **Omoscedastici** | Varianza costante | Scatter plot uniforme |
| **Normali** | Distribuzione gaussiana | Q-Q plot, istogramma |
| **Indipendenti** | No pattern | No trend nel tempo |

### Segnali di Problemi

| Pattern nei Residui | Problema | Soluzione |
|---------------------|----------|-----------|
| Trend (crescente/decrescente) | Manca una feature | Aggiungi variabili |
| Forma a U o arco | Relazione non lineare | Trasformazioni, polinomi |
| Cono (varianza crescente) | Eteroschedasticit√† | Log-trasformazione di y |
| Cluster | Gruppi diversi | Modelli separati, dummy |

In [None]:
# ============================================
# DEMO: Analisi dei Residui
# ============================================

from sklearn.linear_model import LinearRegression
from scipy import stats

# Creiamo un dataset con relazione lineare + rumore
np.random.seed(42)
X_simple = np.linspace(0, 10, 100).reshape(-1, 1)
y_simple = 3 * X_simple.flatten() + 5 + np.random.normal(0, 2, 100)

# Fit modello
model_simple = LinearRegression()
model_simple.fit(X_simple, y_simple)
y_pred_simple = model_simple.predict(X_simple)
residui = y_simple - y_pred_simple

print("=" * 60)
print("üìä ANALISI DEI RESIDUI")
print("=" * 60)

print(f"\nüìå Statistiche Residui:")
print(f"   Media: {residui.mean():.4f} (ideale ‚âà 0)")
print(f"   Std: {residui.std():.4f}")
print(f"   Min: {residui.min():.2f}, Max: {residui.max():.2f}")

# Visualizzazione completa
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# 1. Residui vs Predetti
ax1 = axes[0, 0]
ax1.scatter(y_pred_simple, residui, alpha=0.6, s=50, c='steelblue', edgecolors='black')
ax1.axhline(y=0, color='red', linestyle='--', linewidth=2)
ax1.set_xlabel('Valori Predetti', fontsize=12)
ax1.set_ylabel('Residui', fontsize=12)
ax1.set_title('üìä Residui vs Predetti (deve essere casuale!)', fontsize=14)
ax1.grid(True, alpha=0.3)

# 2. Q-Q Plot
ax2 = axes[0, 1]
stats.probplot(residui, dist="norm", plot=ax2)
ax2.set_title('üìà Q-Q Plot (deve seguire la linea)', fontsize=14)
ax2.grid(True, alpha=0.3)

# 3. Istogramma residui
ax3 = axes[1, 0]
ax3.hist(residui, bins=20, color='steelblue', edgecolor='black', alpha=0.7, density=True)
# Overlay normale
x_norm = np.linspace(residui.min(), residui.max(), 100)
ax3.plot(x_norm, stats.norm.pdf(x_norm, residui.mean(), residui.std()), 
         'r-', linewidth=2, label='Normale teorica')
ax3.set_xlabel('Residui', fontsize=12)
ax3.set_ylabel('Densit√†', fontsize=12)
ax3.set_title('üìä Distribuzione Residui (deve essere normale)', fontsize=14)
ax3.legend()
ax3.grid(True, alpha=0.3)

# 4. Residui vs Ordine (sequenza)
ax4 = axes[1, 1]
ax4.plot(residui, 'o-', alpha=0.6, markersize=5, color='steelblue')
ax4.axhline(y=0, color='red', linestyle='--', linewidth=2)
ax4.set_xlabel('Ordine Osservazione', fontsize=12)
ax4.set_ylabel('Residui', fontsize=12)
ax4.set_title('üìà Residui nel Tempo (no pattern!)', fontsize=14)
ax4.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Test normalit√†
_, p_value = stats.shapiro(residui)
print(f"\nüìà Test di Shapiro-Wilk (normalit√†):")
print(f"   p-value = {p_value:.4f}")
print(f"   {'‚úÖ Residui normali (p > 0.05)' if p_value > 0.05 else '‚ùå Residui NON normali'}")

---

## 6Ô∏è‚É£ Quando Usare Quale Metrica

### Flowchart Decisionale

```
Quale metrica uso?
        ‚îÇ
        ‚îú‚îÄ‚îÄ Vuoi comunicare al business? ‚Üí MAPE (%)
        ‚îÇ
        ‚îú‚îÄ‚îÄ Vuoi penalizzare errori grandi? ‚Üí RMSE
        ‚îÇ
        ‚îú‚îÄ‚îÄ Vuoi robustezza agli outlier? ‚Üí MAE
        ‚îÇ
        ‚îú‚îÄ‚îÄ Vuoi confrontare modelli su scale diverse? ‚Üí R¬≤
        ‚îÇ
        ‚îî‚îÄ‚îÄ Vuoi diagnosticare il modello? ‚Üí Analisi Residui
```

### Tabella Riassuntiva

| Metrica | Unit√† | Outlier | Uso Principale |
|---------|-------|---------|----------------|
| **MAE** | Come y | Robusto | Errore tipico |
| **MSE** | y¬≤ | Sensibile | Ottimizzazione |
| **RMSE** | Come y | Sensibile | Errore "tipico" pesato |
| **MAPE** | % | Moderato | Comunicazione business |
| **R¬≤** | Adimensionale | Moderato | Bont√† complessiva |

### Regole Pratiche

1. **Report al business** ‚Üí Usa MAPE ("Sbagliamo del 5%")
2. **Confronto modelli** ‚Üí Usa RMSE o R¬≤
3. **Dati con outlier** ‚Üí Preferisci MAE
4. **Ottimizzazione** ‚Üí MSE (derivabile)
5. **Sempre** ‚Üí Guarda i residui!

---

## üß† Schema Mentale ‚Äî Metriche di Regressione

```
                    ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
                    ‚îÇ    METRICHE DI REGRESSIONE         ‚îÇ
                    ‚îÇ    "Quanto sbaglio?"               ‚îÇ
                    ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
                                   ‚îÇ
         ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
         ‚Üì                         ‚Üì                         ‚Üì
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê      ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê      ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ ERRORE ASSOLUTO ‚îÇ      ‚îÇ ERRORE RELATIVO ‚îÇ      ‚îÇ BONT√Ä MODELLO   ‚îÇ
‚îÇ   MAE, RMSE     ‚îÇ      ‚îÇ     MAPE        ‚îÇ      ‚îÇ      R¬≤         ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò      ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò      ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
         ‚îÇ                        ‚îÇ                        ‚îÇ
    ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îê              ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îê              ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îê
    ‚îÇ MAE:    ‚îÇ              ‚îÇ MAPE:   ‚îÇ              ‚îÇ R¬≤:     ‚îÇ
    ‚îÇ Robusto ‚îÇ              ‚îÇ Business‚îÇ              ‚îÇ 0-1     ‚îÇ
    ‚îÇ k‚Ç¨, kg  ‚îÇ              ‚îÇ talking ‚îÇ              ‚îÇ Varianza‚îÇ
    ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò              ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò              ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
         ‚îÇ
    ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îê
    ‚îÇ RMSE:   ‚îÇ
    ‚îÇ Penaliz-‚îÇ
    ‚îÇ za gross‚îÇ
    ‚îÇ errori  ‚îÇ
    ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
```

---

## üéØ Esercizi Svolti

### Esercizio 18.1 ‚Äî Report Completo su Dataset Boston-like

**Obiettivo:** Valutare un modello di regressione sui prezzi delle case.

**Consegne:**
1. Genera un dataset di prezzi immobiliari
2. Addestra una regressione lineare
3. Calcola tutte le metriche: MAE, RMSE, MAPE, R¬≤
4. Analizza i residui
5. Produci un report testuale interpretabile

In [None]:
# ============================================
# ESERCIZIO 18.1 ‚Äî SOLUZIONE COMPLETA
# Report Completo Modello di Regressione
# ============================================

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score, mean_absolute_percentage_error
from scipy import stats
import warnings
warnings.filterwarnings('ignore')

np.random.seed(42)

print("=" * 60)
print("ESERCIZIO 18.1 ‚Äî Report Completo Modello di Regressione")
print("=" * 60)

# 1. Generazione dataset immobiliare
n_case = 500

# Feature
mq = np.random.normal(100, 30, n_case)  # Metri quadri
stanze = np.random.randint(2, 6, n_case)  # Numero stanze
eta = np.random.randint(0, 50, n_case)  # Et√† edificio
distanza_centro = np.random.exponential(3, n_case)  # Km dal centro

# Prezzo (target) = combinazione lineare + rumore
prezzo = (
    50000 +                    # Base
    2000 * mq +               # ‚Ç¨2000/mq
    15000 * stanze +          # ‚Ç¨15000/stanza
    -500 * eta +              # -‚Ç¨500/anno di et√†
    -8000 * distanza_centro + # -‚Ç¨8000/km dal centro
    np.random.normal(0, 30000, n_case)  # Rumore
)
prezzo = np.clip(prezzo, 50000, None)  # Minimo 50k

df = pd.DataFrame({
    'mq': mq,
    'stanze': stanze,
    'eta_edificio': eta,
    'km_centro': distanza_centro,
    'prezzo': prezzo
})

print("\nüìä Dataset:")
print(df.describe().round(2))

# 2. Split e addestramento
X = df[['mq', 'stanze', 'eta_edificio', 'km_centro']]
y = df['prezzo']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = LinearRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

# 3. Calcolo metriche
mae = mean_absolute_error(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
mape = mean_absolute_percentage_error(y_test, y_pred) * 100
r2 = r2_score(y_test, y_pred)

# Adjusted R¬≤
n = len(y_test)
p = X_test.shape[1]
r2_adj = 1 - (1 - r2) * (n - 1) / (n - p - 1)

# Residui
residui = y_test - y_pred

print("\n" + "=" * 60)
print("üìä REPORT VALUTAZIONE MODELLO")
print("=" * 60)

print(f"""
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ                    METRICHE DI ERRORE                      ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ  MAE (Mean Absolute Error)     ‚îÇ  ‚Ç¨{mae:>15,.0f}          ‚îÇ
‚îÇ  RMSE (Root Mean Squared Error)‚îÇ  ‚Ç¨{rmse:>15,.0f}          ‚îÇ
‚îÇ  MAPE (Mean Absolute % Error)  ‚îÇ   {mape:>14.2f}%          ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ                    BONT√Ä DEL MODELLO                       ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ  R¬≤ (Coefficiente Determinazione)  ‚îÇ     {r2:>10.4f}       ‚îÇ
‚îÇ  R¬≤ Adjusted                       ‚îÇ     {r2_adj:>10.4f}       ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
""")

# 4. Analisi residui
print("üìà ANALISI RESIDUI:")
print(f"   Media residui: ‚Ç¨{residui.mean():,.0f} (ideale ‚âà 0)")
print(f"   Std residui: ‚Ç¨{residui.std():,.0f}")

_, shapiro_p = stats.shapiro(residui.sample(min(50, len(residui)), random_state=42))
print(f"   Test normalit√† (Shapiro): p = {shapiro_p:.4f}")

# 5. Visualizzazione
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# Predetti vs Reali
ax1 = axes[0, 0]
ax1.scatter(y_test, y_pred, alpha=0.5, s=30, c='steelblue', edgecolors='black')
ax1.plot([y_test.min(), y_test.max()], [y_test.min(), y_test.max()], 'r--', linewidth=2)
ax1.set_xlabel('Prezzo Reale (‚Ç¨)', fontsize=12)
ax1.set_ylabel('Prezzo Predetto (‚Ç¨)', fontsize=12)
ax1.set_title(f'üéØ Predizioni vs Reali (R¬≤ = {r2:.3f})', fontsize=14)
ax1.grid(True, alpha=0.3)

# Residui vs Predetti
ax2 = axes[0, 1]
ax2.scatter(y_pred, residui, alpha=0.5, s=30, c='steelblue', edgecolors='black')
ax2.axhline(y=0, color='red', linestyle='--', linewidth=2)
ax2.set_xlabel('Prezzo Predetto (‚Ç¨)', fontsize=12)
ax2.set_ylabel('Residui (‚Ç¨)', fontsize=12)
ax2.set_title('üìä Residui vs Predetti', fontsize=14)
ax2.grid(True, alpha=0.3)

# Distribuzione residui
ax3 = axes[1, 0]
ax3.hist(residui, bins=30, color='steelblue', edgecolor='black', alpha=0.7, density=True)
x_norm = np.linspace(residui.min(), residui.max(), 100)
ax3.plot(x_norm, stats.norm.pdf(x_norm, residui.mean(), residui.std()), 'r-', linewidth=2)
ax3.set_xlabel('Residui (‚Ç¨)', fontsize=12)
ax3.set_ylabel('Densit√†', fontsize=12)
ax3.set_title('üìä Distribuzione Residui', fontsize=14)
ax3.grid(True, alpha=0.3)

# Importanza coefficienti
ax4 = axes[1, 1]
coef_df = pd.DataFrame({
    'Feature': X.columns,
    'Coefficiente': model.coef_
}).sort_values('Coefficiente', key=abs, ascending=True)

colors = ['green' if c > 0 else 'red' for c in coef_df['Coefficiente']]
ax4.barh(coef_df['Feature'], coef_df['Coefficiente'], color=colors, edgecolor='black')
ax4.axvline(x=0, color='black', linewidth=1)
ax4.set_xlabel('Coefficiente (‚Ç¨)', fontsize=12)
ax4.set_title('üìä Coefficienti del Modello', fontsize=14)
ax4.grid(True, alpha=0.3, axis='x')

plt.tight_layout()
plt.show()

# 6. Report business
print("\n" + "=" * 60)
print("üìã REPORT PER IL BUSINESS")
print("=" * 60)
print(f"""
üìå SINTESI:
   Il modello predice i prezzi con un errore medio del {mape:.1f}%.
   In termini assoluti, l'errore tipico √® di ‚Ç¨{mae:,.0f}.
   
üìà INTERPRETAZIONE COEFFICIENTI:
   ‚Ä¢ Ogni mq in pi√π: +‚Ç¨{model.coef_[0]:,.0f}
   ‚Ä¢ Ogni stanza in pi√π: +‚Ç¨{model.coef_[1]:,.0f}
   ‚Ä¢ Ogni anno di et√†: ‚Ç¨{model.coef_[2]:,.0f}
   ‚Ä¢ Ogni km dal centro: ‚Ç¨{model.coef_[3]:,.0f}
   
‚úÖ QUALIT√Ä: R¬≤ = {r2:.2%} ‚Äî il modello spiega {r2:.0%} della variabilit√† dei prezzi.
""")

---

### Esercizio 18.2 ‚Äî Confronto Modelli con Diverse Metriche

**Obiettivo:** Confrontare 3 modelli di regressione usando metriche diverse.

**Consegne:**
1. Addestra Linear Regression, Ridge, Random Forest
2. Calcola MAE, RMSE, MAPE, R¬≤ per ciascuno
3. Visualizza il confronto
4. Quale modello sceglieresti? Dipende dalla metrica!

In [None]:
# ============================================
# ESERCIZIO 18.2 ‚Äî SOLUZIONE COMPLETA
# Confronto Modelli con Metriche Diverse
# ============================================

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression, Ridge
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score, mean_absolute_percentage_error
import warnings
warnings.filterwarnings('ignore')

np.random.seed(42)

print("=" * 60)
print("ESERCIZIO 18.2 ‚Äî Confronto Modelli di Regressione")
print("=" * 60)

# Dataset (riuso quello dell'esercizio precedente)
n_case = 500
mq = np.random.normal(100, 30, n_case)
stanze = np.random.randint(2, 6, n_case)
eta = np.random.randint(0, 50, n_case)
distanza_centro = np.random.exponential(3, n_case)

prezzo = (50000 + 2000 * mq + 15000 * stanze - 500 * eta - 8000 * distanza_centro +
          np.random.normal(0, 30000, n_case))
prezzo = np.clip(prezzo, 50000, None)

X = np.column_stack([mq, stanze, eta, distanza_centro])
y = prezzo

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 1. Definizione modelli
modelli = {
    'Linear Regression': LinearRegression(),
    'Ridge (Œ±=1)': Ridge(alpha=1),
    'Random Forest': RandomForestRegressor(n_estimators=100, random_state=42, n_jobs=-1)
}

# 2. Training e valutazione
risultati = []

for nome, modello in modelli.items():
    modello.fit(X_train, y_train)
    y_pred = modello.predict(X_test)
    
    risultati.append({
        'Modello': nome,
        'MAE': mean_absolute_error(y_test, y_pred),
        'RMSE': np.sqrt(mean_squared_error(y_test, y_pred)),
        'MAPE': mean_absolute_percentage_error(y_test, y_pred) * 100,
        'R¬≤': r2_score(y_test, y_pred)
    })

df_risultati = pd.DataFrame(risultati)

print("\nüìä RISULTATI:")
print(df_risultati.to_string(index=False))

# 3. Visualizzazione
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

metriche = ['MAE', 'RMSE', 'MAPE', 'R¬≤']
titoli = ['üìä MAE (pi√π basso = meglio)', 'üìä RMSE (pi√π basso = meglio)', 
          'üìä MAPE % (pi√π basso = meglio)', 'üìä R¬≤ (pi√π alto = meglio)']
colori = ['#3498db', '#e74c3c', '#27ae60']

for idx, (metrica, titolo) in enumerate(zip(metriche, titoli)):
    ax = axes[idx // 2, idx % 2]
    valori = df_risultati[metrica].values
    
    # Evidenzia il migliore
    if metrica == 'R¬≤':
        best_idx = np.argmax(valori)
    else:
        best_idx = np.argmin(valori)
    
    colors = ['green' if i == best_idx else colori[i] for i in range(len(valori))]
    
    bars = ax.bar(df_risultati['Modello'], valori, color=colors, edgecolor='black')
    ax.set_ylabel(metrica, fontsize=12)
    ax.set_title(titolo, fontsize=14)
    ax.grid(True, alpha=0.3, axis='y')
    
    # Etichette
    for bar, val in zip(bars, valori):
        formato = f'{val:.2f}' if metrica in ['MAPE', 'R¬≤'] else f'{val:,.0f}'
        ax.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.02 * max(valori),
                formato, ha='center', fontsize=10, fontweight='bold')

plt.tight_layout()
plt.show()

# 4. Analisi vincitori
print("\n" + "=" * 60)
print("üèÜ ANALISI VINCITORI")
print("=" * 60)

vincitori = {
    'MAE': df_risultati.loc[df_risultati['MAE'].idxmin(), 'Modello'],
    'RMSE': df_risultati.loc[df_risultati['RMSE'].idxmin(), 'Modello'],
    'MAPE': df_risultati.loc[df_risultati['MAPE'].idxmin(), 'Modello'],
    'R¬≤': df_risultati.loc[df_risultati['R¬≤'].idxmax(), 'Modello']
}

for metrica, vincitore in vincitori.items():
    print(f"   {metrica}: {vincitore}")

# Conta vittorie
from collections import Counter
conteggio = Counter(vincitori.values())
vincitore_assoluto = conteggio.most_common(1)[0]

print(f"\nüèÖ Vincitore assoluto: {vincitore_assoluto[0]} ({vincitore_assoluto[1]}/4 metriche)")

print("\nüí° Nota:")
print("   Random Forest spesso vince perch√© cattura relazioni non lineari.")
print("   Ma √® pi√π lento e meno interpretabile della regressione lineare.")

---

### Esercizio 18.3 ‚Äî Diagnosi Modello con Residui Problematici

**Obiettivo:** Identificare problemi in un modello attraverso l'analisi dei residui.

**Consegne:**
1. Crea un dataset con relazione NON lineare
2. Fitta un modello lineare (sbagliato!)
3. Analizza i residui e identifica il problema
4. Correggi il modello e confronta

In [None]:
# ============================================
# ESERCIZIO 18.3 ‚Äî SOLUZIONE COMPLETA
# Diagnosi con Analisi Residui
# ============================================

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline
from sklearn.metrics import mean_squared_error, r2_score
import warnings
warnings.filterwarnings('ignore')

np.random.seed(42)

print("=" * 60)
print("ESERCIZIO 18.3 ‚Äî Diagnosi con Analisi Residui")
print("=" * 60)

# 1. Creiamo dati con relazione QUADRATICA
X = np.linspace(0, 10, 200).reshape(-1, 1)
y_true_curve = 5 + 2*X.flatten() + 0.5*X.flatten()**2  # Relazione quadratica!
y = y_true_curve + np.random.normal(0, 2, 200)

print("\nüìå Dataset: relazione QUADRATICA nascosta")
print("   y = 5 + 2x + 0.5x¬≤ + rumore")

# 2. Fittiamo un modello LINEARE (sbagliato!)
model_lineare = LinearRegression()
model_lineare.fit(X, y)
y_pred_lin = model_lineare.predict(X)
residui_lin = y - y_pred_lin

r2_lin = r2_score(y, y_pred_lin)
rmse_lin = np.sqrt(mean_squared_error(y, y_pred_lin))

print(f"\nüìä Modello Lineare:")
print(f"   R¬≤ = {r2_lin:.4f}")
print(f"   RMSE = {rmse_lin:.4f}")

# 3. Visualizzazione problema
fig, axes = plt.subplots(2, 3, figsize=(15, 8))

# Fit lineare
ax1 = axes[0, 0]
ax1.scatter(X, y, alpha=0.5, s=20, label='Dati')
ax1.plot(X, y_pred_lin, 'r-', linewidth=2, label='Lineare')
ax1.set_xlabel('X')
ax1.set_ylabel('y')
ax1.set_title('‚ùå Modello Lineare (sbagliato!)', fontsize=12)
ax1.legend()
ax1.grid(True, alpha=0.3)

# Residui vs X
ax2 = axes[0, 1]
ax2.scatter(X, residui_lin, alpha=0.5, s=20, c='red')
ax2.axhline(y=0, color='black', linestyle='--')
ax2.set_xlabel('X')
ax2.set_ylabel('Residui')
ax2.set_title('‚ö†Ô∏è Residui: PATTERN A U!', fontsize=12)
ax2.grid(True, alpha=0.3)

# Residui vs Predetti
ax3 = axes[0, 2]
ax3.scatter(y_pred_lin, residui_lin, alpha=0.5, s=20, c='red')
ax3.axhline(y=0, color='black', linestyle='--')
ax3.set_xlabel('Predetti')
ax3.set_ylabel('Residui')
ax3.set_title('‚ö†Ô∏è Non casuali = problema!', fontsize=12)
ax3.grid(True, alpha=0.3)

# 4. Correggiamo: modello POLINOMIALE
model_poly = Pipeline([
    ('poly', PolynomialFeatures(degree=2)),
    ('linear', LinearRegression())
])
model_poly.fit(X, y)
y_pred_poly = model_poly.predict(X)
residui_poly = y - y_pred_poly

r2_poly = r2_score(y, y_pred_poly)
rmse_poly = np.sqrt(mean_squared_error(y, y_pred_poly))

print(f"\nüìä Modello Polinomiale (grado 2):")
print(f"   R¬≤ = {r2_poly:.4f}")
print(f"   RMSE = {rmse_poly:.4f}")

# Fit polinomiale
ax4 = axes[1, 0]
ax4.scatter(X, y, alpha=0.5, s=20, label='Dati')
ax4.plot(X, y_pred_poly, 'g-', linewidth=2, label='Polinomiale')
ax4.set_xlabel('X')
ax4.set_ylabel('y')
ax4.set_title('‚úÖ Modello Polinomiale (corretto!)', fontsize=12)
ax4.legend()
ax4.grid(True, alpha=0.3)

# Residui corretti vs X
ax5 = axes[1, 1]
ax5.scatter(X, residui_poly, alpha=0.5, s=20, c='green')
ax5.axhline(y=0, color='black', linestyle='--')
ax5.set_xlabel('X')
ax5.set_ylabel('Residui')
ax5.set_title('‚úÖ Residui: casuali!', fontsize=12)
ax5.grid(True, alpha=0.3)

# Confronto metriche
ax6 = axes[1, 2]
modelli = ['Lineare', 'Polinomiale']
r2_vals = [r2_lin, r2_poly]
colors = ['red', 'green']

bars = ax6.bar(modelli, r2_vals, color=colors, edgecolor='black')
ax6.set_ylabel('R¬≤')
ax6.set_title('üìä Confronto R¬≤', fontsize=12)
ax6.set_ylim(0, 1)

for bar, val in zip(bars, r2_vals):
    ax6.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.02,
             f'{val:.3f}', ha='center', fontsize=12, fontweight='bold')

plt.tight_layout()
plt.show()

# 5. Conclusione
print("\n" + "=" * 60)
print("üìã DIAGNOSI COMPLETATA")
print("=" * 60)
print(f"""
‚ùå PROBLEMA IDENTIFICATO:
   I residui del modello lineare mostravano un pattern a U.
   Questo indica una relazione NON LINEARE nei dati.

‚úÖ SOLUZIONE:
   Usando un modello polinomiale (grado 2), i residui diventano
   casuali e il R¬≤ passa da {r2_lin:.3f} a {r2_poly:.3f}.

üí° LEZIONE:
   SEMPRE analizzare i residui! Le metriche da sole non bastano.
   Un R¬≤ discreto ({r2_lin:.2f}) pu√≤ nascondere un modello sbagliato.
""")

---

## üìå Conclusione e Bignami

### ‚úÖ Cosa Abbiamo Imparato

1. **MAE** ‚Äî errore medio assoluto, robusto agli outlier
2. **RMSE** ‚Äî penalizza errori grandi, stessa unit√† di y
3. **MAPE** ‚Äî errore percentuale, perfetto per il business
4. **R¬≤** ‚Äî varianza spiegata, occhio all'interpretazione!
5. **Residui** ‚Äî SEMPRE analizzarli per diagnosticare il modello

---

## üìã BIGNAMI ‚Äî Metriche di Regressione

| Metrica | Formula | Unit√† | Outlier | Uso |
|---------|---------|-------|---------|-----|
| **MAE** | Œ£\|y-≈∑\|/n | Come y | Robusto | Errore tipico |
| **MSE** | Œ£(y-≈∑)¬≤/n | y¬≤ | Sensibile | Ottimizzazione |
| **RMSE** | ‚àöMSE | Come y | Sensibile | Errore penalizzato |
| **MAPE** | Œ£\|y-≈∑\|/y/n | % | Moderato | Report business |
| **R¬≤** | 1-SS_res/SS_tot | [-‚àû,1] | Moderato | Bont√† modello |

---

### üéØ Checklist Valutazione Modello

```
‚ñ° Calcola MAE, RMSE, R¬≤ (minimo)
‚ñ° Se per business ‚Üí aggiungi MAPE
‚ñ° Plotta predetti vs reali (deve essere diagonale)
‚ñ° Plotta residui vs predetti (deve essere casuale!)
‚ñ° Controlla normalit√† residui (Q-Q plot)
‚ñ° Confronta con baseline (media, modello semplice)
```

---

### üîß Codice Rapido di Riferimento

```python
from sklearn.metrics import (
    mean_absolute_error, 
    mean_squared_error, 
    mean_absolute_percentage_error,
    r2_score
)

# Tutte le metriche in un colpo
mae = mean_absolute_error(y_true, y_pred)
rmse = np.sqrt(mean_squared_error(y_true, y_pred))
mape = mean_absolute_percentage_error(y_true, y_pred) * 100
r2 = r2_score(y_true, y_pred)

# Adjusted R¬≤
n, p = len(y), X.shape[1]
r2_adj = 1 - (1 - r2) * (n - 1) / (n - p - 1)

# Residui
residui = y_true - y_pred
```

---

### ‚ö†Ô∏è Errori Comuni da Evitare

| ‚ùå Errore | ‚úÖ Soluzione |
|-----------|-------------|
| Guardare solo R¬≤ | Analizza anche residui |
| Ignorare MAPE | Usalo per comunicare |
| Non plottare residui | Pattern = modello sbagliato |
| R¬≤ alto = modello perfetto | Pu√≤ essere overfitting! |
| Usare MSE per interpretare | Usa RMSE o MAE |

---

### üöÄ Prossimi Passi
Nella **Lezione 19** vedremo il **Clustering: K-Means e DBSCAN** ‚Äî algoritmi non supervisionati per scoprire gruppi nei dati!