# Lezione 29 — Fondamenti di Artificial Intelligence

---

## Obiettivi di Apprendimento

| Obiettivo | Descrizione |
|-----------|-------------|
| Comprendere | La distinzione tra AI, Machine Learning e Deep Learning |
| Formalizzare | Il concetto di modello come funzione f(x) |
| Distinguere | Training e Inference come fasi operative distinte |
| Conoscere | Il No Free Lunch Theorem e le sue implicazioni pratiche |
| Applicare | Il Rasoio di Occam nella scelta dei modelli |
| Confrontare | Sistemi rule-based e sistemi data-driven |

---

## Perché Questa Lezione è Importante

Questa lezione segna l'ingresso nel blocco dedicato all'**Artificial Intelligence**.

Fino ad ora abbiamo studiato tecniche di Machine Learning supervisionato e non supervisionato, trattandole come strumenti operativi. Ora è necessario collocare queste tecniche in un quadro teorico più ampio, comprendendo:

1. **Cosa significa realmente "intelligenza artificiale"**
2. **Quali sono i limiti teorici di ogni approccio**
3. **Come scegliere lo strumento giusto per il problema giusto**

Un Data Analyst deve possedere una visione chiara di questi concetti per:
- Comunicare correttamente con stakeholder tecnici e non tecnici
- Evitare scelte tecnologiche inappropriate
- Riconoscere i limiti intrinseci di ogni soluzione

---

## Posizione nel Percorso

```
BLOCCO 1: Fondamenti (Lezioni 1-18)
    └── Python, NumPy, Pandas, Visualizzazione, Statistica

BLOCCO 2: Machine Learning Supervisionato (già completato)
    └── Regressione, Classificazione, Valutazione, Tuning

BLOCCO 3: Machine Learning Non Supervisionato (Lezioni 19-28)
    └── Clustering, PCA, Anomaly Detection, Feature Engineering

BLOCCO 4: Artificial Intelligence & NLP (Lezioni 29-40) ← SIAMO QUI
    └── Fondamenti AI, NLP, Knowledge Mining, Generative AI
```

---

# Sezione 1: Teoria Concettuale

## 1.1 Che Cos'è l'Intelligenza Artificiale?

### Definizione Operativa

L'**Artificial Intelligence (AI)** è un campo dell'informatica che studia la progettazione di sistemi in grado di eseguire compiti che, se eseguiti da un essere umano, richiederebbero intelligenza.

Questa definizione è volutamente ampia e include:
- Sistemi che giocano a scacchi
- Sistemi che riconoscono volti
- Sistemi che traducono testi
- Sistemi che guidano automobili

### Precisazione Terminologica

Il termine "intelligenza" in questo contesto **non** implica:
- Coscienza
- Comprensione semantica
- Intenzionalità

Implica invece:
- Capacità di risolvere problemi specifici
- Capacità di generalizzare da esempi
- Capacità di adattarsi a input nuovi

### Breve Storia

| Periodo | Paradigma Dominante | Caratteristica |
|---------|---------------------|----------------|
| 1950-1970 | AI Simbolica | Regole esplicite, logica formale |
| 1980-1990 | Sistemi Esperti | Knowledge base + inference engine |
| 1990-2010 | Machine Learning Statistico | Apprendimento da dati |
| 2010-oggi | Deep Learning | Reti neurali profonde, big data |

Questa evoluzione non è lineare né sostitutiva: ogni paradigma ha ancora applicazioni valide.

---

## 1.2 AI vs Machine Learning vs Deep Learning

### La Gerarchia Concettuale

Questi tre termini sono spesso usati in modo intercambiabile, ma rappresentano concetti distinti con una relazione gerarchica precisa.

```
┌─────────────────────────────────────────────────────────────────┐
│                    ARTIFICIAL INTELLIGENCE                       │
│    Qualsiasi sistema che esibisce comportamento "intelligente"  │
│                                                                  │
│    ┌─────────────────────────────────────────────────────────┐  │
│    │                  MACHINE LEARNING                        │  │
│    │    Sistemi che apprendono da dati senza essere          │  │
│    │    esplicitamente programmati per ogni caso             │  │
│    │                                                          │  │
│    │    ┌─────────────────────────────────────────────────┐  │  │
│    │    │               DEEP LEARNING                      │  │  │
│    │    │    ML basato su reti neurali con molti layer    │  │  │
│    │    │    (rappresentazione gerarchica delle feature)   │  │  │
│    │    └─────────────────────────────────────────────────┘  │  │
│    └─────────────────────────────────────────────────────────┘  │
└─────────────────────────────────────────────────────────────────┘
```

### Definizioni Formali

**Artificial Intelligence (AI)**
> Campo che studia la creazione di agenti razionali, dove un agente è un'entità che percepisce il suo ambiente e agisce per massimizzare le probabilità di successo rispetto a un obiettivo.

**Machine Learning (ML)**
> Sottocampo dell'AI in cui i sistemi migliorano automaticamente le loro prestazioni attraverso l'esperienza (dati), senza essere esplicitamente programmati per ogni caso specifico.

**Deep Learning (DL)**
> Sottocampo del ML che utilizza reti neurali artificiali con molteplici strati nascosti (deep = profondo) per apprendere rappresentazioni gerarchiche dei dati.

### Confronto Operativo

| Aspetto | AI (generale) | Machine Learning | Deep Learning |
|---------|---------------|------------------|---------------|
| **Approccio** | Può essere rule-based o data-driven | Sempre data-driven | Data-driven con architetture neurali |
| **Dati richiesti** | Variabile | Medio-alti | Molto alti |
| **Interpretabilità** | Alta (se rule-based) | Media | Bassa |
| **Feature engineering** | Manuale | Parzialmente automatico | Automatico |
| **Risorse computazionali** | Variabile | Medie | Alte |

### Esempio Concreto

**Problema**: Riconoscere se un'email è spam.

| Approccio | Implementazione |
|-----------|-----------------|
| **AI rule-based** | IF contiene "viagra" OR contiene "lottery" THEN spam |
| **Machine Learning** | Naive Bayes su bag-of-words delle email |
| **Deep Learning** | Rete neurale ricorrente sull'intera sequenza di token |

Nessuno di questi approcci è intrinsecamente superiore: la scelta dipende dal contesto.

---

## 1.3 Il Modello come Funzione f(x)

### Astrazione Fondamentale

Qualsiasi sistema di AI/ML può essere astratto come una **funzione matematica**:

$$\hat{y} = f(x)$$

Dove:
- **x** = input (dati in ingresso)
- **f** = modello (la trasformazione appresa o programmata)
- **ŷ** = output (predizione, decisione, o azione)

### Esempi di Mapping Input → Output

| Dominio | Input (x) | Output (ŷ) | Tipo di f |
|---------|-----------|------------|-----------|
| Classificazione spam | Testo email | {spam, non_spam} | Classificatore binario |
| Regressione prezzi | Caratteristiche casa | Prezzo € | Regressore |
| Clustering clienti | Comportamento acquisto | ID cluster | Clustering |
| OCR | Immagine documento | Stringa di testo | Sequence-to-sequence |
| Chatbot | Domanda utente | Risposta testuale | Language model |

### La Differenza Chiave: Come si Ottiene f

**Programmazione Tradizionale**:
```
DATI + REGOLE → Programma → OUTPUT
```
Il programmatore scrive esplicitamente le regole che trasformano l'input in output.

**Machine Learning**:
```
DATI + OUTPUT DESIDERATO → Algoritmo di apprendimento → MODELLO (f)
```
L'algoritmo **induce** le regole (il modello f) a partire da esempi di coppie input-output.

### Formalizzazione

Nel Machine Learning supervisionato, dato un dataset di training:

$$D = \{(x_1, y_1), (x_2, y_2), ..., (x_n, y_n)\}$$

L'obiettivo è trovare una funzione $f^*$ che minimizza una **loss function** $L$:

$$f^* = \arg\min_f \sum_{i=1}^{n} L(f(x_i), y_i)$$

In termini pratici: trovare la f che commette meno errori possibile sui dati di training, sperando che generalizzi bene su dati mai visti.

### Implicazione Pratica

Come data analyst, quando usi un modello di ML stai essenzialmente:
1. **Scegliendo** una famiglia di funzioni possibili (es. alberi, regressione lineare, reti neurali)
2. **Addestrando** l'algoritmo per trovare la f migliore in quella famiglia
3. **Applicando** quella f a nuovi dati per ottenere predizioni

---

## 1.4 Training vs Inference

### Due Fasi Distinte

Ogni sistema di Machine Learning opera in due fasi fondamentalmente diverse:

```
┌─────────────────────────────────────────────────────────────────┐
│                         TRAINING                                 │
│   "Insegnare al modello usando dati storici"                    │
│                                                                  │
│   Input: Dataset etichettato (X_train, y_train)                 │
│   Processo: Ottimizzazione iterativa dei parametri              │
│   Output: Modello addestrato (f con parametri θ fissati)        │
│   Frequenza: Una volta (o periodicamente per retraining)        │
│   Risorse: Alte (CPU/GPU, memoria, tempo)                       │
└─────────────────────────────────────────────────────────────────┘
                              │
                              ▼
┌─────────────────────────────────────────────────────────────────┐
│                        INFERENCE                                 │
│   "Usare il modello addestrato per fare predizioni"            │
│                                                                  │
│   Input: Nuovo dato (x_new) mai visto                           │
│   Processo: Applicazione diretta di f(x_new)                    │
│   Output: Predizione ŷ                                          │
│   Frequenza: Continua (ogni volta che serve una predizione)     │
│   Risorse: Relativamente basse                                  │
└─────────────────────────────────────────────────────────────────┘
```

### Analogia Concettuale

| Fase | Analogia Umana | Cosa Succede |
|------|----------------|--------------|
| **Training** | Studiare per un esame | Il modello "impara" dai dati, aggiustando i suoi parametri interni |
| **Inference** | Sostenere l'esame | Il modello applica ciò che ha imparato a nuove situazioni |

### Caratteristiche a Confronto

| Aspetto | Training | Inference |
|---------|----------|-----------|
| **Obiettivo** | Minimizzare errore sui dati di training | Produrre output per nuovi input |
| **Dati richiesti** | Dataset completo con labels | Singolo dato (o batch) |
| **Modifica modello** | Sì (parametri si aggiornano) | No (modello "congelato") |
| **Tempo di esecuzione** | Ore o giorni | Millisecondi o secondi |
| **Hardware tipico** | GPU cluster, server potenti | CPU standard, dispositivi edge |
| **Errori** | Accettabili (fa parte dell'apprendimento) | Da minimizzare (impatto su utenti) |

### Flusso Operativo Reale

```
1. TRAINING (offline)
   ├── Raccolta dati storici
   ├── Preprocessing e pulizia
   ├── Split train/validation/test
   ├── Addestramento modello
   ├── Validazione e tuning
   ├── Test finale
   └── Salvataggio modello (.pkl, .joblib, .h5, ecc.)

2. DEPLOYMENT (una tantum)
   └── Caricamento modello in ambiente di produzione

3. INFERENCE (online, continua)
   ├── Ricezione nuovo dato
   ├── Preprocessing identico al training
   ├── model.predict(x_new)
   └── Restituzione risultato
```

### Implicazione per Data Analyst

La maggior parte del lavoro di un data analyst riguarda la fase di **training** e **validazione**. L'inference è spesso gestita da sistemi automatizzati o da team di ML engineering.

---

## 1.5 Il Teorema "No Free Lunch"

### Enunciato Informale

> Non esiste un algoritmo di Machine Learning universalmente superiore a tutti gli altri su tutti i possibili problemi.

In altre parole: **ogni algoritmo ha i suoi punti di forza e debolezza**, e la scelta dipende dal problema specifico.

### Enunciato Formale (Wolpert & Macready, 1997)

Per qualsiasi coppia di algoritmi di ottimizzazione A e B:

$$\sum_f P(d_m^y | f, m, A) = \sum_f P(d_m^y | f, m, B)$$

Dove la somma è su tutte le possibili funzioni obiettivo f. 

**Traduzione**: mediando su tutti i possibili problemi, ogni algoritmo ha le stesse prestazioni. Se un algoritmo eccelle su alcuni problemi, necessariamente performa peggio su altri.

### Implicazioni Pratiche

| Conseguenza | Cosa Significa in Pratica |
|-------------|---------------------------|
| **Non esiste il "migliore" in assoluto** | Random Forest non è sempre meglio di Logistic Regression |
| **Il contesto è tutto** | La struttura dei dati determina quale algoritmo funzionerà meglio |
| **Sperimentazione necessaria** | Bisogna provare più algoritmi e confrontarli sul proprio dataset |
| **Prior knowledge è valore** | La conoscenza del dominio aiuta a scegliere algoritmi appropriati |

### Esempio Concreto

**Dataset A**: 10.000 campioni, 5 feature, relazione lineare tra input e output.
- Migliore: Regressione Lineare (semplice, appropriata)
- Peggiore: Rete neurale profonda (overfitting garantito)

**Dataset B**: 1.000.000 immagini, pattern complessi non lineari.
- Migliore: Rete neurale convoluzionale (CNN)
- Peggiore: Regressione Lineare (troppo semplice)

### Anti-Pattern Comune

```
❌ "Uso sempre XGBoost perché è il migliore"
❌ "Le reti neurali risolvono tutto"
❌ "La regressione logistica è obsoleta"

✓ "Scelgo l'algoritmo basandomi sulle caratteristiche del problema"
✓ "Provo più approcci e confronto le prestazioni"
✓ "Considero anche interpretabilità e costi computazionali"
```

### Corollario per Data Analyst

Il No Free Lunch Theorem giustifica l'approccio empirico del Machine Learning: non puoi sapere a priori quale algoritmo funzionerà meglio, quindi devi **sperimentare e validare**.

---

## 1.6 Il Rasoio di Occam nel Machine Learning

### Principio Filosofico Originale

> "Entia non sunt multiplicanda praeter necessitatem"
> (Le entità non devono essere moltiplicate oltre il necessario)

**Traduzione moderna**: tra più spiegazioni equivalenti, preferisci la più semplice.

### Applicazione al Machine Learning

Nel contesto ML, il Rasoio di Occam si traduce in:

> A parità di prestazioni predittive, preferisci il modello più semplice.

### Perché la Semplicità è Preferibile

| Vantaggio | Spiegazione |
|-----------|-------------|
| **Generalizzazione** | Modelli semplici tendono a generalizzare meglio su dati nuovi |
| **Interpretabilità** | Più facile capire e spiegare il funzionamento |
| **Manutenibilità** | Più semplice da aggiornare e debuggare |
| **Efficienza** | Meno risorse computazionali richieste |
| **Robustezza** | Meno sensibile a rumore nei dati |

### Il Trade-off Bias-Varianza

Il Rasoio di Occam è strettamente legato al trade-off bias-varianza:

```
Modello troppo semplice (high bias)
    └── Underfitting: non cattura la struttura dei dati
    
Modello troppo complesso (high variance)
    └── Overfitting: memorizza il rumore invece del pattern
    
Modello "giusto" (Occam)
    └── Bilancia complessità e capacità predittiva
```

### Formalizzazione: Principio MDL

Il **Minimum Description Length** (MDL) formalizza matematicamente il Rasoio di Occam:

$$\text{Best Model} = \arg\min_M \big[ L(\text{Model}) + L(\text{Data | Model}) \big]$$

Dove:
- L(Model) = lunghezza della descrizione del modello (complessità)
- L(Data | Model) = lunghezza della descrizione dei residui (errore)

**Obiettivo**: minimizzare la somma di complessità ed errore.

### Esempi Pratici

**Scenario**: Regressione con R² = 0.85

| Modello | Complessità | Scelta |
|---------|-------------|--------|
| Regressione lineare (3 parametri) | Bassa | ✓ **Preferito** |
| Random Forest (1000 alberi) | Alta | Solo se significativamente migliore |
| Rete neurale (10 layer) | Molto alta | Giustificato solo per guadagni sostanziali |

### Implementazione in scikit-learn

La regolarizzazione è l'implementazione pratica del Rasoio di Occam:

- **L1 (Lasso)**: penalizza la somma dei valori assoluti dei coefficienti → sparsità
- **L2 (Ridge)**: penalizza la somma dei quadrati dei coefficienti → coefficienti piccoli
- **ElasticNet**: combinazione di L1 e L2

```python
# Esempio concettuale
from sklearn.linear_model import Ridge

# alpha controlla quanto "punire" la complessità
model = Ridge(alpha=1.0)  # alpha più alto = modello più semplice
```

---

## 1.7 Sistemi Rule-Based vs Data-Driven

### Due Paradigmi Fondamentali

Nel campo dell'AI esistono due approcci radicalmente diversi per costruire sistemi intelligenti:

```
┌─────────────────────────────────────┐    ┌─────────────────────────────────────┐
│          RULE-BASED                  │    │           DATA-DRIVEN               │
│    (Sistemi Esperti, Simbolico)     │    │      (Machine Learning)             │
│                                      │    │                                      │
│   Conoscenza → Regole Esplicite     │    │   Dati → Regole Implicite           │
│   Esperto umano codifica le regole  │    │   Algoritmo estrae le regole        │
│   "Programmazione tradizionale"     │    │   "Apprendimento automatico"        │
└─────────────────────────────────────┘    └─────────────────────────────────────┘
```

### Confronto Dettagliato

| Aspetto | Rule-Based | Data-Driven |
|---------|------------|-------------|
| **Fonte della logica** | Esperto di dominio | Dati storici |
| **Rappresentazione** | IF-THEN-ELSE esplicite | Parametri numerici (pesi, split) |
| **Interpretabilità** | Alta (regole leggibili) | Variabile (da alta a nulla) |
| **Scalabilità** | Limitata (esplosione combinatoria) | Alta (più dati = più accuratezza) |
| **Adattamento** | Manuale (riscrivere regole) | Automatico (retraining) |
| **Costi iniziali** | Alti (elicitazione conoscenza) | Medi (raccolta dati) |
| **Manutenzione** | Onerosa | Relativamente semplice |
| **Copertura eccezioni** | Esplicita per ogni caso | Implicita (se nei dati) |

### Esempio: Sistema di Approvazione Prestiti

**Approccio Rule-Based**:
```
IF reddito > 50000 AND
   anni_impiego > 2 AND
   debiti_esistenti < 0.3 * reddito AND
   score_creditizio > 700
THEN approva_prestito
ELSE rifiuta_prestito
```

**Approccio Data-Driven**:
```python
# Addestrato su storico di prestiti approvati/rifiutati
model = RandomForestClassifier()
model.fit(X_storico, y_esito)
decisione = model.predict(X_nuovo_cliente)
```

### Quando Usare Quale

| Scenario | Approccio Consigliato | Motivazione |
|----------|----------------------|-------------|
| Regole note e stabili | Rule-Based | Trasparenza, conformità normativa |
| Regole sconosciute | Data-Driven | Scoperta automatica di pattern |
| Pochi dati disponibili | Rule-Based | ML richiede dati sufficienti |
| Molti dati, pattern complessi | Data-Driven | ML eccelle in questi scenari |
| Requisiti di spiegabilità legale | Rule-Based (o ML interpretabile) | Audit trail chiaro |
| Dominio in rapida evoluzione | Data-Driven | Adattamento tramite retraining |

### Approcci Ibridi

Nella pratica moderna, i due paradigmi spesso coesistono:

1. **Pre-processing rule-based + ML core**: Regole per pulizia dati, ML per predizione
2. **ML + post-processing rule-based**: ML propone, regole di business validano
3. **Neuro-symbolic AI**: Integrazione di ragionamento simbolico e reti neurali

### Evoluzione Storica

```
1950-1980: Dominanza AI Simbolica (rule-based)
    └── Sistemi esperti, Prolog, LISP

1990-2010: Ascesa del Machine Learning statistico
    └── SVM, Random Forest, Boosting

2010-oggi: Era del Deep Learning
    └── Reti neurali profonde, transformer

Futuro: Convergenza neuro-simbolica
    └── Combinazione dei punti di forza di entrambi
```

---

# 2. Schema Mentale

## Mappa Decisionale: Orientarsi nel Panorama AI/ML

```
                    ┌─────────────────────────────┐
                    │     HAI UN PROBLEMA DA      │
                    │        RISOLVERE?           │
                    └──────────────┬──────────────┘
                                   │
                    ┌──────────────▼──────────────┐
                    │   LE REGOLE SONO NOTE       │
                    │   E BEN DEFINITE?           │
                    └──────────────┬──────────────┘
                                   │
              ┌────────────────────┴────────────────────┐
              │ SÌ                                      │ NO
              ▼                                         ▼
    ┌─────────────────────┐               ┌─────────────────────┐
    │   RULE-BASED SYSTEM │               │   HAI DATI STORICI  │
    │   (Programmazione   │               │   SUFFICIENTI?      │
    │    tradizionale)    │               └──────────┬──────────┘
    └─────────────────────┘                          │
                                    ┌────────────────┴────────────────┐
                                    │ SÌ                              │ NO
                                    ▼                                 ▼
                        ┌─────────────────────┐         ┌─────────────────────┐
                        │   MACHINE LEARNING  │         │   RACCOGLI DATI     │
                        │                     │         │   O USA RULE-BASED  │
                        └──────────┬──────────┘         └─────────────────────┘
                                   │
                    ┌──────────────▼──────────────┐
                    │   I PATTERN SONO COMPLESSI  │
                    │   (immagini, testo, audio)? │
                    └──────────────┬──────────────┘
                                   │
              ┌────────────────────┴────────────────────┐
              │ SÌ                                      │ NO
              ▼                                         ▼
    ┌─────────────────────┐               ┌─────────────────────┐
    │   DEEP LEARNING     │               │   ML TRADIZIONALE   │
    │   (Reti neurali     │               │   (Random Forest,   │
    │    profonde)        │               │    SVM, XGBoost)    │
    └─────────────────────┘               └─────────────────────┘
```

## Checklist: Scegliere l'Approccio

| Domanda | Se SÌ → | Se NO → |
|---------|---------|---------|
| Le regole sono note e stabili? | Rule-based | Considera ML |
| Hai almeno 1000+ esempi? | ML fattibile | Servono più dati |
| Servono audit trail chiari? | Modelli interpretabili | Puoi usare black-box |
| I dati sono strutturati (tabelle)? | ML tradizionale | Deep Learning |
| Hai GPU disponibili? | Deep Learning possibile | Stick con ML tradizionale |

## Principi Guida

1. **No Free Lunch**: Non esiste l'algoritmo perfetto universale
2. **Rasoio di Occam**: A parità di prestazioni, scegli il modello più semplice
3. **Sperimenta**: Prova più approcci e valida empiricamente
4. **Contesto**: La conoscenza del dominio guida le scelte

---

# 3. Notebook Dimostrativo

## Dimostrazione: Rule-Based vs Data-Driven nella Pratica

In questa sezione confrontiamo i due paradigmi su un problema concreto: classificare se un cliente è ad alto rischio di abbandono (churn).

In [None]:
# ============================================================
# SETUP: Importazione librerie e configurazione ambiente
# ============================================================

import numpy as np                    # Operazioni numeriche
import pandas as pd                   # Manipolazione dati
from sklearn.datasets import make_classification  # Dataset sintetico
from sklearn.model_selection import train_test_split  # Split dati
from sklearn.tree import DecisionTreeClassifier  # Modello interpretabile
from sklearn.ensemble import RandomForestClassifier  # Modello ensemble
from sklearn.linear_model import LogisticRegression  # Modello lineare
from sklearn.metrics import accuracy_score, classification_report  # Metriche
import warnings
warnings.filterwarnings('ignore')     # Soppressione warning per leggibilità

# Seed per riproducibilità
np.random.seed(42)

print("Librerie importate correttamente")

In [None]:
# ============================================================
# CREAZIONE DATASET SIMULATO: Clienti con rischio churn
# ============================================================

# Generiamo un dataset realistico con feature interpretabili
n_samples = 1000

# Creiamo feature con significato business
data = pd.DataFrame({
    # Anzianità cliente (mesi)
    'tenure_months': np.random.randint(1, 72, n_samples),
    
    # Numero di reclami negli ultimi 6 mesi
    'complaints_6m': np.random.poisson(1.5, n_samples),
    
    # Spesa mensile media (euro)
    'monthly_spend': np.random.normal(50, 20, n_samples).clip(10, 150),
    
    # Numero di prodotti attivi
    'n_products': np.random.randint(1, 5, n_samples),
    
    # Giorni dall'ultimo utilizzo
    'days_since_last_use': np.random.exponential(15, n_samples).astype(int).clip(0, 90),
    
    # Punteggio soddisfazione (1-10)
    'satisfaction_score': np.random.randint(1, 11, n_samples)
})

# Creiamo la variabile target (churn) con logica realistica
# Churn più probabile se: bassa tenure, molti reclami, bassa soddisfazione, inattivo
churn_prob = (
    0.3 * (data['tenure_months'] < 12).astype(int) +      # Clienti nuovi
    0.25 * (data['complaints_6m'] >= 2).astype(int) +     # Molti reclami
    0.25 * (data['satisfaction_score'] <= 4).astype(int) + # Insoddisfatti
    0.2 * (data['days_since_last_use'] > 30).astype(int)   # Inattivi
)

# Aggiungiamo rumore e convertiamo in binario
churn_prob = churn_prob + np.random.normal(0, 0.1, n_samples)
data['churn'] = (churn_prob > 0.4).astype(int)

print(f"Dataset creato: {data.shape[0]} clienti, {data.shape[1]} colonne")
print(f"\nDistribuzione churn:")
print(data['churn'].value_counts(normalize=True).round(3))
print(f"\nPrime 5 righe:")
data.head()

In [None]:
# ============================================================
# APPROCCIO 1: SISTEMA RULE-BASED
# ============================================================
# Simuliamo un esperto di dominio che definisce regole esplicite
# basate sulla sua esperienza nel business

def rule_based_churn_predictor(row):
    """
    Sistema esperto per predizione churn basato su regole di business.
    
    Regole definite da un esperto di dominio:
    1. Cliente nuovo (< 12 mesi) con reclami → alto rischio
    2. Cliente con molti reclami (≥ 3) → alto rischio  
    3. Cliente insoddisfatto (score ≤ 3) e inattivo (> 30 gg) → alto rischio
    4. Cliente con un solo prodotto e bassa soddisfazione → alto rischio
    
    Returns:
        1 se alto rischio churn, 0 altrimenti
    """
    
    # Regola 1: Cliente nuovo con problemi
    if row['tenure_months'] < 12 and row['complaints_6m'] >= 1:
        return 1
    
    # Regola 2: Troppi reclami (segnale forte)
    if row['complaints_6m'] >= 3:
        return 1
    
    # Regola 3: Insoddisfatto e inattivo
    if row['satisfaction_score'] <= 3 and row['days_since_last_use'] > 30:
        return 1
    
    # Regola 4: Poco engagement + bassa soddisfazione
    if row['n_products'] == 1 and row['satisfaction_score'] <= 4:
        return 1
    
    # Default: non a rischio
    return 0

# Applichiamo le regole a tutti i clienti
data['pred_rule_based'] = data.apply(rule_based_churn_predictor, axis=1)

# Valutiamo le prestazioni
accuracy_rb = accuracy_score(data['churn'], data['pred_rule_based'])
print("=" * 60)
print("SISTEMA RULE-BASED")
print("=" * 60)
print(f"\nAccuracy: {accuracy_rb:.3f}")
print(f"\nClassification Report:")
print(classification_report(data['churn'], data['pred_rule_based']))

In [None]:
# ============================================================
# APPROCCIO 2: SISTEMA DATA-DRIVEN (Machine Learning)
# ============================================================
# Il modello apprende le "regole" automaticamente dai dati

# Preparazione dati
feature_cols = ['tenure_months', 'complaints_6m', 'monthly_spend', 
                'n_products', 'days_since_last_use', 'satisfaction_score']
X = data[feature_cols]
y = data['churn']

# Split train/test (80/20)
X_train, X_test, y_train, y_test = train_test_split(
    X, y, 
    test_size=0.2, 
    random_state=42,
    stratify=y  # Mantiene proporzione classi
)

print(f"Training set: {X_train.shape[0]} campioni")
print(f"Test set: {X_test.shape[0]} campioni")

# Addestriamo diversi modelli (No Free Lunch: proviamo più approcci)
models = {
    'Logistic Regression': LogisticRegression(random_state=42),
    'Decision Tree': DecisionTreeClassifier(max_depth=5, random_state=42),
    'Random Forest': RandomForestClassifier(n_estimators=100, max_depth=5, random_state=42)
}

print("\n" + "=" * 60)
print("SISTEMI DATA-DRIVEN (Machine Learning)")
print("=" * 60)

results = {}
for name, model in models.items():
    # Training (fase di apprendimento)
    model.fit(X_train, y_train)
    
    # Inference (fase di predizione)
    y_pred = model.predict(X_test)
    
    # Valutazione
    accuracy = accuracy_score(y_test, y_pred)
    results[name] = accuracy
    
    print(f"\n{name}:")
    print(f"  Accuracy: {accuracy:.3f}")

In [None]:
# ============================================================
# CONFRONTO: Rule-Based vs Data-Driven
# ============================================================

# Per confronto equo, valutiamo rule-based solo sul test set
X_test_with_pred = X_test.copy()
X_test_with_pred['pred_rule_based'] = X_test.apply(rule_based_churn_predictor, axis=1)
accuracy_rb_test = accuracy_score(y_test, X_test_with_pred['pred_rule_based'])

print("=" * 60)
print("CONFRONTO FINALE (sul test set)")
print("=" * 60)

# Tabella comparativa
comparison = pd.DataFrame({
    'Approccio': ['Rule-Based (Esperto)', 'Logistic Regression', 'Decision Tree', 'Random Forest'],
    'Accuracy': [accuracy_rb_test, results['Logistic Regression'], 
                 results['Decision Tree'], results['Random Forest']],
    'Interpretabilità': ['Alta', 'Media', 'Alta', 'Media'],
    'Richiede Dati': ['No', 'Sì', 'Sì', 'Sì'],
    'Adattamento': ['Manuale', 'Retraining', 'Retraining', 'Retraining']
})

print("\n")
print(comparison.to_string(index=False))

# Osservazioni
print("\n" + "=" * 60)
print("OSSERVAZIONI")
print("=" * 60)
print("""
1. Il sistema rule-based raggiunge accuracy ragionevole senza dati di training
2. I modelli ML possono superare le regole manuali se i dati catturano pattern
   che l'esperto non ha esplicitato
3. Decision Tree offre un buon compromesso: performance ML + interpretabilità
4. La scelta dipende dal contesto (No Free Lunch):
   - Servono audit trail? → Rule-based o Decision Tree
   - Hai molti dati? → Random Forest o altri ensemble
   - Il dominio cambia spesso? → ML con retraining periodico
""")

In [None]:
# ============================================================
# DIMOSTRAZIONE: IL MODELLO COME FUNZIONE f(x)
# ============================================================
# Visualizziamo concretamente che un modello è una funzione

# Prendiamo un singolo cliente dal test set
cliente_esempio = X_test.iloc[[0]]

print("=" * 60)
print("IL MODELLO COME FUNZIONE f(x)")
print("=" * 60)

print("\nINPUT x (caratteristiche del cliente):")
print("-" * 40)
for col in feature_cols:
    print(f"  {col}: {cliente_esempio[col].values[0]}")

print("\n" + "-" * 40)
print("APPLICAZIONE DI f(x) = ŷ")
print("-" * 40)

# Ogni modello è una funzione diversa
for name, model in models.items():
    # f(x) → ŷ
    prediction = model.predict(cliente_esempio)[0]
    probability = model.predict_proba(cliente_esempio)[0]
    
    print(f"\n{name}:")
    print(f"  f(x) = {prediction}  (0=No churn, 1=Churn)")
    print(f"  P(churn) = {probability[1]:.3f}")

# Valore reale
print(f"\nValore reale y: {y_test.iloc[0]}")

print("\n" + "=" * 60)
print("NOTA: Stesso input, funzioni diverse, output potenzialmente diversi")
print("Questo illustra il No Free Lunch: ogni modello 'vede' i dati diversamente")
print("=" * 60)

In [None]:
# ============================================================
# DIMOSTRAZIONE: RASOIO DI OCCAM - COMPLESSITÀ vs PRESTAZIONI
# ============================================================
# Confrontiamo modelli di complessità crescente

from sklearn.tree import DecisionTreeClassifier

print("=" * 60)
print("RASOIO DI OCCAM: COMPLESSITÀ vs PRESTAZIONI")
print("=" * 60)
print("\nDomanda: un modello più complesso è sempre migliore?")
print("-" * 60)

# Testiamo Decision Tree con profondità crescente
depths = [1, 2, 3, 5, 10, 20, None]  # None = nessun limite
results_occam = []

for depth in depths:
    # Creiamo modello con complessità controllata
    dt = DecisionTreeClassifier(max_depth=depth, random_state=42)
    dt.fit(X_train, y_train)
    
    # Accuracy su train e test
    acc_train = accuracy_score(y_train, dt.predict(X_train))
    acc_test = accuracy_score(y_test, dt.predict(X_test))
    
    # Numero di foglie (proxy per complessità)
    n_leaves = dt.get_n_leaves()
    
    depth_str = str(depth) if depth else "∞"
    results_occam.append({
        'Max Depth': depth_str,
        'N. Foglie': n_leaves,
        'Acc Train': acc_train,
        'Acc Test': acc_test,
        'Gap': acc_train - acc_test
    })

# Mostriamo risultati
df_occam = pd.DataFrame(results_occam)
print("\n")
print(df_occam.to_string(index=False))

print("\n" + "-" * 60)
print("INTERPRETAZIONE:")
print("-" * 60)
print("""
• Modelli troppo semplici (depth=1,2): underfitting, basse performance
• Modelli troppo complessi (depth=∞): overfitting, gap train-test alto
• Modello 'giusto' (depth~5): bilancia complessità e generalizzazione

→ Il Rasoio di Occam dice: scegli il modello più semplice che 
  raggiunge prestazioni accettabili sul test set.
""")

---

# 4. Esercizi Svolti

## Esercizio 1: Classificazione Concettuale

**Problema**: Per ciascuno dei seguenti scenari, indica se l'approccio è AI, ML, o DL, e se è rule-based o data-driven.

In [None]:
# ============================================================
# ESERCIZIO 1 - SOLUZIONE
# Classificazione concettuale di scenari AI
# ============================================================

# Definiamo gli scenari da classificare
scenari = [
    {
        'scenario': 'Un termostato che accende il riscaldamento se la temperatura scende sotto 18°C',
        'descrizione': 'Regola fissa: IF temp < 18 THEN accendi'
    },
    {
        'scenario': 'Un sistema che riconosce volti nelle foto usando milioni di immagini di training',
        'descrizione': 'Rete neurale convoluzionale addestrata su dataset di volti'
    },
    {
        'scenario': 'Un filtro spam che usa Naive Bayes addestrato su email etichettate',
        'descrizione': 'Classificatore probabilistico addestrato su dati storici'
    },
    {
        'scenario': 'Un chatbot che risponde a FAQ usando pattern matching (regex)',
        'descrizione': 'IF input matches "orario" THEN risposta = "Siamo aperti 9-18"'
    },
    {
        'scenario': 'GPT-4 che genera testo in risposta a prompt',
        'descrizione': 'Large Language Model con miliardi di parametri'
    }
]

# Classifichiamo ogni scenario
print("=" * 70)
print("ESERCIZIO 1: CLASSIFICAZIONE CONCETTUALE")
print("=" * 70)

soluzioni = []
for i, s in enumerate(scenari, 1):
    print(f"\n{'─' * 70}")
    print(f"SCENARIO {i}: {s['scenario']}")
    print(f"{'─' * 70}")
    print(f"Descrizione: {s['descrizione']}")

# Scenario 1: Termostato
print("\n" + "=" * 70)
print("SOLUZIONI")
print("=" * 70)

classificazioni = pd.DataFrame([
    {
        'Scenario': 'Termostato temperatura',
        'Categoria': 'AI (generale)',
        'Paradigma': 'Rule-Based',
        'Motivazione': 'Regola IF-THEN esplicita, nessun apprendimento'
    },
    {
        'Scenario': 'Riconoscimento volti',
        'Categoria': 'Deep Learning',
        'Paradigma': 'Data-Driven',
        'Motivazione': 'CNN addestrata su milioni di immagini, feature auto-apprese'
    },
    {
        'Scenario': 'Filtro spam Naive Bayes',
        'Categoria': 'Machine Learning',
        'Paradigma': 'Data-Driven',
        'Motivazione': 'Modello statistico addestrato su dati etichettati'
    },
    {
        'Scenario': 'Chatbot regex FAQ',
        'Categoria': 'AI (generale)',
        'Paradigma': 'Rule-Based',
        'Motivazione': 'Pattern matching esplicito, nessun apprendimento da dati'
    },
    {
        'Scenario': 'GPT-4 text generation',
        'Categoria': 'Deep Learning',
        'Paradigma': 'Data-Driven',
        'Motivazione': 'Transformer con miliardi di parametri, pre-training su testi'
    }
])

print("\n")
for _, row in classificazioni.iterrows():
    print(f"\n{row['Scenario']}:")
    print(f"  Categoria: {row['Categoria']}")
    print(f"  Paradigma: {row['Paradigma']}")
    print(f"  Motivazione: {row['Motivazione']}")

---

## Esercizio 2: Implementazione Rule-Based

**Problema**: Crea un sistema rule-based per decidere se approvare una richiesta di ferie in un'azienda.

Regole aziendali:
1. Non si possono approvare ferie in agosto se il dipendente ha meno di 2 anni di anzianità
2. Non si possono approvare più di 15 giorni consecutivi
3. Deve rimanere almeno il 50% del team in ufficio
4. Le ferie devono essere richieste con almeno 14 giorni di anticipo

In [None]:
# ============================================================
# ESERCIZIO 2 - SOLUZIONE
# Sistema rule-based per approvazione ferie
# ============================================================

from datetime import datetime, timedelta

def approva_ferie(richiesta: dict, stato_team: dict) -> dict:
    """
    Sistema esperto per approvazione richieste ferie.
    
    Parameters:
    -----------
    richiesta : dict
        Contiene: dipendente, data_inizio, data_fine, data_richiesta, 
                  anni_anzianita
    stato_team : dict
        Contiene: totale_membri, membri_in_ferie (nel periodo richiesto)
    
    Returns:
    --------
    dict con 'approvato' (bool) e 'motivo' (str)
    """
    
    # Estrazione dati dalla richiesta
    data_inizio = richiesta['data_inizio']
    data_fine = richiesta['data_fine']
    data_richiesta = richiesta['data_richiesta']
    anni_anzianita = richiesta['anni_anzianita']
    
    # Calcolo giorni di ferie richiesti
    giorni_richiesti = (data_fine - data_inizio).days + 1
    
    # Calcolo anticipo richiesta
    giorni_anticipo = (data_inizio - data_richiesta).days
    
    # Calcolo percentuale team presente
    membri_in_ferie_dopo = stato_team['membri_in_ferie'] + 1
    percentuale_presente = 1 - (membri_in_ferie_dopo / stato_team['totale_membri'])
    
    # ── REGOLA 1: Agosto richiede 2+ anni anzianità ──
    if data_inizio.month == 8 and anni_anzianita < 2:
        return {
            'approvato': False,
            'motivo': 'Ferie in agosto richiedono almeno 2 anni di anzianità'
        }
    
    # ── REGOLA 2: Massimo 15 giorni consecutivi ──
    if giorni_richiesti > 15:
        return {
            'approvato': False,
            'motivo': f'Richiesti {giorni_richiesti} giorni, massimo consentito: 15'
        }
    
    # ── REGOLA 3: Almeno 50% team presente ──
    if percentuale_presente < 0.5:
        return {
            'approvato': False,
            'motivo': f'Team sotto 50%: {percentuale_presente:.0%} presenti'
        }
    
    # ── REGOLA 4: Almeno 14 giorni di anticipo ──
    if giorni_anticipo < 14:
        return {
            'approvato': False,
            'motivo': f'Anticipo insufficiente: {giorni_anticipo} giorni (minimo 14)'
        }
    
    # ── TUTTE LE REGOLE SODDISFATTE ──
    return {
        'approvato': True,
        'motivo': 'Richiesta conforme a tutte le policy aziendali'
    }

# ── TEST DEL SISTEMA ──
print("=" * 70)
print("ESERCIZIO 2: SISTEMA RULE-BASED APPROVAZIONE FERIE")
print("=" * 70)

# Casi di test
casi_test = [
    {
        'nome': 'Mario Rossi - Ferie agosto, 1 anno anzianità',
        'richiesta': {
            'dipendente': 'Mario Rossi',
            'data_inizio': datetime(2024, 8, 1),
            'data_fine': datetime(2024, 8, 10),
            'data_richiesta': datetime(2024, 7, 1),
            'anni_anzianita': 1
        },
        'stato_team': {'totale_membri': 10, 'membri_in_ferie': 3}
    },
    {
        'nome': 'Anna Bianchi - 20 giorni consecutivi',
        'richiesta': {
            'dipendente': 'Anna Bianchi',
            'data_inizio': datetime(2024, 6, 1),
            'data_fine': datetime(2024, 6, 20),
            'data_richiesta': datetime(2024, 5, 1),
            'anni_anzianita': 5
        },
        'stato_team': {'totale_membri': 10, 'membri_in_ferie': 2}
    },
    {
        'nome': 'Luca Verdi - Richiesta valida',
        'richiesta': {
            'dipendente': 'Luca Verdi',
            'data_inizio': datetime(2024, 7, 15),
            'data_fine': datetime(2024, 7, 25),
            'data_richiesta': datetime(2024, 6, 20),
            'anni_anzianita': 3
        },
        'stato_team': {'totale_membri': 10, 'membri_in_ferie': 2}
    },
    {
        'nome': 'Sara Neri - Troppo poco anticipo',
        'richiesta': {
            'dipendente': 'Sara Neri',
            'data_inizio': datetime(2024, 9, 1),
            'data_fine': datetime(2024, 9, 5),
            'data_richiesta': datetime(2024, 8, 25),
            'anni_anzianita': 4
        },
        'stato_team': {'totale_membri': 10, 'membri_in_ferie': 1}
    }
]

for caso in casi_test:
    risultato = approva_ferie(caso['richiesta'], caso['stato_team'])
    print(f"\n{'─' * 70}")
    print(f"CASO: {caso['nome']}")
    print(f"{'─' * 70}")
    status = "✓ APPROVATO" if risultato['approvato'] else "✗ RIFIUTATO"
    print(f"Esito: {status}")
    print(f"Motivo: {risultato['motivo']}")

---

## Esercizio 3: No Free Lunch in Pratica

**Problema**: Dimostra empiricamente il teorema No Free Lunch confrontando le prestazioni di diversi algoritmi su dataset con caratteristiche diverse.

In [None]:
# ============================================================
# ESERCIZIO 3 - SOLUZIONE
# Dimostrazione empirica del No Free Lunch
# ============================================================

from sklearn.datasets import make_classification, make_moons, make_circles
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier

print("=" * 70)
print("ESERCIZIO 3: NO FREE LUNCH - DIMOSTRAZIONE EMPIRICA")
print("=" * 70)

# ── STEP 1: Creiamo dataset con caratteristiche diverse ──
print("\n1. CREAZIONE DATASET CON STRUTTURE DIVERSE")
print("-" * 50)

np.random.seed(42)

datasets = {
    'Lineare': make_classification(
        n_samples=500, n_features=2, n_informative=2, 
        n_redundant=0, n_clusters_per_class=1, 
        class_sep=2.0, random_state=42
    ),
    'Cerchi concentrici': make_circles(
        n_samples=500, noise=0.1, factor=0.5, random_state=42
    ),
    'Mezzelune': make_moons(
        n_samples=500, noise=0.1, random_state=42
    )
}

for name, (X, y) in datasets.items():
    print(f"  {name}: {X.shape[0]} campioni, classe 0: {(y==0).sum()}, classe 1: {(y==1).sum()}")

# ── STEP 2: Definiamo algoritmi da confrontare ──
print("\n2. ALGORITMI DA CONFRONTARE")
print("-" * 50)

algorithms = {
    'Logistic Regression': LogisticRegression(random_state=42),
    'Decision Tree (d=5)': DecisionTreeClassifier(max_depth=5, random_state=42),
    'SVM (RBF kernel)': SVC(kernel='rbf', random_state=42),
    'KNN (k=5)': KNeighborsClassifier(n_neighbors=5)
}

for name in algorithms:
    print(f"  • {name}")

# ── STEP 3: Confronto prestazioni ──
print("\n3. RISULTATI (Accuracy sul test set)")
print("-" * 50)

results_nfl = []

for dataset_name, (X, y) in datasets.items():
    # Split
    X_train, X_test, y_train, y_test = train_test_split(
        X, y, test_size=0.3, random_state=42
    )
    
    row = {'Dataset': dataset_name}
    
    for algo_name, algo in algorithms.items():
        # Clone per evitare stato condiviso
        from sklearn.base import clone
        model = clone(algo)
        
        # Fit e predict
        model.fit(X_train, y_train)
        acc = accuracy_score(y_test, model.predict(X_test))
        row[algo_name] = f"{acc:.3f}"
    
    results_nfl.append(row)

# Visualizziamo tabella risultati
df_nfl = pd.DataFrame(results_nfl)
print("\n")
print(df_nfl.to_string(index=False))

# ── STEP 4: Analisi ──
print("\n" + "=" * 70)
print("4. ANALISI DEI RISULTATI")
print("=" * 70)

print("""
OSSERVAZIONI:

• Dataset LINEARE:
  → Logistic Regression eccelle (modello lineare su dati lineari)
  → Modelli non-lineari (SVM RBF, Decision Tree) funzionano ma sono overkill

• Dataset CERCHI CONCENTRICI:
  → Logistic Regression fallisce (boundary non lineare)
  → SVM con kernel RBF eccelle (trasforma lo spazio)
  → KNN funziona bene (decision boundary locale)

• Dataset MEZZELUNE:
  → Logistic Regression fallisce (boundary non lineare)
  → SVM RBF e KNN eccellono
  → Decision Tree ragionevole ma con artefatti

CONCLUSIONE NO FREE LUNCH:
─────────────────────────
Nessun algoritmo è il migliore su tutti i dataset.
La struttura dei dati determina quale algoritmo performa meglio.
L'unico modo per sapere quale usare è sperimentare.
""")

---

# 5. Conclusione Operativa

## Cosa Abbiamo Imparato

| Concetto | Implicazione Pratica |
|----------|---------------------|
| **AI ⊃ ML ⊃ DL** | Scegli il livello di complessità appropriato al problema |
| **Modello = f(x)** | Ogni modello è una funzione che trasforma input in output |
| **Training vs Inference** | Due fasi distinte con requisiti diversi |
| **No Free Lunch** | Non esiste l'algoritmo universalmente migliore: sperimenta |
| **Rasoio di Occam** | A parità di prestazioni, preferisci il modello più semplice |
| **Rule-Based vs Data-Driven** | Scegli in base a: dati disponibili, interpretabilità, stabilità regole |

## Quando Usare Cosa

| Situazione | Approccio Consigliato |
|------------|----------------------|
| Regole di business note e stabili | Sistema rule-based |
| Molti dati, pattern ignoti | Machine Learning |
| Dati non strutturati (immagini, testo) | Deep Learning |
| Requisiti di trasparenza/audit | Modelli interpretabili |
| Risorse computazionali limitate | ML tradizionale |

## Errori Comuni da Evitare

1. ❌ Usare sempre lo stesso algoritmo senza sperimentare
2. ❌ Scegliere modelli complessi quando uno semplice basta
3. ❌ Confondere training con inference
4. ❌ Ignorare le regole di business in favore del ML
5. ❌ Non validare su dati mai visti

## Prossimi Passi

Questa lezione ha posto le basi concettuali. Nelle prossime lezioni:
- **Lezione 30**: Come rappresentare il testo come dato numerico
- **Lezione 31**: TF-IDF e tecniche di text mining
- **Lezione 32**: Sentiment Analysis pratico

---

# 6. Bignami — Scheda di Riferimento Rapido

## Definizioni Chiave

| Termine | Definizione |
|---------|-------------|
| **AI** | Campo che studia la creazione di agenti che esibiscono comportamento intelligente |
| **ML** | Sottocampo AI: sistemi che apprendono dai dati senza programmazione esplicita |
| **DL** | Sottocampo ML: reti neurali con molti layer per rappresentazione gerarchica |
| **Training** | Fase in cui il modello apprende dai dati |
| **Inference** | Fase in cui il modello applica ciò che ha appreso a nuovi dati |
| **Rule-Based** | Sistema con regole esplicite codificate da esperti |
| **Data-Driven** | Sistema che estrae regole implicite dai dati |

## Formule e Principi

**Modello come funzione:**
$$\hat{y} = f(x)$$

**Obiettivo ML (minimizzazione loss):**
$$f^* = \arg\min_f \sum_{i=1}^{n} L(f(x_i), y_i)$$

**No Free Lunch**: Non esiste algoritmo universalmente ottimo

**Rasoio di Occam**: Preferisci modelli semplici a parità di prestazioni

## Checklist Decisionale

```
□ Le regole sono note?
  → SÌ: Rule-Based | NO: considera ML

□ Hai dati sufficienti (1000+)?
  → SÌ: ML fattibile | NO: raccogli dati o usa rule-based

□ Dati strutturati (tabelle)?
  → SÌ: ML tradizionale | NO: Deep Learning

□ Servono audit trail?
  → SÌ: Modelli interpretabili | NO: qualsiasi approccio
```

## Codice Essenziale

```python
# Training
model.fit(X_train, y_train)

# Inference  
y_pred = model.predict(X_new)

# Valutazione
from sklearn.metrics import accuracy_score
acc = accuracy_score(y_true, y_pred)
```

---
*Fine Lezione 29 — Fondamenti di Artificial Intelligence*