# Lezione 11: La Correzione - Come la Rete Impara dagli Errori 🧠🔧

Nella lezione precedente abbiamo fatto un intero "viaggio di andata":
1.  Siamo partiti da un input (`x = 0.9`).
2.  Abbiamo attraversato la rete (Forward Propagation).
3.  Abbiamo ottenuto una previsione sbagliata (`y_predetto = 0.666`).
4.  Abbiamo calcolato un punteggio di errore (`errore = 0.1115`).

Ora arriva la domanda da un milione di dollari: **come fa la rete a usare questo errore per migliorarsi?**

La risposta è un processo chiamato **Retropropagazione dell'Errore (Backpropagation)**. L'idea è fare il viaggio al contrario: partiamo dall'errore finale e lo "spingiamo" all'indietro attraverso la rete per capire quali pesi hanno contribuito di più allo sbaglio e come devono essere corretti.

Immagina che la nostra rete neurale sia un team di persone che lavora a una catena di montaggio per produrre un risultato. Alla fine della catena, un ispettore (la Funzione di Costo) dice: "Il prodotto finale ha un difetto di 0.1115!".

Il capo (l'algoritmo di Backpropagation) deve capire chi ha sbagliato. Fa così:
1.  Va dall'**ultimo anello della catena** (il nostro neurone di output) e gli dice: "Il tuo errore è 0.1115. I tuoi fornitori erano il neurone nascosto 1 e il neurone nascosto 2. In base a quanto ti hanno passato e all'importanza che gli hai dato (i pesi `w3` e `w4`), assegna una parte della colpa a ciascuno di loro".
2.  Il neurone di output calcola la "quota di colpa" per `N_h1` e `N_h2`.
3.  Il capo va da `N_h1` e gli dice: "La tua parte di colpa è X. Ora, in base al tuo fornitore (l'input) e all'importanza che gli hai dato (`w1`), calcola quanto è colpa sua".
4.  Questo processo continua all'indietro fino allo strato di input.

Alla fine, ogni **peso** della rete ha ricevuto un "punteggio di colpa". Questo punteggio è il **gradiente**! Ci dice due cose:
* **La direzione:** Aumentando o diminuendo questo peso, l'errore totale aumenterà o diminuirà?
* **L'intensità:** Di quanto è "colpevole" questo peso? Un gradiente alto significa che quel peso ha un impatto enorme sull'errore finale.

Una volta che la backpropagation ha calcolato il gradiente (il "punteggio di colpa") per ogni singolo peso, entra in gioco un nostro vecchio amico: il **Gradient Descent**.

Ricordi l'escursionista che doveva scendere nella valle dell'errore?
* La **Backpropagation** è come la sua capacità di "sentire la pendenza" (il gradiente) sotto i piedi.
* Il **Gradient Descent** è l'azione di "fare un passo" nella direzione opposta alla pendenza per scendere.

La regola per aggiornare ogni peso è semplicissima:

**Nuovo Peso = Vecchio Peso - (Learning Rate * Gradiente di quel peso)**

* **Learning Rate**: È un numero piccolo (es. 0.1) che controlla la dimensione del passo. Evita che la rete corregga i pesi in modo troppo drastico.

Facciamo un esempio numerico semplificato per vedere come viene aggiornato un solo peso.

In [None]:
# --- RIPRENDIAMO I DATI DELLA LEZIONE 10 ---
# Vecchio peso w4 (dal neurone nascosto N_h2 all'output)
vecchio_w4 = 0.9

# Definiamo un Learning Rate
learning_rate = 0.1

# --- IL MIRACOLO DELLA BACKPROPAGATION ---
# Immaginiamo che, dopo complessi calcoli matematici (derivate parziali),
# l'algoritmo di backpropagation abbia calcolato il "punteggio di colpa"
# per il peso w4.
#
# Supponiamo che il risultato sia:
gradiente_di_w4 = 0.183
# Un valore positivo significa che AUMENTANDO w4, l'errore AUMENTA.
# Quindi, per ridurre l'errore, dobbiamo DIMINUIRE w4.

# --- APPLICHIAMO LA REGOLA DEL GRADIENT DESCENT ---
nuovo_w4 = vecchio_w4 - (learning_rate * gradiente_di_w4)
# Calcolo: 0.9 - (0.1 * 0.183) = 0.9 - 0.0183 = 0.8817

print(f"Il vecchio peso w4 era: {vecchio_w4}")
print(f"Dopo un passo di correzione, il nuovo peso w4 è: {nuovo_w4:.4f}")

# La rete ha leggermente ridotto il peso w4 perché ha capito
# che il suo valore era un po' troppo alto e contribuiva all'errore.
# Questo stesso identico processo viene fatto per TUTTI i pesi e i bias della rete!

Il vecchio peso w4 era: 0.9
Dopo un passo di correzione, il nuovo peso w4 è: 0.8817


Quello che abbiamo appena visto è un singolo, minuscolo passo di apprendimento. Una rete neurale impara ripetendo questo ciclo decine di migliaia di volte:

1.  **Prova (Forward Pass)**: Prendi un dato, passalo attraverso la rete e ottieni una previsione.
2.  **Misura (Calcolo del Costo)**: Confronta la previsione con la realtà e calcola l'errore.
3.  **Correggi (Backward Pass / Backpropagation)**: Propaga l'errore all'indietro per calcolare il gradiente (la "colpa") di ogni peso.
4.  **Aggiorna (Gradient Descent)**: Usa i gradienti per aggiornare leggermente tutti i pesi.
5.  **Ripeti!**

Ogni volta che la rete vede l'intero dataset di addestramento si dice che ha completato una **Epoca**. L'addestramento di una rete consiste nel farla girare per molte epoche, finché l'errore non diventa abbastanza piccolo.


### Un Laboratorio Pratico: Giochiamo con i Neuroni! 🔬

Ora che abbiamo capito l'anatomia di una rete sulla carta, è il momento di vederla in azione in un laboratorio virtuale, senza scrivere una sola riga di codice. Useremo uno strumento eccezionale chiamato **TensorFlow Playground**.

**Apri questo link in una nuova scheda:** [**playground.tensorflow.org**](https://playground.tensorflow.org)



Quello che vedi è un simulatore di reti neurali. Prendiamoci un momento per capire l'interfaccia:
* **A Destra (I Dati):** C'è il nostro problema. L'obiettivo della rete è imparare a tracciare un confine che separi i punti arancioni da quelli blu.
* **Al Centro (La Rete):** Qui costruiamo la nostra rete. Vedi lo strato di **Input**, gli **Hidden Layers** (strati nascosti) e lo strato di **Output**. Puoi aggiungere o togliere strati e neuroni usando i pulsanti `+` e `-`.
* **A Sinistra (I Controlli):** Ci sono vari parametri come il "Learning Rate". Per ora, ignora quasi tutto.

---
### La Tua Prima Missione 🎯

Proviamo a risolvere il problema più semplice. Segui questi passi:

1.  **Scegli i Dati**: Assicurati che in alto a destra sia selezionato il primo dataset, quello a forma di **cerchio**.
2.  **Costruisci la Rete**: Al centro, crea una rete molto semplice: lascia i due input, crea **un solo strato nascosto** e mettici **3 neuroni**.
3.  **Avvia l'Addestramento**: Clicca sul pulsante "Play" ▶️ in alto a sinistra.

### Cosa Osservare 👀

Mentre la rete impara, osserva tre cose:
* **Le linee tra i neuroni**: Rappresentano i **pesi**. Noterai che cambiano colore e spessore. Questo è l'effetto dell'apprendimento! La rete sta "sintonizzando" l'importanza di ogni connessione.
* **L'output a destra**: Vedrai la rete che, iterazione dopo iterazione, colora lo sfondo e impara a tracciare un confine circolare sempre più preciso per separare i punti.
* **Il grafico "Test loss"**: In alto a destra, vedrai un numero che scende rapidamente. Quello è l'**errore** del nostro modello. Più scende, più la rete sta diventando brava. Questo è un'anticipazione del **Gradient Descent** in azione.

**Sperimenta!** Prova ad aggiungere o togliere neuroni, o a creare un secondo strato nascosto, e vedi come cambia la velocità e l'efficacia con cui la rete impara.

Questo strumento ti dà un'intuizione visiva potentissima di come è fatta una rete e un'anteprima del suo processo di apprendimento, che analizzeremo nel dettaglio nelle prossime lezioni.

### Dalle Linee Rette alle Decisioni Complesse: Il Superpotere degli Strati Nascosti

Abbiamo visto che la rete è fatta di strati. Ma perché ne serve più di uno? Specialmente, perché sono così importanti gli **strati nascosti**?

La risposta sta in quello che ogni singolo neurone è in grado di fare.

**Un singolo neurone è un separatore lineare.**
Se abbiamo solo due feature (come "larghezza" e "altezza" di un frutto), un neurone può solo tracciare **una singola linea retta** per cercare di dividere i dati. È utile, ma molto limitato. Non potrebbe mai separare dati disposti a cerchio, per esempio.

**Più neuroni nello stesso strato tracciano più linee.**
Se nel nostro primo strato nascosto mettiamo **due neuroni**, questi impareranno a tracciare **due linee rette diverse**. Queste due linee dividono il nostro spazio in un massimo di 4 regioni.

![Immagine di due rette che dividono un piano in quattro regioni]

**Lo Strato Successivo impara a combinare le regioni.**
Qui avviene la vera magia. Lo strato successivo (un altro strato nascosto o quello di output) non vede i dati originali, ma riceve come input le "decisioni" dei neuroni precedenti. Il suo compito è imparare una **regola per combinare queste regioni**.

Potrebbe imparare qualcosa come: "Se un dato si trova *sopra* la linea 1 **E** *a sinistra* della linea 2, allora appartiene alla classe 'Mela'".

Combinando abbastanza di questi semplici "tagli" lineari, una rete neurale può creare confini decisionali di qualsiasi forma, anche molto complessi.

**Perché questo è fondamentale per le immagini?**
Un'immagine non è altro che una griglia di pixel (le nostre feature).
* I **primi strati** della rete imparano a riconoscere cose semplicissime: un neurone potrebbe attivarsi se vede un **bordo verticale**, un altro se vede un **bordo orizzontale**, un altro ancora se riconosce una piccola **curva**. In pratica, ogni neurone traccia una "linea" nello spazio ad altissima dimensionalità dei pixel.
* Gli **strati successivi** combinano queste informazioni. Un neurone più avanti potrebbe imparare ad attivarsi se riceve segnali dai neuroni che hanno visto "una curva sopra a due linee verticali", riconoscendo così la forma di un **occhio**.
* Ancora più avanti, un altro neurone potrebbe combinare le informazioni "occhio", "naso" e "bocca" per riconoscere un **viso**.

Una rete neurale, quindi, costruisce la conoscenza in modo gerarchico: dai mattoni più semplici (linee e curve) a concetti sempre più astratti e complessi. Ecco perché aggiungere strati (rendere la rete "profonda" o *deep*) le permette di risolvere problemi così difficili come la classificazione di immagini.

**Nella prossima e ultima lezione**, metteremo insieme tutti questi pezzi, vedremo come si traducono in poche righe di codice reale e faremo il collegamento finale con lo strumento che userete per l'open day: **Teachable Machine**.