<a href="https://colab.research.google.com/github/demichie/CorsoIntroduzionePython/blob/main/lezione5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Lezione 5: Selezione Dati Avanzata e Visualizzazione con Matplotlib**

Nella scorsa lezione abbiamo iniziato ad usare la libreria scientifica **NumPy**. Abbiamo visto perché gli array NumPy sono così efficienti, come crearli, come ispezionarne le proprietà e come eseguire operazioni vettorizzate di base. Abbiamo anche introdotto il concetto cruciale di **viste vs. copie** per la gestione della memoria.

Oggi, concluderemo la nostra introduzione a NumPy esplorando una delle sue tecniche di selezione dati più potenti. Subito dopo, continueremo con la **visualizzazione dati** con **Matplotlib**, la libreria che ci permetterà di trasformare i nostri array numerici in grafici informativi e professionali.

### **Obiettivi dettagliati della Lezione 5:**

1.  **Concludere NumPy:**
    *   Imparare e applicare l'**indicizzazione booleana (masking)**, una tecnica fondamentale per filtrare dati basata su condizioni.

2.  **Introdurre Matplotlib:**
    *   Comprendere l'**anatomia di un grafico** Matplotlib: la differenza tra `Figure` e `Axes`.
    *   Creare i tipi di grafici più comuni in ambito scientifico:
        *   **Grafici a linee** (`plt.plot`) per visualizzare trend e serie temporali.
        *   **Grafici a dispersione** (`plt.scatter`) per analizzare la relazione tra due variabili.
        *   **Istogrammi** (`plt.hist`) per studiare la distribuzione dei dati.
    *   Imparare a **personalizzare** ogni aspetto dei nostri grafici: titoli, etichette, colori, stili, marker, legende e dimensioni.
    *   Salvare i grafici in file per report e pubblicazioni.

## **Parte 1: Conclusione di NumPy - Selezione Dati Avanzata**

### **Indicizzazione Avanzata: Maschere Booleane**

Una delle tecniche di selezione dati più potenti e usate in NumPy è l'**indicizzazione booleana** o **masking**. L'idea è di usare un array di valori booleani (`True`/`False`) per selezionare gli elementi di un altro array.

Il processo si articola in due fasi:
1.  **Creare la maschera (mask):** Si applica un'operazione di confronto vettorizzata all'array. NumPy restituisce un nuovo array booleano della stessa forma, con `True` dove la condizione è soddisfatta e `False` altrimenti.
2.  **Applicare la maschera:** Si usa questo array booleano all'interno delle parentesi quadre per selezionare dall'array originale solo gli elementi in cui la maschera è `True`.

**Nota importante:** A differenza dello slicing, l'indicizzazione booleana **crea sempre una copia** dei dati, non una vista.

In [None]:
import numpy as np # Assicuriamoci che numpy sia importato

# Scenario: abbiamo registrato le magnitudo di una sequenza sismica
magnitudo = np.array([1.2, 2.5, 3.1, 1.8, 4.2, 2.9, 3.5, 2.2])
print(f"Dati di magnitudo originali: {magnitudo}\n")

In [None]:
# 1. Creiamo la maschera per trovare eventi con magnitudo > 3.0
maschera_eventi_forti = magnitudo > 3.0
print(f"Maschera booleana per magnitudo > 3.0: {maschera_eventi_forti}\n")

In [None]:
# 2. Applichiamo la maschera per estrarre i dati
eventi_forti = magnitudo[maschera_eventi_forti]
print(f"Eventi con magnitudo > 3.0: {eventi_forti}\n")

In [None]:
# Si può fare tutto in una sola riga, che è la pratica comune:
print(f"Eventi con magnitudo < 2.0: {magnitudo[magnitudo < 2.0]}\n")

In [None]:
# Possiamo anche usare le maschere per modificare i dati
# Esempio: "clippare" tutti i valori sopra 4.0 a 4.0
print(f"Array prima della modifica: {magnitudo}")
magnitudo[magnitudo > 4.0] = 4.0
print(f"Array dopo aver limitato i valori a 4.0: {magnitudo}")

### **Esercizio su NumPy: Analisi Semplificata di una Serie Temporale GPS**

È il momento di mettere in pratica i concetti di creazione, vettorizzazione, indicizzazione e masking con un esercizio completo a tema geofisico.

**Scenario:**
Stiamo analizzando i dati preliminari di spostamento verticale di una stazione GPS. Abbiamo una serie di misure di sollevamento del suolo (componente "Up") raccolte in un periodo di 5 anni. Il nostro compito è usare NumPy per creare e analizzare questi dati.

**Dati di partenza:**
Una lista Python con le misure di spostamento in millimetri.

`spostamenti_mm = [2.1, 2.4, 2.8, 3.1, 3.3, 3.7, 4.0, 4.2, 4.5, 4.9]`

---
**Compiti da Svolgere:**

1.  **Creare gli Array:**
    *   Crea un array NumPy chiamato `spostamenti_mm_arr` a partire dalla lista Python fornita.
    *   Crea un secondo array NumPy chiamato `tempo_anni` che rappresenti l'asse temporale. Deve contenere **10 punti equispaziati** da 0.0 a 5.0 anni (estremi inclusi).

2.  **Calcolo della Velocità Media:**
    *   Calcola la **velocità media di sollevamento** in **mm/anno**. Per farlo in modo semplificato, calcola lo spostamento totale (l'ultimo valore meno il primo) e dividerlo per l'intervallo di tempo totale (5 anni). Usa l'indicizzazione per accedere al primo e all'ultimo elemento.
    *   Stampa il risultato in modo chiaro.

3.  **(Bonus) Analisi con Maschere Booleane:**
    *   Utilizzando una maschera booleana, seleziona e stampa tutti i valori di spostamento che sono **superiori a 4.0 mm**.
    *   Crea e stampa un secondo array chiamato `tempo_eventi_significativi` che contenga solo gli istanti di tempo (dall'array `tempo_anni`) in cui lo spostamento ha superato i 4.0 mm. **Suggerimento:** puoi usare la stessa maschera su un array diverso, purché abbiano la stessa forma (shape)!

In [None]:
# Dati di partenza
spostamenti_mm = [2.1, 2.4, 2.8, 3.1, 3.3, 3.7, 4.0, 4.2, 4.5, 4.9]

# --- 1. Creare gli Array ---
print("--- 1. Creazione Array ---")
# Scrivi qui il tuo codice per creare spostamenti_mm_arr e tempo_anni


# --- 2. Calcolo della Velocità Media ---
print("\n--- 2. Calcolo Velocità Media ---")
# Scrivi qui il tuo codice per calcolare e stampare la velocità media


# --- 3. (Bonus) Analisi con Maschere Booleane ---
print("\n--- 3. Bonus: Maschere Booleane ---")
# Scrivi qui il tuo codice per selezionare gli spostamenti e i tempi significativi

## **Ripasso: esercizio della settimana scorsa con Matplotlib**

Abbiamo concluso la nostra introduzione a NumPy, che è il motore per i calcoli numerici. Ma come possiamo interpretare i risultati? Un array di numeri, come quello dell'hillshade di una topografia, è difficile da capire senza una rappresentazione visiva.

Qui entrano in gioco le librerie di visualizzazione. Prima di iniziare a studiare Matplotlib in dettaglio, rivediamo l'esercizio della scorsa lezione. Lo useremo come un "ponte" per capire perché la visualizzazione è un passo inseparabile dall'analisi dati.

Nell'esercizio seguente, abbiamo usato una serie di operazioni NumPy (`linspace`, `meshgrid`, `gradient`, ecc.) per calcolare un array 2D che rappresenta l'ombreggiatura di un rilievo. Il passaggio finale, e quello che andremo a studiare ora, è stato usare la funzione `plt.imshow()` di Matplotlib per trasformare quell'array di numeri in un'immagine significativa.

In [None]:
# Importiamo le librerie necessarie, inclusa matplotlib.pyplot
import numpy as np
import matplotlib.pyplot as plt

# --- FASE 1: Creazione del DEM ---
n_punti = 200
x = np.linspace(-2 * np.pi, 2 * np.pi, n_punti)
y = np.linspace(-2 * np.pi, 2 * np.pi, n_punti)
X, Y = np.meshgrid(x, y)
Z = np.maximum(0.0, np.sin(X) * np.sin(Y)) + 0.1 * np.random.rand(n_punti, n_punti)

# --- FASE 2-4: Calcolo dell'Hillshade (Tutta la logica NumPy) ---

# Calcolo del gradiente
dZ_dy, dZ_dx = np.gradient(Z, y, x)

# Calcolo dei vettori normali
nx = -dZ_dx
ny = -dZ_dy
nz = np.ones_like(Z)
norm = np.sqrt(nx**2 + ny**2 + nz**2)
nx = nx / norm
ny = ny / norm
nz = nz / norm

# Definizione della sorgente di luce
azimuth_deg = 315.0
zenith_deg = 45.0
azimuth_rad = np.deg2rad(azimuth_deg)
zenith_rad = np.deg2rad(zenith_deg)
luce_x = np.sin(azimuth_rad) * np.sin(zenith_rad)
luce_y = np.cos(azimuth_rad) * np.sin(zenith_rad)
luce_z = np.cos(zenith_rad)
luce = np.array([luce_x, luce_y, luce_z])

# Calcolo del prodotto scalare (ombreggiatura)
hillshade = np.dot(np.stack([nx, ny, nz], axis=-1), luce)
hillshade = np.maximum(0, hillshade) # Clipping delle ombre

# --- FASE 5: Visualizzazione con Matplotlib ---
print("Visualizzazione del DEM e del suo Hillshade calcolato con NumPy:")

# Creiamo una figura con due subplot
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 6))

# Subplot 1: Il DEM originale
im1 = ax1.imshow(Z, cmap='terrain', extent=[x.min(), x.max(), y.min(), y.max()])
ax1.set_title("Superficie Topografica (DEM)")
fig.colorbar(im1, ax=ax1, label="Elevazione")

# Subplot 2: L'Hillshade
im2 = ax2.imshow(hillshade, cmap='gray', extent=[x.min(), x.max(), y.min(), y.max()])
ax2.set_title("Hillshade (Ombreggiatura)")

# Nascondiamo gli assi
for ax in [ax1, ax2]:
    ax.set_xticks([])
    ax.set_yticks([])

plt.tight_layout()
plt.show()

## **Applicazione Pratica: Hillshading di un DEM Reale**

L'esempio precedente con dati sintetici è stato utile per capire la logica. Ma come applichiamo questo processo a dati reali? In geoscienze, i Modelli di Elevazione Digitale (DEM) sono spesso distribuiti in formati raster, come il formato **ESRI ASCII Grid (.asc)**.

**Obiettivo:** Creare un flusso di lavoro completo:
1.  Scrivere una funzione Python per **leggere un file `.asc`** ed estrarre sia i metadati (come la dimensione della cella) che i dati di elevazione in un array NumPy.
2.  **Applicare l'algoritmo di hillshading** che abbiamo usato nelle celle precedenti a questo DEM reale.
3.  **Visualizzare** il risultato.

**Il formato ESRI ASCII Grid (`.asc`)**
Un file `.asc` è un semplice file di testo strutturato in due parti:
*   Un **header** di 6 righe che descrive la griglia (numero di colonne/righe, coordinate, dimensione della cella, valore per i dati mancanti):

```
ncols        460
nrows        438
xllcorner    505700.000000000000
yllcorner    4285580.000000000000
cellsize     50.000000000000
NODATA_value  -9999
```

*   Una sezione di **dati** dove i valori di elevazione sono elencati riga per riga, separati da spazi.

### **Costruire la nostra funzione `read_asc`**

Per caricare i dati dal formato `.asc` direttamente da un URL, dobbiamo creare una funzione che esegua diversi passaggi. Analizziamo gli strumenti Python e NumPy necessari per capire ogni riga della funzione che scriveremo.

**1. Accedere a Risorse Online: la libreria `urllib`**
Per scaricare dati da un link, non possiamo usare la funzione `open()` standard, che funziona solo per i file locali. Abbiamo bisogno di una libreria in grado di gestire le richieste web. `urllib.request` è una libreria integrata in Python che fa proprio questo. Il comando `urllib.request.urlopen(url)` apre una connessione all'URL specificato e ci permette di leggerne il contenuto come se fosse un file.

**2. Il Problema dei Dati dal Web: `bytes` vs. `string`**
Quando leggiamo dati da una risorsa web (o da alcuni tipi di file), Python li riceve come una sequenza di `bytes`, non come testo leggibile. Un oggetto `bytes` è rappresentato con un prefisso `b'`, ad esempio `b'ncols 460'`.
Per poter lavorare con questo dato come testo, dobbiamo "decodificarlo". Il metodo `.decode('utf-8')` fa proprio questo: traduce la sequenza di `bytes` in una normale `stringa` di testo (es. `'ncols 460'`). Useremo questo metodo su ogni riga che leggiamo dall'URL.

**3. Manipolare le Righe dell'Header (già visto)**
Una volta che abbiamo una riga come stringa di testo (es. `'ncols         460'`), usiamo i metodi che già conosciamo per estrarre le informazioni:
*   `.strip()`: Rimuove spazi e caratteri invisibili all'inizio e alla fine.
*   `.split()`: Divide la stringa in una lista (es. `['ncols', '460']`), permettendoci di accedere alla chiave e al valore.
*   `.lower()`: Converte una stringa in minuscolo. È una buona pratica usarlo sulle chiavi per evitare problemi (es. `NCOLS` vs `ncols`).

Vediamo un esempio:



In [None]:
linea_esempio = "ncols 150\n"
print(f"Riga originale: '{linea_esempio}'")
lista_elementi = linea_esempio.strip().split()
print(f"Dopo .strip() e .split(): {lista_elementi}")

**4. Caricamento Efficiente dei Dati Numerici: `np.loadtxt()`**
Dopo aver letto le 6 righe dell'header, il resto del file contiene solo la grande matrice di dati. Leggerla riga per riga con un ciclo `for` sarebbe molto inefficiente. La funzione `np.loadtxt(f)` è lo strumento perfetto: è ottimizzata per leggere da un oggetto file `f` (anche quello aperto da un URL) e caricare tutti i dati numerici direttamente in un array NumPy. È estremamente veloce e potente.

**5. Gestire i Dati Mancanti: `NODATA_value` e `np.nan`**
I file raster spesso contengono un valore speciale (es. `-9999`) per indicare le celle dove non è disponibile una misurazione (es. aree di mare in un DEM terrestre). Se lasciassimo questo valore, falserebbe tutti i nostri calcoli statistici (media, minimo, massimo).
La soluzione corretta è sostituire questo valore con `np.nan` (**N**ot **a** **N**umber), un marcatore speciale di NumPy che viene automaticamente ignorato dalla maggior parte delle funzioni di calcolo (`np.nanmean()`, `np.nanmax()`, etc.) e visualizzato correttamente. Per fare questa sostituzione, useremo l'indicizzazione booleana: `data[data == nodata_value] = np.nan`.

Per recuperare il `NODATA_value` in modo sicuro dall'header, useremo il metodo `.get()` dei dizionari: `header.get('nodata_value', -9999)` prova a cercare la chiave `'nodata_value'`, ma se non la trova, restituisce il valore di default `-9999` senza causare un errore.

Con questi concetti, ora siamo pronti a leggere e capire la funzione `read_asc`.

In [None]:
import urllib.request

def read_asc(filepath):
    """
    Legge un file in formato ESRI ASCII Grid (.asc) e restituisce
    un array NumPy con i dati e un dizionario con i metadati dell'header.
    """
    header = {}
    with urllib.request.urlopen(filepath) as f:
        # Leggi le prime 6 righe per l'header
        for i in range(6):
            line = f.readline().decode('utf-8').strip().split()
            header[line[0].lower()] = float(line[1])

        # Carica il resto del file come un array NumPy
        data = np.loadtxt(f)

    # Gestisci il valore NODATA sostituendolo con 'Not a Number' (NaN)
    nodata_value = header.get('nodata_value', -9999) # Default a -9999 se non specificato
    data[data == nodata_value] = np.nan
    print(header)

    return data, header

# NOTA: Per eseguire questa cella, è necessario avere un file .asc nella stessa
# cartella del notebook. Per questo esempio, useremo un file chiamato 'dem.asc'.
# Assicurati di scaricare e caricare questo file nel tuo ambiente di lavoro.

### **Scrivere Codice Robusto: Gestire gli Errori con `try...except`**

Cosa succede se proviamo a caricare un file che non esiste o un URL non valido? O se la nostra connessione internet non funziona? Il nostro codice si interromperebbe con un errore (`FileNotFoundError`, `URLError`, ecc.).

Per evitare che il programma si blocchi in modo imprevisto, Python ci fornisce un meccanismo per "provare" a eseguire del codice che potrebbe fallire e "catturare" l'errore se si verifica, permettendoci di gestirlo in modo controllato. Questo meccanismo è il blocco `try...except`.

**La sintassi di base è:**

```python
try:
    # Codice che potrebbe generare un errore.
    # Ad esempio, aprire un file o connettersi a un URL.
    print("Sto provando a eseguire un'operazione rischiosa...")
    # ... codice ...

except NomeDellErrore:
    # Codice da eseguire SOLO SE si verifica l'errore specificato.
    # Ad esempio, stampare un messaggio amichevole all'utente.
    print("L'operazione è fallita! Ma il programma non si è bloccato.")

# Il codice qui sotto viene eseguito in ogni caso.
print("Il programma continua...")

In [None]:
# --- 1. Caricamento del DEM Reale ---
try:
    url_stromboli = 'https://raw.githubusercontent.com/demichie/CorsoIntroduzionePython/refs/heads/main/DATA/stromboliDEM.asc'
    dem, header = read_asc(url_stromboli)
    print("File DEM caricato con successo.")
    print(f"Dimensioni: {int(header['ncols'])} x {int(header['nrows'])} pixels")
    print(f"Dimensione della cella: {header['cellsize']} metri")
except FileNotFoundError:
    print("ERRORE: File 'dem.asc' non trovato.")
    print("Assicurati di aver caricato il file DEM nel tuo ambiente di lavoro.")
    dem = None # Imposta dem a None per saltare i calcoli successivi

if dem is not None:
    # --- 2. Calcolo del Gradiente ---
    # Per np.gradient, abbiamo bisogno di sapere la spaziatura tra i punti,
    # che è la dimensione della cella.
    cellsize = header['cellsize']
    dZ_dy, dZ_dx = np.gradient(dem, cellsize, cellsize)

    # --- 3. Calcolo dei Vettori Normali ---
    nx = -dZ_dx
    ny = -dZ_dy
    nz = np.ones_like(dem)
    norm = np.sqrt(nx**2 + ny**2 + nz**2)
    nx /= norm
    ny /= norm
    nz /= norm

    # --- 4. Calcolo dell'Hillshade ---
    azimuth_deg = 315.0
    zenith_deg = 45.0
    azimuth_rad = np.deg2rad(azimuth_deg)
    zenith_rad = np.deg2rad(zenith_deg)

    luce_x = np.sin(azimuth_rad) * np.sin(zenith_rad)
    luce_y = np.cos(azimuth_rad) * np.sin(zenith_rad)
    luce_z = np.cos(zenith_rad)
    luce = np.array([luce_x, luce_y, luce_z])

    hillshade = np.dot(np.stack([nx, ny, nz], axis=-1), luce)
    hillshade = np.maximum(0, hillshade)

    # --- 5. Visualizzazione ---
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 7))

    ax1.set_title("DEM Reale")
    im1 = ax1.imshow(dem, cmap='terrain')
    fig.colorbar(im1, ax=ax1, label="Elevazione (m)")

    ax2.set_title(f"Hillshade (Luce da {azimuth_deg}° Az, {zenith_deg}° Zen)")
    ax2.imshow(hillshade, cmap='gray')

    plt.tight_layout()
    plt.show()

## **Visualizzazione di Dati Geoscientifici con Matplotlib**

Nei nostri esempi sull'hillshade, abbiamo fatto tutti i calcoli numerici con NumPy per ottenere un array finale. Tuttavia, per dare un senso a quell'array di numeri, abbiamo dovuto compiere un ultimo passo molto importante: trasformarlo in un'immagine. Per fare ciò, abbiamo usato comandi come `plt.imshow()` e `plt.figure()`.

Quei comandi provengono da **Matplotlib**, la libreria di visualizzazione più utilizzata in Python. Questa libreria è il ponte tra i dati numerici astratti e una rappresentazione grafica che ne facilita l'interpretazione.

Ora inizieremo a vedere questa libreria in dettaglio. Capiremo meglio come funzionano i comandi che abbiamo usato e come ottenere il controllo completo sulla creazione di grafici.

### **Pyplot: l'Interfaccia Principale**

Matplotlib è una libreria molto vasta. Per la maggior parte delle nostre necessità, interagiremo con essa attraverso il suo sottomodulo `pyplot`. Questo modulo fornisce un'interfaccia che rende la creazione di grafici relativamente semplice e veloce, ed è proprio da qui che provengono le funzioni `plt.*` che abbiamo già visto.

La convenzione universale per importare `pyplot` è usare l'alias `plt`.

In [None]:
# Importiamo il sottomodulo pyplot dalla libreria matplotlib e gli diamo l'alias 'plt'
import matplotlib.pyplot as plt

# Questa riga è l'equivalente di 'import numpy as np' per la visualizzazione.
# La vedrete all'inizio di quasi ogni script di analisi dati.

### **L'Anatomia di un Grafico Matplotlib**

Prima di iniziare a creare grafici, è fondamentale capire i due componenti principali che Matplotlib usa per organizzare una visualizzazione: la **`Figure`** e gli **`Axes`**.

![Anatomia di un Grafico Matplotlib](https://matplotlib.org/stable/_images/anatomy.png)

*Fonte: Documentazione ufficiale di Matplotlib*

1.  **La `Figure` (Figura):**
    *   È il contenitore di più alto livello, la "tela" o la "finestra" su cui tutto viene disegnato (rappresentata dal bordo esterno nell'immagine).
    *   Una singola figura può contenere uno o più grafici.
    *   Le sue proprietà includono le dimensioni complessive, il colore di sfondo, ecc.
    *   Si può pensare ad essa come al file che salveremo (es. `mio_grafico.png`).

2.  **Gli `Axes` (Assi/Grafico):**
    *   **Questo è il grafico vero e proprio**. È l'area rettangolare all'interno della `Figure` dove i dati vengono plottati (la zona con le linee e i punti).
    *   Ogni oggetto `Axes` ha un asse X (`xaxis`) e un asse Y (`yaxis`), che a loro volta contengono le tacche (`ticks`), le etichette delle tacche (`tick labels`), e l'etichetta dell'asse (`xlabel`, `ylabel`).
    *   È l'oggetto `Axes` che contiene tutti gli elementi visivi che ci interessano: le linee (`Line2D`), i punti (`Markers`), il titolo del grafico (`title`), la legenda (`legend`), la griglia (`grid`), ecc.
    *   **Attenzione al nome:** `Axes` (con la 'e') non è il plurale di `Axis` (asse). È un singolo oggetto che rappresenta un'area di plotting completa.

**In sintesi:** Una `Figure` è la finestra, e può contenere uno o più `Axes`. La maggior parte delle funzioni che useremo (`plt.plot`, `plt.title`, ...) operano sull'oggetto `Axes` "corrente" o "attivo".

## **Creare i Primi Grafici**

Inizieremo con il tipo di grafico più comune: il grafico a linee, ideale per visualizzare dati che hanno un ordine sequenziale, come le serie temporali.

### **1. Grafici a Linee con `plt.plot()`**

La funzione `plt.plot()` è il comando fondamentale per creare grafici a linee. Nella sua forma più semplice, accetta due argomenti:
*   Un array (o una lista) per i valori dell'asse X.
*   Un array (o una lista) per i valori dell'asse Y.

Matplotlib disegnerà una linea che connette i punti definiti dalle coppie (x, y).

Creiamo un primo grafico "grezzo" usando i dati della nostra serie temporale GPS.

In [None]:
# Riprendiamo i dati dall'esercizio su NumPy
# (In un notebook reale, queste variabili sarebbero già in memoria,
# ma le ridefiniamo qui per rendere la cella autoconsistente)
spostamenti_mm = [2.1, 2.4, 2.8, 3.1, 3.3, 3.7, 4.0, 4.2, 4.5, 4.9]
spostamenti_mm_arr = np.array(spostamenti_mm)
tempo_anni = np.linspace(0.0, 5.0, 10)

# Creiamo il nostro primo grafico
plt.plot(tempo_anni, spostamenti_mm_arr)

# plt.show() dice a Matplotlib: "Hai finito di definire il grafico, ora mostralo".
# In molti ambienti Jupyter/Colab, i grafici appaiono anche senza questo comando,
# ma è una buona pratica includerlo esplicitamente.
plt.show()

Come possiamo vedere, il grafico mostra i dati, ma è incompleto. Manca di contesto: non sappiamo cosa rappresentano gli assi né qual è l'argomento del grafico. Un grafico senza etichette è scientificamente inutile, e anche bruttino...

### **Personalizzazione di Base: Rendere un Grafico Informativo**

`pyplot` fornisce una serie di funzioni semplici per aggiungere gli elementi essenziali a un grafico:

*   `plt.figure(figsize=(larghezza, altezza))`: Anche se opzionale, permette di creare una `Figure` esplicitamente e di controllarne le dimensioni in pollici. È utile per creare grafici più grandi e leggibili.
*   `plt.title("Testo del titolo")`: Aggiunge un titolo all'oggetto `Axes` corrente.
*   `plt.xlabel("Testo per l'asse X")`: Aggiunge un'etichetta all'asse X.
*   `plt.ylabel("Testo per l'asse Y")`: Aggiunge un'etichetta all'asse Y.
*   `plt.grid(True)`: Aggiunge una griglia di riferimento al grafico.
*   `plt.xlim([min, max])` e `plt.ylim([min, max])`: Permettono di impostare manualmente i limiti degli assi.

Applichiamo queste funzioni per migliorare il nostro grafico.

In [None]:
# --- Creazione di un grafico personalizzato e informativo ---

# 1. (Opzionale) Inizializziamo una figura più grande per una migliore leggibilità
plt.figure(figsize=(10, 6)) # 10 pollici di larghezza, 6 di altezza

# 2. Creiamo il plot come prima
plt.plot(tempo_anni, spostamenti_mm_arr)

# 3. Aggiungiamo le personalizzazioni
plt.title("Serie Temporale di Spostamento Verticale - Stazione GPS XYZ")
plt.xlabel("Tempo (anni)")
plt.ylabel("Spostamento Verticale (mm)")
plt.grid(True)

# 4. (Opzionale) Aggiustiamo i limiti degli assi per dare un po' di "respiro" al grafico
plt.xlim(0, 5)
plt.ylim(2, 5.5)

# 5. Mostriamo il grafico completo
plt.show()

### **Personalizzazione Avanzata: Colori, Stili e Marker**

Matplotlib ci dà il controllo completo sull'aspetto di ogni elemento del grafico. Possiamo personalizzare le linee e i punti usando argomenti specifici all'interno delle funzioni `plt.plot()` e `plt.scatter()`.

I più comuni sono:

*   `color`: Imposta il colore della linea o dei punti. Si possono usare nomi di colori comuni (es. `'blue'`, `'red'`, `'green'`), codici esadecimali (es. `'#FF5733'`) o abbreviazioni (`'r'` per rosso, `'g'` per verde, `'b'` per blu, `'k'` per nero).

*   `linestyle` (o `ls`): Solo per `plt.plot()`, definisce lo stile della linea. I più comuni sono:
    *   `'-'` : Linea continua (default)
    *   `'--'`: Linea tratteggiata
    *   `':'` : Linea puntinata
    *   `'-.'`: Linea tratto-punto

*   `marker`: Imposta il simbolo da usare per marcare ogni punto dato. È utile sia in `plt.plot()` (per evidenziare i punti di misura) che in `plt.scatter()`. Alcuni esempi:
    *   `'.'` : Punto
    *   `'o'` : Cerchio
    *   `'s'` : Quadrato (square)
    *   `'^'` : Triangolo
    *   `'x'` : Croce

*   `s`: Solo per `plt.scatter()`, controlla la **dimensione** (size) dei marker.

*   `alpha`: Un valore tra 0 (trasparente) e 1 (opaco) che controlla la trasparenza. È molto utile in scatter plot con molti punti sovrapposti.

### **Creare un Grafico con Più Serie di Dati**

Per visualizzare più serie di dati sullo stesso grafico, è sufficiente chiamare `plt.plot()` o `plt.scatter()` più volte, una per ogni serie, prima di chiamare `plt.show()`. Matplotlib aggiungerà automaticamente ogni nuova serie allo stesso oggetto `Axes`.

Per distinguere le diverse serie, è fondamentale aggiungere una **legenda**. Per fare ciò, seguiamo due passaggi:
1.  Aggiungiamo l'argomento `label="Nome della Serie"` a ogni chiamata di `plt.plot()` o `plt.scatter()`.
2.  Chiamiamo la funzione `plt.legend()` prima di `plt.show()` per dire a Matplotlib di creare e visualizzare la legenda.

#### **Esercizio Guidato: Confrontare Due Serie Magmatiche**
Applichiamo questi nuovi concetti per confrontare la composizione di due diverse serie di rocce (es. una alcalina e una calcalcalina) sullo stesso diagramma di Harker.

**Obiettivo:** Creare un unico scatter plot che mostri i dati delle due serie, usando colori e marker diversi per distinguerle e aggiungendo una legenda.

In [None]:
# Dati di due diverse serie di rocce
# Serie 1: Calcalcalina
sio2_calc = np.array([50, 55, 60, 65, 70])
k2o_calc = np.array([0.8, 1.5, 2.2, 2.8, 3.5])

# Serie 2: Alcalina
sio2_alk = np.array([48, 53, 58, 63, 68])
k2o_alk = np.array([1.5, 2.5, 3.8, 5.0, 6.2])

# --- Compito: Crea un grafico che confronti le due serie ---

# 1. Inizializza una figura
plt.figure(figsize=(10, 7))

# 2. Plotta la prima serie (Calcalcalina)
#    - Usa plt.scatter()
#    - Assegna un colore blu ('b')
#    - Usa un marcatore a cerchio ('o')
#    - Aggiungi la label "Serie Calcalcalina"
plt.scatter(sio2_calc, k2o_calc, color='blue', marker='o', label="Serie Calcalcalina")

# 3. Plotta la seconda serie (Alcalina) sulla stessa figura
#    - Usa plt.scatter()
#    - Assegna un colore rosso ('r')
#    - Usa un marcatore a quadrato ('s')
#    - Aggiungi la label "Serie Alcalina"
plt.scatter(sio2_alk, k2o_alk, color='red', marker='s', label="Serie Alcalina")


# 4. Aggiungi le personalizzazioni del grafico
plt.title("Confronto tra Serie Magmatiche (K2O vs SiO2)")
plt.xlabel("SiO2 (% in peso)")
plt.ylabel("K2O (% in peso)")
plt.grid(True)

# 5. Aggiungi la legenda per spiegare i simboli
plt.legend()

# 6. Mostra il grafico
plt.show()

### **3. Istogrammi: Visualizzare le Distribuzioni con `plt.hist()`**

Fino ad ora abbiamo visualizzato la relazione *tra* due variabili (plot e scatter). Ma cosa succede se vogliamo capire come è distribuita *una singola* variabile?

L'**istogramma** è lo strumento grafico fondamentale per questo scopo. Esso ci mostra la **frequenza** con cui i valori di un set di dati cadono all'interno di una serie di intervalli (chiamati **"bin"** o "classi").

Un istogramma ci permette di rispondere a domande come:
*   Qual è l'intervallo di valori più comune? (Il bin più alto)
*   I dati sono distribuiti in modo simmetrico (es. a campana, come una distribuzione normale) o sono asimmetrici?
*   Sono presenti più "popolazioni" distinte di dati? (Più picchi, una distribuzione bimodale o multimodale)

La funzione chiave è `plt.hist()`, che nella sua forma più semplice accetta l'array di dati come input.

#### **Esercizio Guidato: Analizzare la Distribuzione di un Elemento in Traccia**
Immaginiamo di avere una serie di misurazioni della concentrazione di un elemento in traccia (es. Lantanio, La) da una campagna di campionamento. Vogliamo capire come queste concentrazioni sono distribuite.

In [None]:
# Dati: 100 misurazioni di Lantanio (La) in ppm
# Generiamo dei dati fittizi con due "popolazioni" per rendere il grafico interessante
popolazione1 = np.random.normal(loc=20, scale=5, size=70) # 70 campioni centrati su 20 ppm
popolazione2 = np.random.normal(loc=45, scale=4, size=30) # 30 campioni centrati su 45 ppm
la_ppm = np.concatenate([popolazione1, popolazione2])

# --- Compito: Crea e personalizza un istogramma per i dati di La ---

# 1. Inizializza una figura
plt.figure(figsize=(10, 6))

# 2. Crea l'istogramma
#    - Usa plt.hist() con i dati 'la_ppm'
#    - Prova a cambiare l'argomento 'bins' (es. 10, 20, 30) per vedere come cambia il grafico.
#      Un buon punto di partenza è spesso bins=20.
#    - Aggiungi 'edgecolor='k'' per disegnare un bordo nero attorno alle barre,
#      migliorando la leggibilità.
plt.hist(la_ppm, bins=20, edgecolor='k')

# 3. Aggiungi le personalizzazioni
plt.title("Distribuzione delle Concentrazioni di Lantanio (La)")
plt.xlabel("Lantanio (ppm)")
plt.ylabel("Frequenza (Numero di campioni)")
plt.grid(axis='y', alpha=0.75) # Aggiungiamo una griglia solo sull'asse Y

# 4. Mostra il grafico
plt.show()

## **Salvare i Grafici su File**

Una volta creato un grafico informativo e ben formattato, l'ultimo passo è quasi sempre quello di salvarlo come file immagine (es. PNG, JPG, PDF, SVG).

Matplotlib rende questo processo molto semplice con la funzione `plt.savefig()`.

**Sintassi di base:** `plt.savefig('nome_del_mio_file.png')`

Ci sono due regole fondamentali da ricordare:
1.  La chiamata a `plt.savefig()` deve essere fatta **prima** della chiamata a `plt.show()`. Tipicamente, `plt.show()` cancella la figura corrente dalla memoria dopo averla visualizzata, quindi se si chiama `savefig` dopo, si salverà un'immagine vuota.
2.  Il formato del file viene **inferito automaticamente dall'estensione** che fornite nel nome del file. `.png` è un'ottima scelta per il web e le presentazioni, mentre `.pdf` o `.svg` sono formati vettoriali, ideali per le pubblicazioni in quanto possono essere ingranditi all'infinito senza perdere qualità.

**Personalizzare la Risoluzione**
Per le pubblicazioni, spesso è richiesta un'alta risoluzione. Possiamo specificarla con l'argomento `dpi` (dots per inch). Un valore comune per la stampa è `300`.

`plt.savefig('grafico_alta_risoluzione.png', dpi=300)`

In [None]:
# --- Esempio: Creare e salvare il grafico multi-serie di prima ---

# Dati (li ridefiniamo per rendere la cella indipendente)
sio2_calc = np.array([50, 55, 60, 65, 70])
k2o_calc = np.array([0.8, 1.5, 2.2, 2.8, 3.5])
sio2_alk = np.array([48, 53, 58, 63, 68])
k2o_alk = np.array([1.5, 2.5, 3.8, 5.0, 6.2])

# Inizializza una figura
plt.figure(figsize=(10, 7))

# Plotta le due serie
plt.scatter(sio2_calc, k2o_calc, color='blue', marker='o', label="Serie Calcalcalina")
plt.scatter(sio2_alk, k2o_alk, color='red', marker='s', label="Serie Alcalina")

# Aggiungi le personalizzazioni
plt.title("Confronto tra Serie Magmatiche (K2O vs SiO2)")
plt.xlabel("SiO2 (% in peso)")
plt.ylabel("K2O (% in peso)")
plt.grid(True)
plt.legend()

# --- SALVATAGGIO DELLA FIGURA ---
# Salviamo il grafico in un file PNG ad alta risoluzione.
# Questa operazione creerà un file nella stessa cartella del notebook.
nome_file = 'confronto_serie_magmatiche.png'
plt.savefig(nome_file, dpi=300)

print(f"Grafico salvato con successo nel file: '{nome_file}'")

# Infine, mostriamo il grafico a schermo
plt.show()

## **Un Approccio Più Potente: Lo Stile Object-Oriented e gli Handles**

Finora abbiamo usato l'interfaccia `pyplot` (`plt.*`) in modo "implicito": diciamo a Matplotlib *cosa* fare (`plt.title`, `plt.scatter`), e lui lo fa sulla figura o sugli assi "attivi". Questo è ottimo per grafici rapidi, ma per un controllo più fine e per script complessi, esiste un approccio più potente e robusto: lo **stile object-oriented**.

L'idea è semplice: invece di lasciare che `plt` gestisca tutto implicitamente, chiediamo a Matplotlib di darci un riferimento diretto, una "maniglia" (in inglese **handle**), per gli oggetti che crea.

**Cos'è un Handle?**
Un handle è semplicemente una variabile che "tiene in mano" un oggetto del nostro grafico (la figura, gli assi, una linea, un set di punti, un'etichetta...). Una volta che abbiamo l'handle, possiamo usare i metodi di quell'oggetto per manipolarlo in modo specifico, anche dopo la sua creazione.

**Il punto di partenza: `plt.subplots()`**
Il modo più comune per iniziare con lo stile object-oriented è la funzione `fig, ax = plt.subplots()`. Questa chiamata fa due cose:
1.  Crea una `Figure` (la nostra tela) e un `Axes` (la nostra area di plotting).
2.  Restituisce due handles: il primo per la `Figure` e il secondo per gli `Axes`.

Da questo momento in poi, invece di usare `plt.funzione()`, useremo i metodi direttamente sull'handle degli `Axes` che abbiamo salvato. Ad esempio:
*   `plt.scatter(...)` diventa `ax.scatter(...)`
*   `plt.title(...)` diventa `ax.set_title(...)`
*   `plt.xlabel(...)` diventa `ax.set_xlabel(...)`
*   `plt.legend()` diventa `ax.legend()`

**Nota importante sui nomi delle variabili:**
La sintassi `fig, ax = ...` è una **convenzione universale** nella comunità Python, ma non è obbligatoria. `fig` e `ax` sono semplici **nomi di variabili** (etichette) che noi scegliamo. Avremmo potuto scrivere `mia_finestra, mio_grafico = plt.subplots()` e poi usare `mio_grafico.scatter(...)`. Seguire la convenzione `fig, ax` rende però il nostro codice immediatamente comprensibile a chiunque altro lavori con Matplotlib.

Il vantaggio di questo approccio è che ora abbiamo il controllo completo. Se avessimo più subplot, avremmo più handles (`ax1`, `ax2`, ...) e potremmo decidere esattamente su quale plottare.

Vediamo come riscrivere l'esempio delle serie magmatiche usando questo approccio e come usare gli handles per modificare un grafico dopo averlo creato.

In [None]:
# --- Stile Object-Oriented: Creazione del Grafico Iniziale ---

# Dati delle serie magmatiche
sio2_calc = np.array([50, 55, 60, 65, 70])
k2o_calc = np.array([0.8, 1.5, 2.2, 2.8, 3.5])
sio2_alk = np.array([48, 53, 58, 63, 68])
k2o_alk = np.array([1.5, 2.5, 3.8, 5.0, 6.2])

# 1. Creiamo Figure e Axes e otteniamo i loro handles
# Queste variabili 'fig' e 'ax' saranno disponibili anche nelle celle successive
fig, ax = plt.subplots(figsize=(10, 7))

# 2. Creiamo gli scatter plot usando 'ax' e catturiamo i loro handles
handle_calc = ax.scatter(sio2_calc, k2o_calc, color='blue', marker='o', s=80, label="Serie Calcalcalina")
handle_alk = ax.scatter(sio2_alk, k2o_alk, color='red', marker='s', s=80, label="Serie Alcalina")

plt.show()

In [None]:
# 3. Personalizziamo il grafico usando i metodi di 'ax'
ax.set_title("Grafico Iniziale (Stile Object-Oriented)")
ax.set_xlabel("SiO2 (% in peso)")
ax.set_ylabel("K2O (% in peso)")
ax.grid(True)
ax.legend()

fig



### **Perché terminiamo la cella con `fig`?**

Nella cella precedente, abbiamo concluso il codice con la variabile `fig` da sola sull'ultima riga. Questo non è un comando di Matplotlib, ma un "trucco" specifico degli ambienti interattivi come Jupyter e Colab.

**Come funziona:**
Quando una cella di codice viene eseguita, Jupyter controlla il valore dell'ultima riga. Se questo valore è un oggetto che sa come essere "visualizzato" (come una figura Matplotlib, un DataFrame Pandas, un'immagine, ecc.), Jupyter lo renderizza automaticamente come output della cella.

**In pratica:**
*   `fig` è il nostro handle per l'intero oggetto `Figure`.
*   Mettendolo alla fine, stiamo dicendo a Jupyter: "L'output finale di questa cella è questa figura. Per favore, mostrala."

Questo ci permette di vedere lo stato del nostro grafico passo dopo passo, senza usare `plt.show()`, che "finalizzerebbe" la figura impedendoci di modificarla ulteriormente nelle celle successive. È la tecnica standard per costruire o modificare un grafico in modo incrementale in un notebook.

In [None]:
# --- Manipolazione Post-Creazione tramite Handles (Parte 1) ---

# In questa cella, modifichiamo il grafico creato nelle celle precedenti.
# Le variabili 'ax', 'fig', 'handle_calc' e 'handle_alk' esistono ancora.

print("Modifico l'aspetto della prima serie (blu) usando il suo handle...")

# Cambiamo il colore dei bordi dei punti e la loro dimensione (size)
handle_calc.set_edgecolor('black')
handle_calc.set_linewidth(1.5)
handle_calc.set_sizes([200, 200, 200, 200, 200]) # Aumenta la dimensione dei punti

# Aggiorniamo il titolo per riflettere la modifica
ax.set_title("Grafico dopo la Modifica della Prima Serie")

# Visualizziamo di nuovo la stessa figura 'fig' per vedere le modifiche
fig

In [None]:
# --- Manipolazione Post-Creazione tramite Handles (Parte 2) ---

# Continuiamo a lavorare sulla stessa figura.
print("Rimuovo la seconda serie (rossa) usando il suo handle...")

# Usiamo l'handle della serie rossa per eliminarla completamente dal grafico.
handle_alk.remove()

# Aggiorniamo il titolo un'ultima volta
ax.set_title("Grafico Finale dopo la Rimozione della Seconda Serie")

# Poiché abbiamo rimosso una serie, è buona pratica rigenerare la legenda
ax.legend()

# A questo punto, il nostro lavoro sulla figura è terminato.
# Possiamo visualizzarla un'ultima volta in Jupyter...
fig

# ...e/o salvarla e chiuderla definitivamente con plt.show()
# plt.savefig("grafico_finale_handles.png")
# plt.show() # Dopo plt.show(), non potremmo più modificare la figura.

## **Riepilogo della Lezione 5**

In questa lezione abbiamo completato il nostro percorso introduttivo su NumPy e abbiamo affrontato i fondamenti della visualizzazione dati con Matplotlib.

**Cosa abbiamo imparato:**
-   A usare l'**indicizzazione booleana** (`masking`) per filtrare dati in NumPy in modo potente e flessibile.
-   L'importanza di **Matplotlib** e la sua struttura di base (`Figure` e `Axes`).
-   Come creare e personalizzare tre tipi di grafici fondamentali:
    -   **Grafici a linee** (`plt.plot`) per dati sequenziali.
    -   **Grafici a dispersione** (`plt.scatter`) per relazioni tra variabili.
    -   **Istogrammi** (`plt.hist`) per analisi di distribuzione.
-   Come gestire **grafici multi-serie** con colori, marker e legende.
-   Come **salvare** i nostri grafici in file per condividerli.

Nelle prossime lezioni, useremo queste competenze come base per analizzare dati più complessi con la libreria **Pandas**.

## **Esercizio Conclusivo: Analisi Morfometrica di Stromboli**

Ora uniamo tutto ciò che abbiamo imparato in questa lezione – caricamento dati, slicing, calcolo di gradienti, masking booleano e plotting – per eseguire un'analisi morfometrica di un DEM reale dell'isola di Stromboli.

Questo esercizio è già svolto e commentato, e serve a mostrare un flusso di lavoro completo, tipico dell'analisi di dati geospaziali.

**Obiettivo:**
A partire da una topobatimetria di Stromboli (risoluzione 50m), eseguiremo due analisi:
1.  **Analisi di un Profilo:** Estrarremo un transetto Est-Ovest che passa attraverso l'area sommitale e ne visualizzeremo il profilo altimetrico.
2.  **Analisi Statistica delle Pendenze:** Calcoleremo la pendenza su tutta l'area e creeremo un istogramma della distribuzione delle pendenze, ma **solo per le aree emerse** (con elevazione sopra il livello del mare).

**Dati:**
Useremo la funzione `read_asc` per caricare un DEM dell'area di Stromboli direttamente da un repository GitHub.

In [None]:
# --- PARTE 1: ESTRARRE E VISUALIZZARE UN PROFILO TOPOGRAFICO ---

# 1. Caricamento del DEM da URL
# Questo DEM rappresenta la topobatimetria di Stromboli
url_stromboli = 'https://raw.githubusercontent.com/demichie/CorsoIntroduzionePython/refs/heads/main/DATA/stromboliDEM.asc'
print("Caricamento del DEM di Stromboli da GitHub...")

try:
    dem, header = read_asc(url_stromboli)
    print("DEM caricato con successo.")
    print(f"Dimensioni: {dem.shape[1]} (colonne) x {dem.shape[0]} (righe)")
    print(f"Risoluzione: {header['cellsize']} metri/cella")

    # 2. Estrazione del Profilo (Transetto)
    # Vogliamo estrarre una riga che passi per l'area sommitale.
    # Scegliamo una riga rappresentativa (es. la riga all'indice 200).
    riga_profilo_idx = 200
    profilo = dem[riga_profilo_idx, :]
    print(f"\nEstratto profilo topografico dalla riga {riga_profilo_idx}.")

    # 3. Creazione dell'Asse delle Distanze
    # La lunghezza totale del profilo è il numero di celle per la risoluzione.
    n_colonne = header['ncols']
    cellsize = header['cellsize']
    lunghezza_totale_m = n_colonne * cellsize
    distanza_m = np.linspace(0, lunghezza_totale_m, int(n_colonne))

    # 4. Visualizzazione del Profilo
    plt.figure(figsize=(12, 6))
    plt.plot(distanza_m, profilo, color='black')

    # Riempiamo l'area sotto il livello del mare (z=0) di blu
    plt.fill_between(distanza_m, profilo, 0, where=profilo < 0, color='lightblue', alpha=0.5)

    plt.title(f"Profilo Topografico Est-Ovest di Stromboli (riga {riga_profilo_idx})")
    plt.xlabel("Distanza (m)")
    plt.ylabel("Elevazione (m s.l.m.)")
    plt.grid(True, linestyle='--', alpha=0.6)
    plt.axhline(0, color='blue', linestyle='-', linewidth=1.5) # Aggiunge la linea del livello del mare

    plt.show()

except Exception as e:
    print(f"ERRORE: Impossibile completare l'analisi del profilo. Dettagli: {e}")

In [None]:
# --- 1. Caricamento del DEM Reale ---
try:
    url_stromboli = 'https://raw.githubusercontent.com/demichie/CorsoIntroduzionePython/refs/heads/main/DATA/stromboliDEM.asc'
    dem, header = read_asc(url_stromboli)
    print("File DEM caricato con successo.")
    print(f"Dimensioni: {int(header['ncols'])} x {int(header['nrows'])} pixels")
    print(f"Dimensione della cella: {header['cellsize']} metri")
except FileNotFoundError:
    print("ERRORE: File 'dem.asc' non trovato.")
    print("Assicurati di aver caricato il file DEM nel tuo ambiente di lavoro.")
    dem = None # Imposta dem a None per saltare i calcoli successivi

if dem is not None:
    # --- 2. Calcolo del Gradiente ---
    # Per np.gradient, abbiamo bisogno di sapere la spaziatura tra i punti,
    # che è la dimensione della cella.
    cellsize = header['cellsize']
    dZ_dy, dZ_dx = np.gradient(dem, cellsize, cellsize)

    # --- 3. Calcolo dei Vettori Normali ---
    nx = -dZ_dx
    ny = -dZ_dy
    nz = np.ones_like(dem)
    norm = np.sqrt(nx**2 + ny**2 + nz**2)
    nx /= norm
    ny /= norm
    nz /= norm

    # --- 4. Calcolo dell'Hillshade ---
    azimuth_deg = 315.0
    zenith_deg = 45.0
    azimuth_rad = np.deg2rad(azimuth_deg)
    zenith_rad = np.deg2rad(zenith_deg)

    luce_x = np.sin(azimuth_rad) * np.sin(zenith_rad)
    luce_y = np.cos(azimuth_rad) * np.sin(zenith_rad)
    luce_z = np.cos(zenith_rad)
    luce = np.array([luce_x, luce_y, luce_z])

    hillshade = np.dot(np.stack([nx, ny, nz], axis=-1), luce)
    hillshade = np.maximum(0, hillshade)

    # --- 5. Visualizzazione ---
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 7))

    ax1.set_title("DEM Reale")
    im1 = ax1.imshow(dem, cmap='terrain')
    fig.colorbar(im1, ax=ax1, label="Elevazione (m)")

    ax2.set_title(f"Hillshade (Luce da {azimuth_deg}° Az, {zenith_deg}° Zen)")
    ax2.imshow(hillshade, cmap='gray')

    plt.tight_layout()
    plt.show()

In [None]:
# --- PARTE 1: ESTRARRE E VISUALIZZARE UN PROFILO TOPOGRAFICO ---

# 1. Caricamento del DEM da URL
# Questo DEM rappresenta la topobatimetria di Stromboli

try:

    # 2. Estrazione del Profilo (Transetto)
    # Vogliamo estrarre una riga che passi per l'area sommitale.
    # Scegliamo una riga rappresentativa (es. la riga all'indice 200).
    riga_profilo_idx = 200
    profilo = dem[riga_profilo_idx, :]
    print(f"\nEstratto profilo topografico dalla riga {riga_profilo_idx}.")

    # 3. Creazione dell'Asse delle Distanze
    # La lunghezza totale del profilo è il numero di celle per la risoluzione.
    n_colonne = header['ncols']
    cellsize = header['cellsize']
    lunghezza_totale_m = n_colonne * cellsize
    distanza_m = np.linspace(0, lunghezza_totale_m, int(n_colonne))

    # 4. Visualizzazione del Profilo
    plt.figure(figsize=(12, 6))
    plt.plot(distanza_m, profilo, color='black')

    # Riempiamo l'area sotto il livello del mare (z=0) di blu
    plt.fill_between(distanza_m, profilo, 0, where=profilo < 0, color='lightblue', alpha=0.5)

    plt.title(f"Profilo Topografico Est-Ovest di Stromboli (riga {riga_profilo_idx})")
    plt.xlabel("Distanza (m)")
    plt.ylabel("Elevazione (m s.l.m.)")
    plt.grid(True, linestyle='--', alpha=0.6)
    plt.axhline(0, color='blue', linestyle='-', linewidth=1.5) # Aggiunge la linea del livello del mare

    plt.show()

except Exception as e:
    print(f"ERRORE: Impossibile completare l'analisi del profilo. Dettagli: {e}")

In [None]:
# --- PARTE 2: ANALISI DELLA DISTRIBUZIONE DELLE PENDENZE ---

try:
    # Controlliamo se il DEM è stato caricato correttamente nella cella precedente
    if 'dem' in locals() and dem is not None:
        print("\nInizio analisi delle pendenze...")

        # 1. Calcolo della Pendenza
        # Calcoliamo il gradiente lungo x e y, usando la dimensione della cella.
        dy, dx = np.gradient(dem, header['cellsize'])

        # La pendenza (slope) è la magnitudine del vettore gradiente.
        slope = np.sqrt(dx**2 + dy**2)

        # Convertiamo la pendenza (che è un rapporto adimensionale) in gradi.
        slope_deg = np.rad2deg(np.arctan(slope))
        print("Calcolo della pendenza in gradi completato.")

        # 2. Masking delle Aree Emerse
        # Creiamo una maschera booleana per tutte le celle con elevazione > 0.
        mask_emersi = dem > 0

        # Usiamo la maschera per selezionare i valori di pendenza solo dove l'elevazione è positiva.
        pendenze_emerse = slope_deg[mask_emersi]

        print(f"Punti totali nel DEM: {dem.size}")
        print(f"Punti analizzati (aree emerse): {pendenze_emerse.size}")

        # 3. Visualizzazione dell'Istogramma
        plt.figure(figsize=(10, 6))

        # Creiamo l'istogramma solo con i dati delle aree emerse.
        plt.hist(pendenze_emerse, bins=50, edgecolor='black', alpha=0.8)

        plt.title("Distribuzione delle Pendenze nelle Aree Emerse di Stromboli (z > 0)")
        plt.xlabel("Pendenza (gradi)")
        plt.ylabel("Frequenza (Numero di celle)")
        plt.grid(axis='y', linestyle='--', alpha=0.6)

        # Aggiungiamo una linea verticale per indicare la pendenza media
        pendenza_media = np.mean(pendenze_emerse)
        plt.axvline(pendenza_media, color='red', linestyle='--', linewidth=2, label=f'Media: {pendenza_media:.2f}°')
        plt.legend()

        plt.show()

except NameError:
     print("ERRORE: La variabile 'dem' non è stata definita. Esegui la cella precedente.")