### **Lezione Dettagliata sul Time Series (Serie Temporali)**

Una **serie temporale** è una sequenza di dati raccolti in ordine cronologico, generalmente a intervalli regolari, come ad esempio i prezzi delle azioni, le temperature giornaliere o i ricavi delle vendite mensili. L'aspetto distintivo di una serie temporale è che i dati sono ordinati nel tempo, il che permette di eseguire analisi specifiche per identificare **andamenti**, **tendenze**, **pattern** e **variazioni stagionali**.

#### 1. **Caratteristiche delle Serie Temporali**

Le serie temporali sono particolarmente utili per osservare come i dati evolvono nel tempo e per prevedere futuri andamenti sulla base dei dati storici. Le principali caratteristiche di una serie temporale includono:

- **Trend (Tendenza):** Un trend rappresenta il cambiamento a lungo termine del dato nel tempo. Un trend positivo indica una crescita costante, mentre uno negativo rappresenta una diminuzione dei valori nel periodo osservato.
  - Esempio: L'aumento continuo dei prezzi di un prodotto nel corso di un anno.
  
- **Stagionalità:** Le serie temporali possono presentare variazioni periodiche che si ripetono a intervalli regolari. La stagionalità può essere giornaliera, settimanale, mensile o annuale, a seconda dei dati.
  - Esempio: Le vendite di gelati che aumentano durante i mesi estivi e diminuiscono in inverno.

- **Ciclicità:** A differenza della stagionalità, la ciclicità si riferisce a variazioni che non seguono una periodicità fissa, ma si verificano a intervalli irregolari.
  - Esempio: La crescita economica che può fluttuare ciclicamente in base alle politiche economiche o agli shock esterni.

- **Rumore (Noise):** In una serie temporale, il rumore è la parte imprevedibile o casuale dei dati, che non può essere facilmente spiegata da trend o stagionalità.

#### 2. **Tipologie di Serie Temporali**

Esistono vari tipi di serie temporali, a seconda del tipo di variabile che viene osservata:

- **Serie Temporali Univariate:** Sono composte da un solo tipo di dato osservato nel tempo.
  - Esempio: Il prezzo di un'azione giornaliera.
  
- **Serie Temporali Multivariate:** Comprendono più variabili misurate nel tempo, che possono essere correlate tra loro.
  - Esempio: I tassi di disoccupazione, l'inflazione e il PIL di un paese, misurati ogni trimestre.

#### 3. **Analisi delle Serie Temporali**

L'analisi delle serie temporali si concentra sullo studio dei dati storici per estrapolare informazioni utili per fare previsioni future. Esistono diversi approcci analitici:

- **Decomposizione delle Serie Temporali:** La decomposizione aiuta a separare le componenti principali della serie temporale (trend, stagionalità e residui) per analizzare ogni parte separatamente. Si possono usare modelli come la decomposizione additiva o moltiplicativa.

- **Modelli di Previsione:** Uno degli obiettivi principali nell'analisi delle serie temporali è prevedere valori futuri. Tra i modelli più utilizzati troviamo:
  - **ARIMA (AutoRegressive Integrated Moving Average):** Un modello statistico che combina autoregressione, differenziazione e media mobile per fare previsioni.
  - **Modelli esponenziali (ETS):** Utilizzano medie ponderate dei dati passati con un'esponenziale di smorzamento per modellare il trend e la stagionalità.
  - **Modelli di rete neurale:** Tecniche di apprendimento automatico che possono essere applicate alle serie temporali, come LSTM (Long Short-Term Memory), che è particolarmente efficace nell'apprendimento di sequenze temporali complesse.

#### 4. **Preprocessing delle Serie Temporali**

Il preprocessing dei dati è una fase fondamentale nell'analisi delle serie temporali. Le operazioni comuni includono:

- **Rimozione di valori mancanti:** Gestire i valori nulli o mancanti che potrebbero compromettere le previsioni future.
- **Smoothing (Lisciamento):** Utilizzato per ridurre il rumore nei dati e evidenziare i trend e le stagionalità.
- **Stazionarietà:** Per l'analisi tramite modelli statistici come ARIMA, è importante che i dati siano stazionari, cioè che le loro proprietà non cambino nel tempo. Se i dati non sono stazionari, si utilizzano tecniche come la differenziazione per renderli stazionari.

#### 5. **Applicazioni delle Serie Temporali**

Le serie temporali sono utilizzate in vari settori per prendere decisioni strategiche basate sui dati temporali. Ecco alcuni esempi:

- **Finanza:** Analisi dei prezzi delle azioni per prevedere i trend futuri del mercato.
- **Economia:** Studio delle fluttuazioni economiche per analizzare il PIL, il tasso di disoccupazione e l'inflazione.
- **Sanità:** Analisi dei tassi di mortalità o delle malattie per fare previsioni e pianificare risorse sanitarie.
- **Meteorologia:** Previsione del tempo, con analisi di variabili come temperatura, umidità e precipitazioni.
- **Vendite e Marketing:** Previsione delle vendite stagionali o dei ricavi futuri per ottimizzare la gestione delle scorte.

#### 6. **Esempio Pratico**

Immagina di avere una serie temporale delle vendite di un prodotto negli ultimi 12 mesi. Analizzando i dati, possiamo identificare:

- Un trend crescente, indicante che il prodotto sta diventando sempre più popolare.
- Una stagionalità, con picchi nelle vendite durante i mesi estivi, dovuti alla domanda più alta.
- Eventuali cicli economici che potrebbero influenzare il comportamento delle vendite in periodi particolari.

Usando questa analisi, possiamo applicare un modello di previsione per stimare le vendite dei prossimi mesi, prendere decisioni strategiche sulla produzione e ottimizzare la distribuzione.

---

In sintesi, le **serie temporali** sono strumenti potenti per l'analisi e la previsione dei dati, permettendo di comprendere i pattern storici e fare previsioni informate sul futuro.

Ecco la spiegazione di ogni riga del codice Python che hai fornito:

### Importazioni:
```python
from datetime import datetime, timedelta
import pandas as pd
```
- `from datetime import datetime, timedelta`: Questa riga importa due classi dal modulo `datetime`:
  - `datetime`: per lavorare con data e ora.
  - `timedelta`: per rappresentare una differenza temporale (ad esempio, aggiungere o sottrarre giorni, ore, minuti).
  
- `import pandas as pd`: Qui viene importato il modulo `pandas`, che è una libreria potente per la manipolazione di dati in Python, in particolare per lavorare con strutture di dati come `DataFrame`.

### Creazione di una variabile `now` con la data e l'ora correnti:
```python
now = datetime.now()
now.day
```
- `now = datetime.now()`: Qui viene creata una variabile chiamata `now`, che contiene la data e l'ora attuali (in base al momento in cui il codice viene eseguito).
- `now.day`: Viene estratto solo il giorno (in formato numerico, da 1 a 31) dalla data e ora corrente.

### Creazione di una data personalizzata:
```python
custom_date = datetime(2023, 5, 17, 15, 30, 0)
custom_date.strftime('%d-%m-%y')
```
- `custom_date = datetime(2023, 5, 17, 15, 30, 0)`: Crea una variabile `custom_date` che rappresenta una data personalizzata (17 maggio 2023 alle 15:30:00).
- `custom_date.strftime('%d-%m-%y')`: Usa il metodo `strftime` per formattare la data in un formato specifico (`%d-%m-%y`), dove:
  - `%d`: giorno (due cifre)
  - `%m`: mese (due cifre)
  - `%y`: anno (due cifre)

### Parsing di una stringa in un oggetto `datetime`:
```python
date_str = "17-05-2023 21:15:13"
datetime.strptime(date_str, '%d-%m-%Y %H:%M:%S')
```
- `date_str = "17-05-2023 21:15:13"`: Qui definisci una stringa che rappresenta una data e ora.
- `datetime.strptime(date_str, '%d-%m-%Y %H:%M:%S')`: Usa `strptime` (string parse time) per convertire la stringa `date_str` in un oggetto `datetime` basato sul formato che hai specificato (`%d-%m-%Y %H:%M:%S`):
  - `%d`: giorno (due cifre)
  - `%m`: mese (due cifre)
  - `%Y`: anno (quattro cifre)
  - `%H`: ore (24 ore)
  - `%M`: minuti
  - `%S`: secondi

### Aggiunta di un intervallo temporale (100 ore):
```python
now + timedelta(hours=100)
```
- `now + timedelta(hours=100)`: Aggiunge 100 ore all'oggetto `now` (data e ora correnti). `timedelta(hours=100)` crea una differenza temporale di 100 ore.

### Aggiunta di mesi a una data:
```python
from datetime import date
from dateutil.relativedelta import relativedelta
date(2020, 5, 15) + relativedelta(months=5)
```
- `from datetime import date`: Importa solo la classe `date` dal modulo `datetime` (senza ore o minuti).
- `from dateutil.relativedelta import relativedelta`: Importa `relativedelta` dalla libreria `dateutil`, che permette di fare operazioni di data più complesse, come aggiungere mesi, anni, ecc.
- `date(2020, 5, 15) + relativedelta(months=5)`: Aggiunge 5 mesi alla data `15 maggio 2020`. Il risultato sarà `15 ottobre 2020`.

### Conversione di un timestamp Unix:
```python
unix = 17030299383
datetime.utcfromtimestamp(unix)
```
- `unix = 17030299383`: Definisce un timestamp Unix (il numero di secondi trascorsi dal 1 gennaio 1970).
- `datetime.utcfromtimestamp(unix)`: Converte il timestamp Unix in un oggetto `datetime` che rappresenta la data e ora in formato UTC (tempo universale coordinato).

### Creazione di un oggetto `datetime`:
```python
datetime.datetime(2509, 9, 1, 22, 43, 3)
```
- `datetime.datetime(2509, 9, 1, 22, 43, 3)`: Crea un oggetto `datetime` che rappresenta una data e ora nel futuro (1 settembre 2509, alle 22:43:03). La sintassi `datetime.datetime` viene utilizzata perché `datetime` è sia un modulo che una classe al suo interno.

Questo codice mostra vari metodi di manipolazione delle date e degli orari in Python utilizzando la libreria `datetime`, insieme alla libreria `pandas` per gestire i dati in formato tabellare.

Ecco una spiegazione riga per riga del codice che hai fornito, relativo alle operazioni su serie temporali in pandas:

### 1. `pd.Timestamp("2024-02-11")`
- Crea un oggetto `Timestamp`, che rappresenta un'unità di tempo (una data) specificata. Qui stiamo creando un timestamp per il 11 febbraio 2024.

### 2. `pd.Timestamp.now(tz="UTC")`
- Restituisce il timestamp corrente nel fuso orario UTC.

### 3. `date_range = pd.date_range(start="2024-01-01", periods=12, freq="ME")`
- Crea una serie di date partendo dal 1° gennaio 2024 per un totale di 12 periodi, con una frequenza mensile (fine mese). La frequenza `"ME"` significa "Month End", ossia l'ultimo giorno del mese.

### 4. `date_range.to_period('M').to_timestamp('M')`
- Convertiamo l'intervallo di tempo in un periodo mensile (`to_period('M')`), e poi lo riconvertiamo in un oggetto `Timestamp` (quindi un oggetto che rappresenta un'unità di tempo) con la frequenza mensile (`to_timestamp('M')`).
- Questo trasforma il `DatetimeIndex` di fine mese in un `DatetimeIndex` con i timestamp all'inizio del mese successivo.

### 5. Output del codice precedente:
```python
DatetimeIndex(['2024-01-31', '2024-02-29', '2024-03-31', '2024-04-30',
               '2024-05-31', '2024-06-30', '2024-07-31', '2024-08-31',
               '2024-09-30', '2024-10-31', '2024-11-30', '2024-12-31'],
              dtype='datetime64[ns]', freq='ME')
```
- Qui vengono visualizzati i 12 timestamp generati, con frequenza "Month End" e l'anno 2024.

### 6. `data = {"date_str": ["2023-01-01", "2023-06-15", "2023-12-31"]}`
- Creiamo un dizionario con delle date in formato stringa, che successivamente verranno convertite in oggetti `datetime`.

### 7. `df = pd.DataFrame(data)`
- Creiamo un DataFrame pandas a partire dal dizionario `data`.

### 8. `df['date'] = pd.to_datetime(df["date_str"])`
- Converte le stringhe di data nella colonna `date_str` in oggetti `datetime` (data di tipo pandas), e li memorizza nella nuova colonna `date`.

### 9. `df["date_utc"] = df["date"].dt.tz_localize("UTC")`
- Localizza la data nel fuso orario UTC. Questo non cambia il valore della data, ma le aggiunge un'informazione sul fuso orario (UTC).

### 10. `df["date_ny"] = df["date_utc"].dt.tz_convert("America/New_York")`
- Converte il fuso orario da UTC a "America/New_York", ossia dal fuso orario UTC a quello di New York (che può includere anche l'orario legale).

### 11. `df["date_ny"]`
- Visualizza la colonna `date_ny`, che contiene le date convertite al fuso orario di New York.

### 12. `df[(df["date"] >= "2023-01-01") & (df['date'] < "2023-06-30")]`
- Seleziona le righe del DataFrame `df` dove la data è maggiore o uguale al 1° gennaio 2023 e inferiore al 30 giugno 2023.

### 13. `df["year"] = df['date'].dt.year`
- Estrae l'anno dalla colonna `date` e lo memorizza in una nuova colonna `year`.

### 14. `(df["date"] - df["date"].min()).dt.days`
- Calcola il numero di giorni trascorsi dalla data minima nel DataFrame (la data più vecchia) per ogni riga. Restituisce il numero di giorni trascorsi come un oggetto `timedelta` che può essere rappresentato in giorni.

### 15. `date_range = pd.date_range(start="2023-01-01", periods=365, freq="D")`
- Crea un intervallo di 365 giorni a partire dal 1° gennaio 2023, con frequenza giornaliera (`"D"`).

### 16. `data = {"date": date_range, "value": np.random.randint(10, 100, size=len(date_range))}`
- Crea un dizionario con due chiavi:
  - `"date"`: la serie di date generate al punto precedente.
  - `"value"`: una serie di numeri casuali tra 10 e 100, della stessa lunghezza dell'intervallo di date.

### 17. `df = pd.DataFrame(data)`
- Crea un DataFrame pandas a partire dal dizionario `data`.

### 18. `df = df.set_index('date')`
- Imposta la colonna `date` come indice del DataFrame. Questo è utile per operazioni su serie temporali.

### 19. `df.asfreq('h')`
- Cambia la frequenza del DataFrame a "oraria" (`'h'`), senza aggiungere o rimuovere dati. Pandas assegnerà valori `NaN` per le date mancanti (ad esempio se la frequenza originale era giornaliera).

### 20. `df.resample(rule='YE').sum()`
- Effettua il campionamento dei dati con frequenza annuale (`'YE'`), somma i valori per ogni anno e restituisce un nuovo DataFrame.

### 21. `df.groupby(pd.Grouper(freq="W-MON")).mean()`
- Raggruppa i dati per settimana, con il primo giorno della settimana che cade il lunedì (`"W-MON"`), e calcola la media dei valori in ogni gruppo.

### 22. `date_range = pd.date_range(start="2023-01-01", periods=12, freq="ME")`
- Crea nuovamente un intervallo di 12 date, ognuna corrispondente alla fine di un mese dell'anno 2023.

### 23. `sales = np.random.randint(100, 500, size=len(date_range))`
- Genera una serie di numeri casuali tra 100 e 500, utilizzata per simulare le vendite mensili.

### 24. `df = pd.DataFrame({"date": date_range, "sales": sales}).set_index("date")`
- Crea un DataFrame con le colonne `date` e `sales`, e imposta `date` come indice.

### 25. `print(df["sales"])`
- Stampa la colonna `sales` del DataFrame, che contiene i valori delle vendite.

### 26. `print(df["sales"].shift(1))`
- Restituisce una nuova colonna che contiene i valori di `sales` spostati di una riga in avanti, lasciando un `NaN` per la prima riga.

### 27. `print(df["sales"].shift(-1))`
- Restituisce una nuova colonna che contiene i valori di `sales` spostati di una riga indietro, lasciando un `NaN` per l'ultima riga.

Questa è una panoramica delle operazioni principali su serie temporali in pandas. Se hai domande su qualche passaggio specifico, fammelo sapere!

Ecco una spiegazione dettagliata, riga per riga, del codice e dei concetti descritti:

### Importazione delle librerie:
```python
import numpy as np
import warnings
warnings.simplefilter('ignore', UserWarning)
```
1. `import numpy as np`: Importa la libreria `numpy` e la abbrevia con il nome `np`. `numpy` è una libreria molto utilizzata in Python per la manipolazione di array numerici e operazioni matematiche.
2. `import warnings`: Importa la libreria `warnings` che permette di gestire i messaggi di avviso durante l'esecuzione del codice.
3. `warnings.simplefilter('ignore', UserWarning)`: Imposta il filtro per ignorare i messaggi di avviso di tipo `UserWarning`. Questo viene fatto per non visualizzare eventuali avvisi generati durante l'esecuzione del codice.

### Impostazione del seme per la riproducibilità:
```python
np.random.seed(42)
```
4. `np.random.seed(42)`: Imposta un seme (seed) per il generatore di numeri casuali. Utilizzare un seme fisso (42 in questo caso) assicura che ogni volta che il codice viene eseguito, i numeri casuali generati siano gli stessi, garantendo la riproducibilità dei risultati.

### Creazione di una serie temporale (date range):
```python
date_range = pd.date_range(start="2022-01-01", periods=730, freq="D")
```
5. `pd.date_range(start="2022-01-01", periods=730, freq="D")`: Crea una sequenza di date partendo dal 1 gennaio 2022, con 730 osservazioni (due anni) e con una frequenza giornaliera (`freq="D"`). Ogni data rappresenta un giorno, e ci sono due anni di dati.

### Generazione della serie temporale con solo stagionalità:
```python
seasonality = 100 + 10 * np.sin(2 * np.pi * date_range.dayofyear / 365) + np.random.normal(0, 5, 730)
```
6. `seasonality`: Questa serie rappresenta una variazione stagionale. La formula `10 * np.sin(2 * np.pi * date_range.dayofyear / 365)` genera un ciclo sinusoidale, che rappresenta un cambiamento stagionale, ripetendosi ogni anno (365 giorni). La parte `+ np.random.normal(0, 5, 730)` aggiunge un po' di rumore casuale alla serie, con una deviazione standard di 5.

### Generazione della serie temporale con solo trend:
```python
trend = np.linspace(15, 18, 730) + np.random.normal(0, 0.2, 730)
```
7. `trend`: Questa serie rappresenta una tendenza (trend) che cresce linearmente da 15 a 18 in due anni (730 giorni), utilizzando `np.linspace(15, 18, 730)`. Alla tendenza viene aggiunto un rumore casuale con una deviazione standard di 0,2 (`+ np.random.normal(0, 0.2, 730)`), per simulare una leggera variabilità.

### Generazione della serie temporale con sia trend che stagionalità:
```python
trend_seasonality = (50 + 0.05 * np.arange(730) +
                     20 * np.sin(2 * np.pi * date_range.dayofyear / 365) +
                     np.random.normal(0, 7, 730))
```
8. `trend_seasonality`: In questa serie, abbiamo sia un trend che una stagionalità. Il trend è rappresentato da `50 + 0.05 * np.arange(730)`, che cresce linearmente di 0,05 unità al giorno. La stagionalità è simile a quella precedente, ma con una maggiore ampiezza di oscillazione, moltiplicata per 20 anziché 10. Anche qui, il rumore casuale viene aggiunto con una deviazione standard di 7.

### Generazione della serie temporale con solo rumore bianco:
```python
white_noise = np.random.normal(0, 1, 730)
```
9. `white_noise`: Questa serie rappresenta solo rumore bianco, ossia dati casuali senza alcun pattern strutturato. Ogni valore è estratto da una distribuzione normale con media 0 e deviazione standard 1.

### Creazione del DataFrame:
```python
df = pd.DataFrame({
    "Date": date_range,
    "Seasonality": seasonality,
    "Trend": trend,
    "Trend + Seasonality": trend_seasonality,
    "White Noise": white_noise
})
df.set_index("Date", inplace=True)
```
10. `pd.DataFrame(...)`: Crea un DataFrame (una struttura dati simile a una tabella) contenente le date e le quattro serie temporali appena create.
11. `df.set_index("Date", inplace=True)`: Imposta la colonna "Date" come indice del DataFrame, così che ogni riga sia identificata dalla data corrispondente.

### Creazione dei grafici:
```python
plt.figure(figsize=(12, 8))

plt.subplot(2, 2, 1)
plt.plot(df.index, df["Trend"], label="", color="red")
plt.title("Time Series with Trend")
plt.legend()
```
12. `plt.figure(figsize=(12, 8))`: Crea una figura con dimensioni specificate (12x8 pollici).
13. `plt.subplot(2, 2, 1)`: Imposta il primo sottogruppo di grafici (2 righe e 2 colonne, il grafico è il primo).
14. `plt.plot(df.index, df["Trend"], label="", color="red")`: Disegna il grafico della serie "Trend" in rosso.
15. `plt.title("Time Series with Trend")`: Imposta il titolo del grafico.
16. `plt.legend()`: Aggiunge una legenda al grafico (anche se in questo caso non è presente alcuna etichetta).

Il codice continua in modo simile per gli altri grafici, mostrando la serie con solo stagionalità, la combinazione di trend e stagionalità, e infine il rumore bianco.

### Risposta alla domanda:

**Q: Una time series può avere più periodi stagionali? Esempio?**

Sì, una serie temporale può avere più periodi stagionali se è influenzata da vari fattori stagionali con periodi differenti. Ad esempio, una serie temporale che rappresenta le vendite di un negozio potrebbe avere una stagionalità legata alle festività natalizie (periodo di dicembre) e un'altra legata alla stagione estiva (giugno-luglio-agosto), con due cicli stagionali distinti.



# Autocorrelazione (ACF) 
L'autocorrelazione è una misura statistica che descrive la relazione lineare tra i valori ritardati (lagged values) di una serie temporale. In altre parole, ci aiuta a capire quanto un valore passato influenza il valore attuale della serie.

1. Importazione della funzione per l'Autocorrelazione



from statsmodels.graphics.tsaplots import plot_acf

🔹 Qui stiamo importando la funzione plot_acf dal modulo statsmodels.graphics.tsaplots.

🔹 plot_acf è una funzione che ci permette di visualizzare il grafico dell'Autocorrelation Function (ACF), utile per identificare pattern di trend e stagionalità nei dati.


2. Creazione di un layout di grafici con Matplotlib

fig, axes = plt.subplots(2, 2, figsize=(12, 8))

🔹 plt.subplots(2, 2) crea una griglia di 2 righe e 2 colonne per visualizzare 4 grafici distinti.

🔹 figsize=(12, 8) imposta la dimensione della figura a 12 pollici di larghezza e 8 di altezza.

🔹 fig rappresenta l'intera figura, mentre axes è un array che contiene i singoli assi (grafici) all'interno della griglia.


3. Autocorrelazione della tendenza (Trend)

plot_acf(df["Trend"], lags=365, alpha=None, zero=False, ax=axes[0, 0])

axes[0, 0].set_title("ACF: Trend Only")

🔹 plot_acf(df["Trend"], lags=365, ...) calcola l'ACF della colonna "Trend" della DataFrame df, considerando fino a 365 ritardi (lags).

🔹 alpha=None: evita di tracciare intervalli di confidenza, per una visualizzazione più pulita.

🔹 zero=False: esclude il lag 0 (cioè la correlazione di un valore con sé stesso, che sarebbe sempre 1).

🔹 ax=axes[0, 0]: specifica che il grafico deve essere disegnato nella prima posizione della griglia (riga 0, colonna 0).

🔹 axes[0, 0].set_title("ACF: Trend Only"): imposta il titolo del primo grafico.

🔍 Interpretazione: Se c'è una forte autocorrelazione per lags lunghi, indica che la serie ha una tendenza (trend).

4. Autocorrelazione della stagionalità (Seasonality)


plot_acf(df['Seasonality'], lags=365, alpha=None, zero=False, ax=axes[0, 1])

axes[0, 1].set_title("ACF: Seasonality Only")

🔹 Stessa logica della cella precedente, ma questa volta analizziamo la colonna "Seasonality".

🔹 Viene tracciato il grafico nella posizione [0,1] (prima riga, seconda colonna).

🔍 Interpretazione: Se l'ACF mostra picchi periodici a intervalli regolari, significa che la serie contiene una componente stagionale.

5. Autocorrelazione della tendenza + stagionalità


plot_acf(df["Trend + Seasonality"], lags=365, alpha=None, zero=False, ax=axes[1, 0])

axes[1, 0].set_title("ACF: Trend + Seasonality")

🔹 Qui analizziamo una combinazione di trend e stagionalità nella colonna "Trend + Seasonality".

🔹 Il grafico viene posizionato nella seconda riga, prima colonna (axes[1, 0]).

🔍 Interpretazione: Il grafico ACF potrebbe mostrare sia una tendenza (autocorrelazione alta per lags lunghi) sia una stagionalità (picchi periodici).

6. Autocorrelazione del rumore bianco (White Noise)

plot_acf(df["White Noise"], lags=365, alpha=None, zero=False, ax=axes[1, 1])

axes[1, 1].set_title("ACF: White Noise (No Trend, No Seasonality)")

🔹 Analizziamo ora "White Noise", ovvero dati casuali senza struttura né trend né stagionalità.

🔹 Il grafico è posizionato in [1,1] (seconda riga, seconda colonna).

🔍 Interpretazione: Se i dati sono puro rumore bianco, l’ACF mostrerà solo valori molto bassi e casuali, senza pattern significativi.

7. Miglioramento della disposizione dei grafici

plt.tight_layout()

🔹 Questa funzione ridistribuisce gli spazi tra i grafici per evitare sovrapposizioni, rendendo la visualizzazione più chiara.

8. Visualizzazione del risultato

plt.show()

🔹 Mostra tutti i grafici generati.

📌 Riepilogo

Questa analisi ci permette di identificare:

📈 Trend: Se la correlazione rimane alta per molti lags.

🔄 Stagionalità: Se ci sono picchi ripetitivi a intervalli fissi.

🔄📈 Trend + Stagionalità: Una combinazione delle due caratteristiche.

🔹 Rumore bianco: Nessuna correlazione significativa, segno di dati casuali.



## **1. Importazione delle librerie necessarie**  
Prima di iniziare, è importante importare le librerie necessarie per gestire i dati e creare le visualizzazioni. Anche se nel codice non è esplicitato, presumo che siano stati importati `numpy`, `pandas` e `matplotlib.pyplot`:

```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
```

- `numpy` (alias `np`): utilizzato per creare array numerici e generare numeri casuali.
- `pandas` (alias `pd`): utilizzato per gestire e manipolare dati tabulari.
- `matplotlib.pyplot` (alias `plt`): utilizzato per creare grafici.

---

## **2. Impostazione del seme casuale**
```python
np.random.seed(42)
```
- `np.random.seed(42)`: fissa il seme del generatore di numeri casuali per garantire che i risultati siano riproducibili.  
- Il numero `42` è arbitrario, potresti scegliere qualsiasi altro valore.

---

## **3. Creazione della sequenza temporale**
```python
date_range = pd.date_range("2010-01", periods=120, freq="ME")
```
- `pd.date_range()`: genera una serie di date a intervalli regolari.
- `"2010-01"`: indica la data iniziale (gennaio 2010).
- `periods=120`: genera 120 date consecutive.
- `freq="ME"`: sta per **Month End**, cioè prende l'ultimo giorno di ogni mese.

**Risultato:**  
Una serie temporale con 120 date che vanno da gennaio 2010 a dicembre 2019.

---

## **4. Creazione della tendenza (trend)**
```python
trend = np.linspace(10, 1000, 120)
```
- `np.linspace(10, 1000, 120)`: genera 120 valori equidistanti tra `10` e `1000`.  
- Questo rappresenta un trend crescente nel tempo.

**Risultato:**  
Un array che parte da `10` e cresce linearmente fino a `1000` lungo 120 punti.

---

## **5. Aggiunta della stagionalità**
```python
seasonality = (0.2 * trend) * np.sin(2 * np.pi * date_range.month / 12)
```
- `(0.2 * trend)`: l'ampiezza della componente stagionale aumenta con il tempo (varia in base al trend).  
- `np.sin(2 * np.pi * date_range.month / 12)`: crea un'oscillazione sinusoidale con periodicità di 12 mesi (ciclo annuale).  

**Risultato:**  
Una componente stagionale che segue un'onda sinusoidale e cresce nel tempo.

---

## **6. Aggiunta del rumore casuale**
```python
noise = np.random.normal(0, 0.1 * trend, 120)
```
- `np.random.normal(0, 0.1 * trend, 120)`: genera rumore casuale con media `0` e deviazione standard pari al `10%` del valore del trend in ogni punto.  
- Poiché la deviazione standard è proporzionale al trend, il rumore aumenta nel tempo.

**Risultato:**  
Una componente casuale che rende la serie meno prevedibile.

---

## **7. Creazione della serie temporale finale**
```python
time_series = trend + seasonality + noise
```
- Sommiamo le tre componenti:  
  1. **Trend crescente**
  2. **Stagionalità sinusoidale**
  3. **Rumore casuale**

**Risultato:**  
Una serie temporale che mostra un andamento crescente, oscillazioni stagionali e rumore.

---

## **8. Trasformazione logaritmica**
```python
log_time_series = np.log(time_series)
```
- `np.log(time_series)`: applica la trasformazione logaritmica alla serie.  
- Serve a stabilizzare la varianza, riducendo la crescita esponenziale e l’ampiezza delle oscillazioni.

---

## **9. Creazione del DataFrame**
```python
df = pd.DataFrame({"Date": date_range, "Original": time_series, "Log_Transformed": log_time_series})
df.set_index("Date", inplace=True)
```
- `pd.DataFrame({...})`: crea un DataFrame con le colonne:
  - `"Date"` → contiene la sequenza temporale.
  - `"Original"` → la serie temporale originale.
  - `"Log_Transformed"` → la serie trasformata con il logaritmo.
- `.set_index("Date", inplace=True)`: imposta la colonna `"Date"` come indice.

**Risultato:**  
Un DataFrame con data come indice e due serie numeriche.

---

## **10. Creazione del grafico con subplot**
```python
fig, axes = plt.subplots(2, 1, figsize=(10, 6), sharex=True)
```
- `plt.subplots(2, 1)`: crea due subplot (due grafici in una colonna).  
- `figsize=(10, 6)`: imposta le dimensioni della figura.  
- `sharex=True`: i due grafici condividono lo stesso asse x (tempo).

---

## **11. Disegno del primo grafico (Serie Originale)**
```python
axes[0].plot(df.index, df["Original"], label="Original Series", color="black")
axes[0].set_title("Original Time Series (Increasing Variability)")
axes[0].set_ylabel("Value")
```
- `axes[0].plot(...)`: traccia la serie originale in nero.  
- `set_title(...)`: imposta il titolo per evidenziare la crescita della variabilità.  
- `set_ylabel("Value")`: etichetta l'asse y.

---

## **12. Disegno del secondo grafico (Serie Log-trasformata)**
```python
axes[1].plot(df.index, df["Log_Transformed"], label="Log-Transformed Series", color="blue")
axes[1].set_title("Log-Transformed Time Series (Stabilized Variance)")
axes[1].set_ylabel("Log(Value)")
```
- `axes[1].plot(...)`: traccia la serie log-trasformata in blu.  
- `set_title(...)`: evidenzia che la varianza è stata stabilizzata.  
- `set_ylabel("Log(Value)")`: etichetta l'asse y.

---

## **13. Ottimizzazione e visualizzazione del grafico**
```python
plt.tight_layout()
plt.show()
```
- `plt.tight_layout()`: ottimizza la disposizione dei grafici per evitare sovrapposizioni.  
- `plt.show()`: visualizza il grafico.

---

## **Risultato finale**
1. **Primo grafico:** mostra la serie originale con una variabilità crescente.  
2. **Secondo grafico:** mostra la serie log-trasformata con una varianza più stabile.

---

### **Perché usare la trasformazione logaritmica?**
- Riduce l'effetto della crescita esponenziale.
- Stabilizza la varianza della serie.
- Migliora la modellizzazione e l’interpretabilità dei dati.





## **1. Importazione delle librerie**
Prima di tutto, nel codice manca l'importazione delle librerie necessarie. Quindi, il codice dovrebbe iniziare con:

```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
```

- **`numpy` (`np`)**: libreria utilizzata per operazioni matematiche, generazione di numeri casuali, funzioni di interpolazione e altro.  
- **`pandas` (`pd`)**: libreria per la manipolazione e analisi dei dati, in particolare con strutture dati come `DataFrame` e `Series`.  
- **`matplotlib.pyplot` (`plt`)**: libreria per la visualizzazione grafica (anche se nel codice non viene usata, potrebbe servire per visualizzare i dati).  

---

## **2. Fissiamo il seme per la generazione casuale**
```python
np.random.seed(42)
```
- **`np.random.seed(42)`**: imposta un seme fisso per il generatore di numeri casuali.  
  - Questo serve a rendere i risultati riproducibili: se rieseguiamo il codice, i numeri generati casualmente saranno sempre gli stessi.  

---

## **3. Creazione dell’intervallo di date**
```python
date_range = pd.date_range(start="2015-01", periods=60, freq="ME")
```
- **`pd.date_range()`**: genera un intervallo di date.  
- **`start="2015-01"`**: la serie inizia a gennaio 2015.  
- **`periods=60`**: vogliamo 60 punti temporali (ovvero 60 mesi, cioè 5 anni).  
- **`freq="ME"`**: indica che vogliamo la fine di ogni mese (*Month End*).  
  - Ad esempio, i primi valori saranno:  
    ```
    2015-01-31
    2015-02-28
    2015-03-31
    ...
    ```

---

## **4. Creazione del trend lineare**
```python
trend = np.linspace(50, 200, 60)
```
- **`np.linspace(50, 200, 60)`**: genera 60 valori equidistanti tra 50 e 200.  
  - Questo rappresenta una crescita graduale del valore della serie temporale nel tempo.  

Esempio di primi valori:  
```
50.0, 52.54, 55.08, 57.63, ...
```
Questo rappresenta una crescita lineare, senza variazioni brusche.

---

## **5. Creazione della stagionalità**
```python
seasonality = 20 * np.sin(2 * np.pi * date_range.month /12)
```
- **`date_range.month`**: estrae il numero del mese (1, 2, 3, …, 12).  
- **`(2 * np.pi * date_range.month / 12)`**: converte il numero del mese in un angolo in radianti per la funzione seno.  
- **`np.sin(...)`**: genera una forma d’onda sinusoidale, ripetendo un ciclo ogni 12 mesi.  
- **`20 * ...`**: moltiplicando per 20, amplifichiamo l’effetto della stagionalità.  

Questa parte aggiunge una variazione ciclica ai dati con un periodo di 12 mesi.  
Ad esempio, il valore massimo sarà in giugno e il minimo in dicembre.

---

## **6. Creazione del rumore casuale**
```python
noise = np.random.normal(0, 10, 60)
```
- **`np.random.normal(0, 10, 60)`**: genera 60 numeri casuali distribuiti normalmente con media `0` e deviazione standard `10`.  
- Questo introduce variabilità nei dati, simulando fluttuazioni casuali reali.  

Esempio di primi valori generati:
```
4.97, -1.38, 6.48, -7.31, ...
```
Questi valori si aggiungeranno alla serie per renderla più realistica.

---

## **7. Creazione della serie temporale finale**
```python
time_series = trend + seasonality + noise
```
- Qui sommiamo i tre componenti:  
  - **Trend**: crescita costante.  
  - **Stagionalità**: variazioni periodiche ogni 12 mesi.  
  - **Rumore**: variazioni casuali.  
- Questo ci dà una serie temporale realistica con crescita, stagionalità e variazioni casuali.

---

## **8. Creazione del DataFrame**
```python
df = pd.DataFrame({'Date': date_range, 'Value': time_series})
```
- **`pd.DataFrame({...})`**: crea un DataFrame con due colonne:
  - **`Date`**: le date generate prima.
  - **`Value`**: i valori della serie temporale.

Esempio di primi valori:
```
        Date       Value
0 2015-01-31   59.47
1 2015-02-28   67.15
2 2015-03-31   75.56
...
```

---

## **9. Impostazione dell’indice del DataFrame**
```python
df.set_index('Date', inplace=True)
```
- **`set_index('Date')`**: imposta la colonna `Date` come indice del DataFrame.  
- **`inplace=True`**: modifica direttamente il DataFrame senza crearne una copia.  

Ora il DataFrame appare così:
```
            Value
Date             
2015-01-31  59.47
2015-02-28  67.15
2015-03-31  75.56
...
```
Lavorare con le date come indice rende più semplice analizzare e visualizzare i dati.

---

# **Approfondimento: Moving Average (Media Mobile)**
Ora che abbiamo i dati, possiamo calcolare una **media mobile** per eliminare il rumore e osservare meglio il trend sottostante.

### **Media Mobile di 3 periodi (3-MA)**
```python
df['3-MA'] = df['Value'].rolling(window=3).mean()
```
- **`rolling(window=3)`**: crea una finestra mobile di 3 mesi.  
- **`mean()`**: calcola la media sui 3 valori nella finestra.  

Esempio di calcolo:  
```
(59.47 + 67.15 + 75.56) / 3 = 67.39
```
Così otteniamo una nuova colonna `3-MA` che smussa la serie.

### **Grafico della serie temporale e della media mobile**
```python
plt.figure(figsize=(12,5))
plt.plot(df.index, df['Value'], label='Serie Originale', alpha=0.5)
plt.plot(df.index, df['3-MA'], label='Media Mobile (3-MA)', color='red')
plt.legend()
plt.show()
```
- **`plt.plot(df.index, df['Value'])`**: grafico della serie originale.
- **`plt.plot(df.index, df['3-MA'], color='red')`**: grafico della media mobile in rosso.
- **`alpha=0.5`**: rende il primo grafico più trasparente per vedere meglio il secondo.

La media mobile aiuta a ridurre il rumore e mostra la tendenza reale.

---

# **Conclusione**
Abbiamo analizzato il codice riga per riga e visto:
- **Come generare una serie temporale con trend, stagionalità e rumore**.
- **Come usare una media mobile per smussare i dati**.
- **Come visualizzare il tutto in un grafico**.




## **1. Importazione delle librerie**
Il codice manca dell'importazione delle librerie, quindi dovremmo iniziare con:

```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
```

- **`numpy` (`np`)**: libreria per operazioni matematiche, generazione di numeri casuali, funzioni trigonometriche e altro.
- **`pandas` (`pd`)**: libreria per manipolare dati in forma tabellare (`DataFrame`).
- **`matplotlib.pyplot` (`plt`)**: libreria per visualizzare dati in grafici.

---

## **2. Impostazione del seme per i numeri casuali**
```python
np.random.seed(42)
```
- **`np.random.seed(42)`**: imposta un valore fisso per la generazione di numeri casuali.
- Questo garantisce **riproducibilità**: ogni volta che eseguiamo il codice, otterremo sempre gli stessi numeri casuali.

---

## **3. Creazione dell'intervallo di date**
```python
date_range = pd.date_range(start="2015-01", periods=60, freq="ME")
```
- **`pd.date_range()`**: crea una sequenza di date.
- **`start="2015-01"`**: la serie temporale inizia a gennaio 2015.
- **`periods=60`**: vogliamo **60 mesi** di dati (5 anni).
- **`freq="ME"`**: indica che vogliamo la **fine di ogni mese** (*Month End*).

Esempio di output:
```
2015-01-31
2015-02-28
2015-03-31
...
```

---

## **4. Creazione del trend lineare**
```python
trend = np.linspace(50, 200, 60)
```
- **`np.linspace(50, 200, 60)`**: genera **60 valori equidistanti** tra 50 e 200.
- Questo rappresenta **una crescita lineare** nel tempo.

Esempio dei primi valori:
```
50.00, 52.54, 55.08, 57.63, ...
```

---

## **5. Creazione della stagionalità**
```python
seasonality = 20 * np.sin(2 * np.pi * date_range.month /12)
```
- **`date_range.month`**: estrae il numero del mese (1, 2, 3, …, 12).
- **`(2 * np.pi * date_range.month / 12)`**: converte il numero del mese in **radianti** per la funzione seno.
- **`np.sin(...)`**: genera **un'onda sinusoidale** che si ripete ogni **12 mesi**.
- **Moltiplicando per 20**, amplifichiamo le variazioni stagionali.

Esempio di primi valori della stagionalità:
```
10.00, 17.32, 20.00, 17.32, ...
```
Ciò significa che nei mesi **estivi** la serie avrà valori più alti, mentre nei mesi **invernali** valori più bassi.

---

## **6. Creazione del rumore casuale**
```python
noise = np.random.normal(0, 10, 60)
```
- **`np.random.normal(0, 10, 60)`**: genera **60 numeri casuali** con **media 0** e **deviazione standard 10**.
- Questo introduce **variazioni imprevedibili**, simulando l'incertezza dei dati reali.

Esempio di primi valori del rumore:
```
4.97, -1.38, 6.48, -7.31, ...
```

---

## **7. Creazione della serie temporale finale**
```python
time_series = trend + seasonality + noise
```
- **Sommiamo trend, stagionalità e rumore** per ottenere una serie temporale **realistica**.
- Il **trend** fornisce **una crescita graduale**.
- La **stagionalità** introduce **variazioni periodiche**.
- Il **rumore** aggiunge **fluttuazioni imprevedibili**.

Esempio di primi valori:
```
64.97, 68.48, 81.56, 67.63, ...
```

---

## **8. Creazione del DataFrame**
```python
df = pd.DataFrame({'Date': date_range, 'Value': time_series})
```
- Creiamo un **DataFrame** con due colonne:
  - **`Date`**: contiene le date.
  - **`Value`**: contiene i valori della serie temporale.

---

## **9. Impostazione della colonna Date come indice**
```python
df.set_index('Date', inplace=True)
```
- **`set_index('Date')`**: usa la colonna `Date` come **indice** del DataFrame.
- **`inplace=True`**: modifica il DataFrame direttamente.

Ora il DataFrame appare così:
```
            Value
Date             
2015-01-31  64.97
2015-02-28  68.48
2015-03-31  81.56
...
```

---

## **10. Calcolo della media mobile a 3 periodi (3-MA)**
```python
df["MA_3"] = df["Value"].rolling(window=3, center=True).mean()
```
- **`rolling(window=3, center=True)`**: crea una **finestra mobile di 3 mesi** centrata sul valore attuale.
- **`mean()`**: calcola la media dei 3 valori.

Esempio di calcolo:
```
MA_3 = (64.97 + 68.48 + 81.56) / 3 = 71.67
```
La media mobile **riduce il rumore** e rende i dati più leggibili.

---

## **11. Calcolo della media mobile a 12 periodi (12-MA)**
```python
df["MA_12"] = df["Value"].rolling(window=12, center=True).mean()
```
- **`rolling(window=12, center=True)`**: crea una finestra **di 12 mesi** (1 anno).
- **`mean()`**: calcola la media di quei 12 valori.

Questa media **elimina ancora più rumore** rispetto alla 3-MA e mostra la **tendenza generale**.

---

## **12. Creazione del grafico**
```python
plt.figure(figsize=(10, 6))
```
- **`plt.figure(figsize=(10,6))`**: imposta le dimensioni della figura (10x6 pollici).

---

## **13. Tracciare la serie temporale originale**
```python
plt.plot(df.index, df["Value"], label="Original Time Series", color="black")
```
- **`plt.plot(df.index, df["Value"], color="black")`**: disegna la serie originale in nero.

---

## **14. Tracciare la media mobile a 3 periodi**
```python
plt.plot(df.index, df["MA_3"], label="3-MA", color="blue")
```
- Disegna la **media mobile a 3 mesi** in **blu**.

---

## **15. Tracciare la media mobile a 12 periodi**
```python
plt.plot(df.index, df["MA_12"], label="12-MA", color="red")
```
- Disegna la **media mobile a 12 mesi** in **rosso**.

---

## **16. Aggiungere etichette e legenda**
```python
plt.xlabel("Date")
plt.ylabel("Value")
plt.legend()
plt.grid()
```
- **`plt.xlabel("Date")`**: etichetta per l'asse X.
- **`plt.ylabel("Value")`**: etichetta per l'asse Y.
- **`plt.legend()`**: mostra la legenda con le etichette definite prima.
- **`plt.grid()`**: aggiunge una griglia per migliorare la leggibilità.

---

## **17. Mostrare il grafico**
```python
plt.show()
```
- **`plt.show()`**: visualizza il grafico.

---

# **Conclusione**
Abbiamo analizzato il codice riga per riga e abbiamo visto:
✅ **Come generare una serie temporale realistica**  
✅ **Come calcolare medie mobili per evidenziare il trend**  
✅ **Come visualizzare i dati in un grafico chiaro**  



## 📌 **Spiegazione della Teoria sulla Decomposizione delle Serie Temporali**

La **decomposizione delle serie temporali** è una tecnica che permette di scomporre una serie temporale in tre componenti principali:  
- **Trend (\( $T_t$ \))**: rappresenta la tendenza a lungo termine della serie (es. crescita o decrescita nel tempo).  
- **Stagionalità (\( $S_t $\))**: rappresenta i pattern ripetitivi che si verificano a intervalli regolari (es. cicli annuali o mensili).  
- **Residuo (\( $R_t$ \))**: contiene le fluttuazioni casuali e gli errori non spiegati da trend e stagionalità.  

### 🔹 **Tipi di Decomposizione**  
1. **Additiva**:  
   \[$
   Y_t = T_t + S_t + R_t$
   \]  
   ✅ **Usata quando l’ampiezza delle variazioni stagionali è costante nel tempo.**  

2. **Moltiplicativa**:  
   \[$
   Y_t = T_t \times S_t \times R_t$
   \]  
   ✅ **Usata quando le variazioni stagionali aumentano con il livello della serie temporale.**  

L'algoritmo **STL (Seasonal-Trend decomposition using LOESS)** consente di scomporre la serie in questi tre componenti in modo flessibile e robusto.

---

## 📌 **Spiegazione del Codice**
Ora analizziamo riga per riga il codice che utilizza `STL` per decomporre una serie temporale.  

### 🔹 **1. Importazione della libreria necessaria**
```python
from statsmodels.tsa.seasonal import STL
```
✅ **`STL`** viene importato da `statsmodels.tsa.seasonal`, una libreria per l'analisi delle serie temporali.  

### 🔹 **2. Impostazione di un seed per la riproducibilità**
```python
np.random.seed(42)
```
✅ Impostiamo un **seed** in modo che i numeri casuali generati siano sempre gli stessi (utile per ottenere risultati coerenti).  

### 🔹 **3. Creazione di un intervallo di date**
```python
date_range = pd.date_range(start="2020-01-01", periods=1095, freq="D")
```
✅ Creiamo una serie temporale con **1095 giorni (circa 3 anni)** a partire dal **1° gennaio 2020**.  

### 🔹 **4. Definizione della serie temporale sintetica**
```python
trend = np.linspace(50, 150, 1095)
```
✅ Creiamo un **trend lineare crescente** da **50 a 150** nel corso di 3 anni.  

```python
seasonality = 20 * np.sin(2 * np.pi * date_range.dayofyear / 365)
```
✅ Definiamo una **stagionalità annuale** con una sinusoide che ha ampiezza **20** (oscilla tra -20 e +20).  

```python
noise = np.random.normal(0, 3, 1095)
```
✅ Generiamo un **rumore casuale** con una distribuzione normale (media **0**, deviazione standard **3**).  

```python
time_series = trend + seasonality + noise
```
✅ Creiamo la serie sommando **trend, stagionalità e rumore**.  

### 🔹 **5. Creazione del DataFrame e impostazione dell'indice temporale**
```python
df = pd.DataFrame({"Date": date_range, "Value": time_series})
df.set_index('Date', inplace=True)
```
✅ Creiamo un **DataFrame** con **due colonne**:  
- `"Date"`: le date generate  
- `"Value"`: i valori della serie temporale  

✅ Impostiamo **la colonna "Date" come indice**.  

### 🔹 **6. Applicazione di STL per decomporre la serie temporale**
```python
stl = STL(df["Value"], period=365)
decomposition = stl.fit()
```
✅ Creiamo un **oggetto STL**, indicando un periodo di **365 giorni** (per la stagionalità annuale).  
✅ **`fit()`** esegue la decomposizione.  

```python
trend_stl = decomposition.trend
seasonal_stl = decomposition.seasonal
residual_stl = decomposition.resid
```
✅ **Estraiamo i tre componenti** della serie temporale:  
- **trend** (`trend_stl`)  
- **stagionalità** (`seasonal_stl`)  
- **residuo** (`residual_stl`)  

### 🔹 **7. Creazione del grafico con Matplotlib**
```python
fig, axes = plt.subplots(4, 1, figsize=(10, 8), sharex=True)
```
✅ Creiamo **4 grafici sovrapposti** in un'unica figura (`4 righe × 1 colonna`).  

```python
axes[0].plot(df.index, df["Value"], label="Original", color="black")
axes[0].set_title("Original Time Series")
```
✅ **Primo grafico**: la **serie temporale originale**.  

```python
axes[1].plot(df.index, trend_stl, label="Trend", color="blue")
axes[1].set_title("Trend Component (STL)")
```
✅ **Secondo grafico**: la **componente di trend** (in blu).  

```python
axes[2].plot(df.index, seasonal_stl, label="Seasonality", color="green")
axes[2].set_title("Seasonal Component (STL)")
```
✅ **Terzo grafico**: la **componente stagionale** (in verde).  

```python
axes[3].plot(df.index, residual_stl, label="Residuals", color="red")
axes[3].set_title("Remainder (Residuals)")
```
✅ **Quarto grafico**: la **componente di residuo** (in rosso).  

```python
plt.tight_layout()
plt.show()
```
✅ **Mostriamo il grafico**, migliorando la disposizione con `tight_layout()`.  

---

## 📌 **📊 Risultati attesi**
Il codice genererà **4 grafici**:  
1. **Serie originale** → Oscillazioni con trend crescente  
2. **Trend** → Linea che cresce nel tempo  
3. **Stagionalità** → Un pattern ripetitivo annuale  
4. **Residuo** → Rumore casuale senza pattern chiari  

💡 Questo metodo è utile per **analizzare trend e pattern nascosti** in dati reali, come temperature, vendite o dati medici.



### Lezione teorica dettagliata su *Naive Forecasting Methods*

Il *forecasting* (o previsione) è il processo di stima di valori futuri sulla base di dati storici. Uno degli approcci più semplici per fare previsione è tramite l'uso di metodi *naive*, che non fanno assunzioni complesse sui dati ma si basano su concetti elementari.

#### Cos'è un "Naive Forecasting"?
I metodi *naive* utilizzano informazioni storiche in modo molto diretto per fare previsioni future. Essi si fondano su assunzioni molto semplici, come:
1. **Previsione basata sull'ultimo valore (Naive Method)**: La previsione per il periodo successivo è uguale all'ultimo valore osservato.
2. **Previsione stagionale (Seasonal Naive Method)**: La previsione per un determinato periodo dell'anno è uguale al valore osservato nello stesso periodo dell'anno precedente.
3. **Previsione basata sulla media (Mean Method)**: La previsione è la media di tutti i valori storici.
4. **Previsione con tendenza lineare (Drift Method)**: La previsione tiene conto di una tendenza lineare dei dati, calcolando un'inclinazione (drift) e proiettandola in futuro.

#### Caratteristiche del metodo:
- **Facilità d'uso**: Sono metodi molto facili da implementare.
- **Non richiedono modelli complessi**: Non è necessario fare stime avanzate o calcoli complessi.
- **Adatti a dati con trend o stagionalità**: Alcuni metodi come il *Seasonal Naive Forecasting* funzionano particolarmente bene quando i dati seguono modelli stagionali.

Tuttavia, i metodi *naive* non considerano variabili esogene o altre informazioni che potrebbero essere utili per fare previsioni più accurate. Sono quindi utili come baseline, ma non devono essere considerati per scenari complessi.

---

### Spiegazione del codice riga per riga

```python
np.random.seed(42)
```
Imposta il seme del generatore di numeri casuali per garantire che i risultati siano riproducibili. Usando lo stesso seme, otterremo gli stessi numeri casuali ogni volta che eseguiamo il codice.

```python
date_range = pd.date_range(start="2015-01", periods=60, freq="ME")
```
Crea una serie di date con frequenza mensile (ME) a partire da gennaio 2015 per un periodo di 60 mesi. Quindi, otterremo 60 date, ognuna corrispondente alla fine di ogni mese.

```python
trend = np.linspace(50, 200, 60)
```
Genera un array di 60 valori che rappresentano una tendenza crescente da 50 a 200. Questo valore simula una variazione lineare dei dati, come se i valori stessero aumentando nel tempo.

```python
seasonality = 15 * np.sin(2 * np.pi * date_range.month / 12)
```
Simula un effetto stagionale. La funzione seno rappresenta un ciclo annuale con ampiezza 15. La variabile `date_range.month` prende il mese di ogni data, quindi la stagionalità varia in modo ciclico da gennaio a dicembre ogni anno.

```python
noise = np.random.normal(0, 8, 60)
```
Genera rumore casuale (errori aleatori) con media 0 e deviazione standard 8, per simulare fluttuazioni casuali nei dati.

```python
time_series = trend + seasonality + noise
```
Somma la tendenza, la stagionalità e il rumore per ottenere una serie temporale complessa che rappresenta i dati effettivi. Questi dati sintetici vengono poi utilizzati per fare previsioni.

```python
df = pd.DataFrame({"Date": date_range, "Value": time_series})
df.set_index("Date", inplace=True)
```
Crea un *DataFrame* pandas con due colonne: `Date` (le date create prima) e `Value` (i valori della serie temporale). Poi imposta la colonna `Date` come indice del *DataFrame* per facilitare le operazioni temporali.

```python
forecast_horizon = 12
```
Imposta l'orizzonte della previsione a 12 mesi, ovvero vogliamo fare previsioni per i prossimi 12 periodi mensili.

```python
future_dates = pd.date_range(start=df.index[-1] + pd.DateOffset(months=1), periods=forecast_horizon, freq="ME")
```
Genera le date future per le previsioni, iniziando dal mese successivo all'ultimo mese della serie storica (usando `df.index[-1]`), per un periodo di 12 mesi.

```python
naive_forecast = np.full(forecast_horizon, df["Value"].iloc[-1])
```
Crea una previsione *naive* che prende semplicemente l'ultimo valore della serie (`df["Value"].iloc[-1]`) e lo ripete per i successivi 12 mesi.

```python
mean_forecast = np.full(forecast_horizon, df["Value"].mean())
```
Crea una previsione basata sulla media dei valori storici della serie. Tutti i valori previsti sono uguali alla media.

```python
seasonal_naive_forecast = df["Value"].iloc[-12:].values
```
Crea una previsione stagionale che utilizza gli ultimi 12 mesi della serie come previsione per i 12 mesi successivi, ripetendo i valori annuali.

```python
drift_slope = (df["Value"].iloc[-1] - df["Value"].iloc[0]) / (len(df) - 1)
```
Calcola la pendenza della tendenza lineare tra il primo e l'ultimo valore della serie storica. Questo rappresenta il tasso di cambiamento dei dati nel tempo.

```python
drift_forecast = df["Value"].iloc[-1] + drift_slope * np.arange(1, forecast_horizon + 1)
```
Crea una previsione usando il metodo del "drift", che prevede i valori futuri con la pendenza calcolata precedentemente. Ogni previsione futura è basata sull'ultimo valore della serie e aggiunge il cambiamento lineare calcolato.

```python
forecast_df = pd.DataFrame({
    "Date": future_dates,
    "Mean Forecast": mean_forecast,
    "Naïve Forecast": naive_forecast,
    "Seasonal Naïve Forecast": np.tile(seasonal_naive_forecast, forecast_horizon // 12 + 1)[:forecast_horizon],
    "Drift Forecast": drift_forecast
}).set_index("Date")
```
Crea un *DataFrame* con tutte le previsioni (media, naive, stagionale e drift) per le date future. La funzione `np.tile` ripete la previsione stagionale per coprire tutti i mesi futuri, anche se il numero di mesi futuri non è esattamente un multiplo di 12.

```python
plt.figure(figsize=(12, 6))
```
Imposta la dimensione del grafico a 12x6 pollici per una visualizzazione più chiara.

```python
# Plot historical data
plt.plot(df.index, df["Value"], label="Original Series", color="black", marker="o")
```
Plotta i dati storici della serie temporale in nero con marker a cerchio.

```python
# Plot forecasts
plt.plot(forecast_df.index, forecast_df["Mean Forecast"], label="Mean Forecast", linestyle="--", color="blue")
plt.plot(forecast_df.index, forecast_df["Naïve Forecast"], label="Naïve (Last Value) Forecast", linestyle="--", color="green")
plt.plot(forecast_df.index, forecast_df["Seasonal Naïve Forecast"], label="Seasonal Naïve Forecast", linestyle="--", color="orange")
plt.plot(forecast_df.index, forecast_df["Drift Forecast"], label="Drift Forecast", linestyle="--", color="red")
```
Plotta tutte le previsioni con linee tratteggiate di colori diversi per ciascun metodo.

```python
plt.axvline(df.index[-1], color="gray", linestyle="--", label="Forecast Start")  # Vertical line at forecast start
```
Aggiunge una linea verticale grigia che indica l'inizio del periodo di previsione.

```python
plt.title("Naïve Forecasting Methods")
plt.xlabel("Date")
plt.ylabel("Value")
plt.legend()
plt.grid()
plt.show()
```
Configura il titolo, le etichette degli assi, la legenda e il grid del grafico, quindi visualizza il grafico.

---

Questo codice genera una serie temporale simulata con un trend, stagionalità e rumore. Successivamente, vengono applicati diversi metodi di previsione *naive* e i risultati sono visualizzati su un grafico.

### Lezione teorica sui metodi di **Exponential Smoothing**:

L'**Exponential Smoothing** è una tecnica di previsione usata per analizzare e fare previsioni su serie temporali. La sua caratteristica principale è l'assegnazione di pesi decrescenti esponenzialmente ai dati storici, il che significa che le osservazioni più recenti hanno un peso maggiore rispetto a quelle più lontane nel tempo. Esistono diverse varianti di questa tecnica, ognuna adatta a un particolare tipo di serie temporale (ad esempio, senza trend, con trend o con stagionalità).

#### 1. **Simple Exponential Smoothing (SES)**

La **Simple Exponential Smoothing (SES)** è il modello di base dell'Exponential Smoothing. È adatto per serie temporali che non presentano né trend né stagionalità. In questo modello, ogni previsione è una media ponderata delle osservazioni passate, con i pesi che decrescono esponenzialmente più si allontanano nel passato. La formula generale è:

\[$
\hat{y}_{t+1} = \alpha y_t + (1 - \alpha) \hat{y}_t
$\]

Dove:
- \($ y_t$ \) è il valore osservato al tempo \( t \),
- \( $\hat{y}_t$ \) è la previsione per il tempo \( t \),
- \($ \alpha$ \) è il parametro di smoothing, un valore compreso tra 0 e 1 che controlla quanto peso dare alle osservazioni recenti.

#### 2. **Holt’s Linear Method**

Il **metodo di Holt** estende il SES aggiungendo un componente di trend. Questo metodo è utile quando la serie temporale presenta una tendenza crescente o decrescente. Holt ha introdotto un secondo parametro che modella il trend, rendendo la previsione capace di crescere o decrescere linearmente nel tempo. La formula del metodo di Holt è:

\[$
\hat{y}_{t+1} = \hat{y}_t + \hat{b}_t
$\]
\[$
\hat{b}_{t+1} = \beta (\hat{y}_t - \hat{y}_{t-1}) + (1-\beta) \hat{b}_t
$\]

Dove:
- \($ \hat{y}_t $\) è la previsione per il tempo \($ t$ \),
- \( $\hat{b}_t $\) è il valore stimato del trend al tempo \($ t $\),
- \( $\beta $\) è il parametro di smoothing per il trend.

#### 3. **Holt-Winters (Trend + Seasonality)**

Il **metodo Holt-Winters** estende ulteriormente il metodo di Holt per includere anche la stagionalità. Questo modello è particolarmente utile per serie temporali che presentano sia un trend che delle fluttuazioni stagionali. Esistono due varianti:
- **Additivo**: Quando la stagionalità ha una variazione costante nel tempo.
- **Moltiplicativo**: Quando l'intensità della stagionalità cambia nel tempo.

Le formule per il metodo Holt-Winters sono:

- **Additivo**:
\[$
\hat{y}_{t+1} = \hat{y}_t + \hat{b}_t + \hat{s}_{t+1-m}
$\]

- **Moltiplicativo**:
\[$
\hat{y}_{t+1} = (\hat{y}_t + \hat{b}_t ) \times \hat{s}_{t+1-m }
$\]

Dove:
- \($ \hat{s}_t$ \) è il valore stagionale al tempo \( $t $\),
- \( $m$ \) è il periodo stagionale (ad esempio, 12 per dati mensili con stagionalità annuale).

---

### Spiegazione del codice riga per riga:

Il codice che segue implementa i metodi di Exponential Smoothing con Python, utilizzando la libreria `statsmodels`.

#### **Importazioni e configurazione iniziale:**
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.holtwinters import SimpleExpSmoothing, ExponentialSmoothing
```
- `numpy`: Libreria per operazioni numeriche, come la generazione di dati casuali.
- `pandas`: Usato per la gestione dei dati, specialmente per le serie temporali.
- `matplotlib`: Usato per creare grafici.
- `statsmodels.tsa.holtwinters`: Contiene le classi per i modelli di Exponential Smoothing (SES, Holt, Holt-Winters).

#### **Creazione della serie temporale:**
```python
np.random.seed(42)
date_range = pd.date_range(start="2015-01", periods=60, freq="ME")
forecast_horizon = 24
future_dates = pd.date_range(start=date_range[-1] + pd.DateOffset(months=1), periods=forecast_horizon, freq="ME")
```
- `np.random.seed(42)`: Imposta il seme per la generazione di numeri casuali, per ottenere risultati ripetibili.
- `date_range`: Crea un intervallo di date mensili che va da gennaio 2015 per 60 periodi (mesi).
- `forecast_horizon`: Definisce il numero di periodi futuri per i quali fare la previsione (24 mesi).
- `future_dates`: Crea le date future per la previsione (i 24 mesi successivi).

#### **1. Simple Exponential Smoothing (SES):**
```python
ses_data = np.random.normal(50, 5, len(date_range))  # Constant mean + noise
df_ses = pd.DataFrame({"Date": date_range, "Value": ses_data}).set_index("Date")
df_ses.index.freq = "ME"

ses_model = SimpleExpSmoothing(df_ses["Value"]).fit()
ses_forecast = ses_model.forecast(forecast_horizon)
```
- `ses_data`: Crea una serie di dati casuali con una media di 50 e deviazione standard di 5 (simulando una serie temporale senza trend né stagionalità).
- `df_ses`: Crea un DataFrame con le date e i valori generati, impostando le date come indice.
- `ses_model = SimpleExpSmoothing(...)`: Crea e addestra il modello SES sui dati.
- `ses_forecast = ses_model.forecast(forecast_horizon)`: Calcola le previsioni per i 24 periodi futuri.

#### **2. Holt’s Linear Method:**
```python
trend = np.linspace(50, 500, len(date_range))  # Steeper linear trend
holt_data = trend + np.random.normal(0, 10, len(date_range))  # Adding some noise
df_holt = pd.DataFrame({"Value": holt_data}, index=date_range)
df_holt.index.freq = "ME"

holt_model = ExponentialSmoothing(df_holt["Value"], trend="add").fit()
holt_forecast = holt_model.forecast(forecast_horizon)
```
- `trend`: Crea una tendenza lineare crescente da 50 a 500 per 60 periodi.
- `holt_data`: Aggiunge rumore casuale ai dati per simulare una serie temporale con trend.
- `holt_model = ExponentialSmoothing(...)`: Crea e addestra il modello Holt sui dati, specificando il tipo di trend come "additivo".
- `holt_forecast = holt_model.forecast(forecast_horizon)`: Calcola le previsioni per i 24 periodi futuri.

#### **3. Holt-Winters (Trend + Seasonality):**
```python
seasonality = 20 * np.sin(2 * np.pi * date_range.month / 12)
holtwinters_data = trend + seasonality + np.random.normal(0, 5, len(date_range))
df_holtwinters = pd.DataFrame({"Date": date_range, "Value": holtwinters_data}).set_index("Date")
df_holtwinters.index.freq = "ME"

holtwinters_model = ExponentialSmoothing(df_holtwinters["Value"], trend="add", seasonal="add", seasonal_periods=12).fit()
holtwinters_forecast = holtwinters_model.forecast(forecast_horizon)
```
- `seasonality`: Crea un pattern stagionale usando una funzione seno per simulare la stagionalità annuale.
- `holtwinters_data`: Combina la tendenza, la stagionalità e il rumore per creare una serie temporale complessa con trend e stagionalità.
- `holtwinters_model = ExponentialSmoothing(...)`: Crea e addestra il modello Holt-Winters sui dati, specificando sia il trend che la stagionalità come additivi.
- `holtwinters_forecast = holtwinters_model.forecast(forecast_horizon)`: Calcola le previsioni per i 24 periodi futuri.

#### **Creazione dei grafici:**
```python
fig, axes = plt.subplots(3, 1, figsize=(8, 12))

# SES Plot
axes[0].plot(df_ses.index, df_ses["Value"], label="Original Series", color="black")
axes[0].plot(future_dates, ses_forecast, label="SES Forecast", linestyle="--", color="blue")
axes[0].axvline(df_ses.index[-1], color="gray", linestyle="--", label="Forecast Start")
axes[0].set_title("Simple Exponential Smoothing (SES)")
axes[0].legend()
axes[0].grid()

# Holt’s Linear Trend vs. Holt Damped Trend
axes[1].plot(df_holt.index, df_holt["Value"], label="Original Series", color="black")
axes[1].plot(future_dates, holt_forecast, label="Holt’s Forecast (Linear Trend)", linestyle="--", color="red")
axes[1].axvline(df_holt.index[-1], color="gray", linestyle="--", label="Forecast Start")
axes[1].set_title("Holt’s Linear Trend")
axes[1].legend()
axes[1].grid()

# Holt-Winters Plot
axes[2].plot(df_holtwinters.index, df_holtwinters["Value"], label="Original Series", color="black")
axes[2].plot(future_dates, holtwinters_forecast, label="Holt-Winters Forecast", linestyle="--", color="green")
axes[2].axvline(df_holtwinters.index[-1], color="gray", linestyle="--", label="Forecast Start")
axes[2].set_title("Holt-Winters (Trend + Seasonality)")
axes[2].legend()
axes[2].grid()

plt.tight_layout()
plt.show()
```
- Crea un grafico per ciascun modello (SES, Holt e Holt-Winters).
- Per ogni grafico, viene tracciata la serie storica originale, la previsione e una linea verticale per indicare dove inizia la previsione.

Questo codice ti fornisce una panoramica delle previsioni generate dai diversi metodi di Exponential Smoothing, permettendoti di confrontare i risultati visivamente.

### Lezione Teorica: **Serie Temporali e ARIMA**

Le **serie temporali** sono sequenze di dati raccolti in momenti successivi nel tempo. Le serie temporali sono spesso utilizzate per modellare fenomeni naturali, economici o finanziari, e uno degli scopi principali nell'analisi delle serie temporali è prevedere il comportamento futuro sulla base dei dati passati.

#### **Proprietà delle Serie Temporali:**

1. **Stazionarietà:**
   Una serie temporale è **stazionaria** se le sue proprietà statistiche non cambiano nel tempo. Ciò significa che la media, la varianza e la covarianza sono costanti nel tempo. In particolare:
   - La **media** è costante.
   - La **varianza** è costante.
   - La **covarianza** tra le osservazioni è costante nel tempo.

   La stazionarietà è importante poiché molti modelli di serie temporali, come il modello ARIMA, richiedono che la serie sia stazionaria per poter fare previsioni accurate.

2. **Non Stazionarietà:**
   Se una serie temporale non è stazionaria, può essere a causa di:
   - **Cambiamenti di livello** (il valore medio cambia nel tempo).
   - **Varianza non costante** (la dispersione dei dati cambia nel tempo).
   - **Trend** (un comportamento crescente o decrescente nel tempo).

3. **Modelli ARIMA:**
   ARIMA sta per **AutoRegressive Integrated Moving Average**, ed è uno dei modelli più comuni per analizzare e prevedere le serie temporali stazionarie. È composto da tre componenti:
   - **AR (AutoRegressive)**: Relazione tra l'osservazione corrente e le osservazioni passate.
   - **I (Integrated)**: Differenziazione della serie per renderla stazionaria.
   - **MA (Moving Average)**: Media mobile degli errori di previsione.

   Il modello ARIMA può essere usato per prevedere il futuro di una serie temporale.

#### **Tipi di Serie Temporali (Esempi)**

Nel codice che seguirà, vedremo diversi esempi di serie temporali che illustrano vari tipi di comportamento delle serie temporali:

1. **Serie con un cambiamento di livello (Level Change):**
   Una serie che cambia di valore medio a metà del periodo di osservazione, passando da una media di 50 a una media di 80.

2. **Serie con varianza crescente (Increasing Variance):**
   Una serie con media costante, ma che ha una varianza che cresce nel tempo, portando a una maggiore dispersione nei dati man mano che il tempo avanza.

3. **Serie stazionaria con rumore bianco (White Noise):**
   Una serie con media costante e varianza costante, che rappresenta rumore casuale senza alcun pattern o trend.

4. **Serie stazionaria con un processo autoregressivo (AR(1) Process):**
   Un processo autoregressivo di ordine 1 (AR(1)) è una serie temporale in cui l'osservazione corrente dipende da quella precedente, con un parametro di autoregressione che controlla l'influenza delle osservazioni passate.

---

### **Spiegazione del Codice:**

Il codice fornito crea e visualizza quattro diverse serie temporali: una con un cambiamento di livello, una con varianza crescente, una con rumore bianco e una basata su un processo AR(1). 

Vediamo il codice riga per riga:

#### **Importazioni e Settaggio del Seed:**

```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Set seed for reproducibility
np.random.seed(42)
```

- `import numpy as np`: Importa la libreria NumPy per operazioni matematiche e generazione di numeri casuali.
- `import pandas as pd`: Importa la libreria Pandas per la gestione dei dati in formato DataFrame.
- `import matplotlib.pyplot as plt`: Importa la libreria Matplotlib per la creazione di grafici.
- `np.random.seed(42)`: Imposta il seme del generatore di numeri casuali per garantire che i risultati siano riproducibili (ogni volta che eseguiamo il codice, otterremo gli stessi numeri casuali).

#### **Creazione della Serie Temporale con Cambiamento di Livello (Level Change):**

```python
date_range = pd.date_range(start="2015-01", periods=100, freq="ME")
level_change_data = np.concatenate([
    np.random.normal(50, 5, 50),  # First half around 50
    np.random.normal(80, 5, 50)   # Second half shifts to around 80
])
df_level_change = pd.DataFrame({"Value": level_change_data}, index=date_range)
```

- `date_range = pd.date_range(start="2015-01", periods=100, freq="ME")`: Crea un intervallo di date che inizia a gennaio 2015, con 100 periodi mensili (frequenza "ME" per "month end").
- `np.random.normal(50, 5, 50)`: Crea una serie di 50 numeri casuali distribuiti normalmente con media 50 e deviazione standard 5.
- `np.concatenate([...])`: Combina due sequenze di numeri casuali: una con media 50 e l'altra con media 80, simulando un cambiamento di livello a metà della serie.
- `df_level_change = pd.DataFrame({"Value": level_change_data}, index=date_range)`: Crea un DataFrame Pandas con i dati e l'intervallo di date.

#### **Creazione della Serie con Varianza Crescente (Increasing Variance):**

```python
constant_mean = 50
increasing_variance_data = constant_mean + np.random.normal(0, np.linspace(2, 20, len(date_range)))
df_increasing_variance = pd.DataFrame({"Value": increasing_variance_data}, index=date_range)
```

- `constant_mean = 50`: Imposta una media costante di 50.
- `np.random.normal(0, np.linspace(2, 20, len(date_range)))`: Crea una serie di numeri casuali con media 0, ma con deviazione standard che cresce linearmente da 2 a 20, simulando una varianza crescente.
- `df_increasing_variance = pd.DataFrame({"Value": increasing_variance_data}, index=date_range)`: Crea il DataFrame con i dati generati.

#### **Creazione della Serie con Rumore Bianco (White Noise):**

```python
white_noise = np.random.normal(50, 5, len(date_range))
df_white_noise = pd.DataFrame({"Value": white_noise}, index=date_range)
```

- `np.random.normal(50, 5, len(date_range))`: Crea una serie di numeri casuali con media 50 e deviazione standard 5, rappresentando il rumore bianco.
- `df_white_noise = pd.DataFrame({"Value": white_noise}, index=date_range)`: Crea il DataFrame con i dati generati.

#### **Creazione del Processo Autoregressivo AR(1):**

```python
phi = 0.6
ar_process = [0]
for t in range(1, len(date_range)):
    ar_process.append(phi * ar_process[t-1] + np.random.normal(0, 5))
df_ar1 = pd.DataFrame({"Value": ar_process}, index=date_range)
```

- `phi = 0.6`: Imposta il parametro di autoregressione (coefficienti AR).
- `ar_process = [0]`: Inizializza la lista con il primo valore (0).
- Il ciclo `for` calcola i valori successivi della serie AR(1), dove ogni valore dipende dal precedente (`phi * ar_process[t-1]`) più un errore casuale (distribuito normalmente con deviazione 5).
- `df_ar1 = pd.DataFrame({"Value": ar_process}, index=date_range)`: Crea il DataFrame con i dati generati.

#### **Creazione dei Grafici:**

```python
fig, axes = plt.subplots(2, 2, figsize=(12, 8))

# Change in Level
axes[0, 0].plot(df_level_change, label="", color="blue")
axes[0, 0].legend()
axes[0, 0].grid()

# Increasing Variance
axes[0, 1].plot(df_increasing_variance, label="", color="green")
axes[0, 1].legend()
axes[0, 1].grid()

# White Noise (Stationary)
axes[1, 0].plot(df_white_noise, label="", color="orange")
axes[1, 0].legend()
axes[1, 0].grid()

# AR(1) Process (Stationary)
axes[1, 1].plot(df_ar1, label="", color="purple")
axes[1, 1].legend()
axes[1, 1].grid()

plt.tight_layout()
plt.show()
```

- `fig, axes = plt.subplots(2, 2, figsize=(12, 8))`: Crea una griglia di 2x2 per disporre i grafici.
- `axes[...]`: Ogni `axes[x, y]` rappresenta un grafico nella griglia. In ogni grafico viene tracciata una delle serie temporali.
- `plt.tight_layout()`: Aggiusta automaticamente gli spazi tra i grafici.
- `plt.show()`: Mostra i grafici.

---

### **Conclusione:**
Il codice mostra come simulare diverse serie temporali con caratteristiche differenti, come cambiamenti di livello, varianza crescente, rumore bianco e un processo autoregressivo. Questo tipo di analisi è fondamentale per capire come i dati evolvono nel tempo e come possiamo modellare questi comportamenti per fare previsioni future.

### Lezione Teorica: Differenziazione delle Serie Temporali

Le serie temporali possono essere **non stazionarie**, il che significa che le loro caratteristiche statistiche, come la media e la varianza, cambiano nel tempo. Ad esempio, una serie temporale potrebbe avere una tendenza (trend) crescente o decrescente, o potrebbe esserci una stagionalità che causa fluttuazioni periodiche regolari.

#### Stazionarietà:
Una serie temporale è **stazionaria** se le sue proprietà statistiche non dipendono dal tempo. In altre parole:
- La **media** e la **varianza** devono rimanere costanti nel tempo.
- Non devono esserci trend (cambiamenti sistematici nel tempo) o stagionalità (fluttuazioni regolari).

La **differenziazione** è una delle tecniche più comuni per rendere una serie temporale stazionaria. Essa si basa sul calcolo delle differenze tra i valori consecutivi della serie. Questo processo può aiutare a eliminare o ridurre la tendenza e la stagionalità, stabilizzando la **media** della serie temporale.

#### Differenziazione:
- **Prima differenza**: La differenza tra ogni punto della serie temporale e il punto precedente. Se la serie mostra una tendenza lineare, la differenza tra i valori successivi rimuoverà questa tendenza.
- **Differenze successive**: Se la serie temporale non diventa stazionaria dopo una prima differenziazione, possiamo calcolare differenze di ordine superiore (ad esempio, la differenza della differenza, o la seconda differenza).

#### Stabilizzazione della Varianza:
Anche se la differenziazione è più utile per stabilizzare la **media**, in alcuni casi può anche avere un impatto sulla **varianza** della serie, in particolare se ci sono fenomeni stagionali.

### Logaritmo:
In alcuni casi, l'uso di una trasformazione logaritmica può essere utile per stabilizzare la varianza. La trasformazione logaritmica riduce le fluttuazioni più ampie in modo che la serie possa diventare più "uniforme" e gestibile.

### Applicazione della Differenziazione:

1. **Serie Temporale con Trend**: Se la serie mostra un trend crescente o decrescente, la differenziazione può eliminare questo trend e renderla stazionaria.
2. **Serie Temporale Stagionale**: Se la serie ha un comportamento stagionale (ad esempio, fluttuazioni regolari ogni anno), la differenziazione può aiutare a rimuovere questa componente stagionale.

### Teoria sull'uso del Codice:

Nel codice che hai mostrato, viene utilizzata la differenziazione per calcolare il cambiamento delle vendite tra due periodi consecutivi. Questo aiuterà a determinare se le vendite hanno una componente di trend e stagionalità, eliminando eventuali effetti non stazionari.

### Codice Rigo per Rigo:

```python
import pandas as pd
import numpy as np
```
- **Importazione delle librerie**: 
  - `pandas` è utilizzato per la manipolazione dei dati, come la creazione di DataFrame e la gestione delle date.
  - `numpy` è utilizzato per generare numeri casuali e operazioni matematiche come la generazione di numeri interi casuali.

```python
date_range = pd.date_range(start="2023-01-01", periods=12, freq="ME")
```
- **Creazione dell'intervallo di date**:
  - `pd.date_range` è una funzione di `pandas` che crea una sequenza di date. 
  - `start="2023-01-01"` indica che la prima data della sequenza è il 1° gennaio 2023.
  - `periods=12` significa che vogliamo 12 date, una per ogni mese (quindi, un periodo mensile).
  - `freq="ME"` indica la frequenza "ME", che sta per "Month End" (fine mese). Quindi la data di ogni periodo sarà l'ultimo giorno del mese.

```python
sales = np.random.randint(100, 500, size=len(date_range))
```
- **Generazione dei dati delle vendite**:
  - `np.random.randint(100, 500, size=len(date_range))` crea un array di numeri interi casuali compresi tra 100 e 500, con la stessa lunghezza dell'intervallo di date creato prima (`len(date_range)`).
  - Questi numeri rappresentano le vendite casuali per ciascun mese.

```python
df = pd.DataFrame({"date": date_range, "sales": sales}).set_index("date")
```
- **Creazione di un DataFrame**:
  - `pd.DataFrame({"date": date_range, "sales": sales})` crea un DataFrame con due colonne: una per le date e una per le vendite.
  - `.set_index("date")` imposta la colonna `date` come indice del DataFrame, così da avere le date come indice per una gestione migliore delle serie temporali.

```python
df["sales_change"] = df["sales"].diff()
```
- **Calcolo delle differenze tra le vendite**:
  - `df["sales"].diff()` calcola la differenza tra ogni valore delle vendite e il valore precedente. Questo aiuta a rimuovere la componente di trend, trasformando la serie in una versione stazionaria.
  - Il risultato viene salvato in una nuova colonna chiamata `sales_change`.

```python
df
```
- **Visualizzazione del DataFrame**:
  - Il comando `df` restituisce il DataFrame risultante, che ora contiene le colonne originali (`date` e `sales`) e la nuova colonna (`sales_change`) che mostra i cambiamenti nelle vendite tra un mese e l'altro.

### Risultato:
Il DataFrame finale mostra la serie temporale delle vendite originali e la serie dei cambiamenti nelle vendite. Se c'è una tendenza nelle vendite, questa sarà visibile nei cambiamenti di vendita. Se il cambiamento delle vendite è relativamente stabile, significa che la differenziazione ha reso la serie più stazionaria.

### Lezione Teorica Dettagliata:

#### 1. **Serie Temporali Non Stazionarie**:
Le serie temporali non stazionarie sono quelle in cui le proprietà statistiche, come la media e la varianza, non sono costanti nel tempo. Le principali cause di non stazionarietà includono:

- **Trend**: una tendenza generale crescente o decrescente nel tempo.
- **Stagionalità**: variazioni cicliche che si ripetono con una certa frequenza nel corso dell'anno (o di un altro periodo specifico).
- **Ciclicità**: oscillazioni a lungo termine che non sono necessariamente legate a periodi stagionali precisi.

Quando una serie temporale non è stazionaria, potrebbe essere necessario trasformarla in una serie stazionaria per applicare modelli statistici appropriati, come i modelli ARIMA (AutoRegressive Integrated Moving Average).

#### 2. **Random Walk**:
Il modello di "random walk" descrive una serie temporale in cui il valore di una variabile al tempo \( t \) dipende dal valore al tempo \( t-1 \) e da un errore casuale. La forma generale di un random walk è:

\[$
X_t = X_{t-1} + \epsilon_t
$\]

dove \( $X_t$ \) è il valore della serie al tempo \( $t$ \) e \( \$epsilon_t$ \) è un errore casuale (rumore bianco).

Un random walk può avere un "drift" (un andamento medio costante) che lo rende un "random walk con drift". La formula diventa:

\[$
X_t = X_{t-1} + c + \epsilon_t
$\]

dove \( $c$ \) è una costante che rappresenta il drift, cioè il cambiamento medio tra i periodi.

#### 3. **Differenziazione per Stazionarizzare una Serie**:
Quando una serie temporale è non stazionaria, una tecnica comune per trasformarla in stazionaria è la **differenziazione**. La differenza di primo ordine è semplicemente la sottrazione del valore di una serie al tempo \( t-1 \) dal valore al tempo \( t \):

\[$
Y_t = X_t - X_{t-1}
$\]

La differenza di secondo ordine è la differenza della differenza di primo ordine. Se una serie è ancora non stazionaria dopo una differenza di primo ordine, si può provare con una differenza di secondo ordine.

#### 4. **Differenziazione Stagionale**:
Nel caso di serie con stagionalità, è possibile utilizzare la **differenziazione stagionale**, che consiste nel sottrarre i valori da un periodo stagionale precedente (ad esempio, 12 mesi per dati mensili):

\[$
Y_t = X_t - X_{t-12}
$\]

La differenziazione stagionale rimuove il comportamento ciclico e aiuta a ottenere una serie stazionaria.

---

### Spiegazione del Codice, Rigo per Rigo:

#### **Importazione delle librerie**:
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
```
- `numpy`: utilizzato per la generazione di numeri casuali e per operazioni matematiche.
- `pandas`: utilizzato per la gestione dei dati sotto forma di DataFrame, una struttura dati tabellare.
- `matplotlib.pyplot`: utilizzato per creare grafici.

#### **Impostazione del seme per la riproducibilità**:
```python
np.random.seed(42)
```
Imposta il seme per il generatore di numeri casuali, garantendo che i risultati siano riproducibili.

#### **Creazione di un intervallo temporale**:
```python
date_range = pd.date_range(start="2010-01", periods=100, freq="ME")
```
Crea una serie temporale che inizia nel gennaio 2010 con 100 periodi mensili (`freq="ME"` indica la fine di ogni mese).

#### **Serie Temporale Non Stazionaria con Trend**:
```python
trend = np.linspace(50, 150, len(date_range))  # Increasing trend
trend_data = trend + np.random.normal(0, 5, len(date_range))  # Add noise
df_trend = pd.DataFrame({"Value": trend_data}, index=date_range)
```
- `np.linspace(50, 150, len(date_range))`: crea un array di valori che aumenta linearmente da 50 a 150, con lo stesso numero di punti della serie temporale.
- `np.random.normal(0, 5, len(date_range))`: genera rumore casuale (distribuzione normale) con media 0 e deviazione standard 5.
- `pd.DataFrame`: crea un DataFrame con i dati generati, utilizzando `date_range` come indice temporale.

#### **Differenziazione di primo ordine (rimozione del trend)**:
```python
df_trend_diff = df_trend.diff().dropna()
```
- `diff()`: calcola la differenza tra i valori consecutivi della serie temporale, rimuovendo il trend.
- `dropna()`: rimuove i valori NaN generati dalla differenza.

#### **Serie Temporale Non Stazionaria con Stagionalità**:
```python
seasonality = 10 * np.sin(2 * np.pi * date_range.month / 12)  # Seasonal pattern
seasonal_data = 50 + seasonality + np.random.normal(0, 3, len(date_range))  # Add noise
df_seasonal = pd.DataFrame({"Value": seasonal_data}, index=date_range)
```
- `np.sin(2 * np.pi * date_range.month / 12)`: crea un pattern stagionale che si ripete ogni anno.
- `np.random.normal(0, 3, len(date_range))`: aggiunge rumore casuale con media 0 e deviazione standard 3.
- `pd.DataFrame`: crea un DataFrame con la serie stagionale.

#### **Differenziazione stagionale (lag di 12 mesi)**:
```python
df_seasonal_diff = df_seasonal.diff(periods=12).dropna()
```
- `diff(periods=12)`: calcola la differenza tra i valori di una serie temporale separata da 12 periodi (in questo caso 12 mesi).
- `dropna()`: rimuove i valori NaN generati dalla differenza.

#### **Creazione dei grafici**:
```python
fig, axes = plt.subplots(2, 2, figsize=(12, 8))
```
Crea una figura con 2 righe e 2 colonne di sottotrame per visualizzare i grafici.

- **Serie non stazionaria con trend**:
```python
axes[0, 0].plot(df_trend, label="Original Trend Series", color="black")
axes[0, 0].set_title("Non-Stationary Time Series (Trend)")
axes[0, 0].legend()
axes[0, 0].grid()
```
Plotta la serie con trend originale, aggiunge il titolo e la griglia.

- **Serie differenziata (trend rimosso)**:
```python
axes[0, 1].plot(df_trend_diff, label="First Difference (Trend Removed)", color="blue")
axes[0, 1].set_title("First-Order Differencing (Stationary)")
axes[0, 1].legend()
axes[0, 1].grid()
```
Plotta la serie differenziata (dove il trend è stato rimosso), mostrando che la serie è ora stazionaria.

- **Serie non stazionaria con stagionalità**:
```python
axes[1, 0].plot(df_seasonal, label="Original Seasonal Series", color="black")
axes[1, 0].set_title("Non-Stationary Time Series (Seasonality)")
axes[1, 0].legend()
axes[1, 0].grid()
```
Plotta la serie con stagionalità originale.

- **Serie differenziata stagionalmente**:
```python
axes[1, 1].plot(df_seasonal_diff, label="Seasonally Differenced (Seasonality Removed)", color="blue")
axes[1, 1].set_title("Seasonal Differencing (Lag=12)")
axes[1, 1].legend()
axes[1, 1].grid()
```
Plotta la serie differenziata stagionalmente (rimuovendo la stagionalità) per ottenere una serie stazionaria.

#### **Aggiustamento finale del layout**:
```python
plt.tight_layout()
plt.show()
```
- `tight_layout()`: ottimizza il layout dei grafici per evitare sovrapposizioni.
- `show()`: visualizza il grafico.

---

Spero che la spiegazione teorica e la descrizione del codice ti siano state utili! Se hai altre domande, sono a tua disposizione.

### Lezione Teorica Dettagliata: Modellazione di Serie Temporali con ARIMA e SARIMA

#### **Serie Temporali e Stazionarietà**
Una **serie temporale** è una sequenza di dati ordinata nel tempo, dove ogni osservazione dipende dal tempo e può essere influenzata da diversi fattori. Le serie temporali possono essere **stazionarie** o **non stazionarie**:

- **Serie Stazionarie**: La media, la varianza e la covarianza della serie non dipendono dal tempo. In altre parole, le proprietà statistiche della serie non cambiano nel tempo. Le serie stazionarie sono ideali per l'applicazione di modelli come ARMA (Autoregressive Moving Average).
- **Serie Non Stazionarie**: Se una serie temporale presenta una tendenza o stagionalità, o se le sue proprietà statistiche cambiano nel tempo, si considera non stazionaria. In questo caso, potrebbe essere necessario applicare una **differenziazione** o utilizzare modelli come **ARIMA** o **SARIMA** per rendere la serie stazionaria.

#### **Test delle Radici Unitarie (Unit Root Tests)**
Un modo per determinare se una serie temporale è stazionaria è tramite il test delle radici unitarie. Il test **KPSS (Kwiatkowski-Phillips-Schmidt-Shin)** è un test comunemente usato dove la **ipotesi nulla** è che la serie sia stazionaria. Se il p-value del test è inferiore a una soglia (ad esempio, 0.05), possiamo rifiutare l'ipotesi nulla e concludere che la serie non è stazionaria.

#### **Modelli ARMA (Autoregressive Moving Average)**
I modelli ARMA sono utilizzati per modellare serie temporali stazionarie. Si compongono di due componenti:

1. **Autoregressivo (AR)**: Prevede i valori futuri utilizzando una combinazione lineare dei valori passati. In altre parole, la serie dipende da un numero finito di osservazioni precedenti.
2. **Media Mobile (MA)**: Modella l'errore del modello come una combinazione lineare di errori passati. L'errore è la differenza tra il valore osservato e il valore previsto.

#### **Modello ARIMA (AutoRegressive Integrated Moving Average)**
Il modello **ARIMA** è un'estensione del modello ARMA che viene utilizzato per le serie non stazionarie. L'idea principale è di differenziare la serie per renderla stazionaria (differenziazione integrata, **I**) e quindi applicare il modello ARMA ai dati differenziati. Il modello ARIMA è definito da tre parametri:

- **p**: Ordine dell'autoregressivo (AR).
- **d**: Ordine della differenziazione (I).
- **q**: Ordine della media mobile (MA).

#### **Modello SARIMA (Seasonal ARIMA)**
Il **SARIMA** è un'estensione del modello ARIMA che tiene conto della stagionalità nelle serie temporali. Questo modello è utile quando i dati hanno una componente stagionale che si ripete a intervalli regolari. Il modello SARIMA è definito da parametri aggiuntivi per la stagionalità:

- **P**: Ordine dell'autoregressivo stagionale.
- **D**: Ordine della differenziazione stagionale.
- **Q**: Ordine della media mobile stagionale.
- **m**: Periodo di stagionalità (ad esempio, 12 per una serie mensile con stagionalità annuale).

### Spiegazione del Codice Passo Passo

#### **1. Importazione delle librerie e generazione della serie temporale**
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import pmdarima as pm

import warnings
warnings.filterwarnings("ignore")
```
- **`numpy`**: Viene utilizzata per generare numeri casuali e manipolare array numerici.
- **`pandas`**: Utilizzato per la gestione dei dati in formato DataFrame.
- **`matplotlib.pyplot`**: Usato per creare grafici.
- **`pmdarima`**: Una libreria che fornisce una semplice implementazione dei modelli ARIMA e SARIMA, inclusa la funzione `auto_arima` per trovare automaticamente i migliori parametri del modello.
- **`warnings.filterwarnings("ignore")`**: Disattiva i messaggi di avviso per rendere l'output più pulito.

```python
# --- 1. Generate a Synthetic Time Series ---
np.random.seed(42)
date_range = pd.date_range(start="2010-01", periods=100, freq="ME")
trend = np.linspace(50, 150, len(date_range))  # Upward trend
seasonality = 10 * np.sin(2 * np.pi * date_range.month / 12)  # Annual seasonality
noise = np.random.normal(0, 5, len(date_range))  # Random noise
data = trend + seasonality + noise

df = pd.DataFrame({"Date": date_range, "Value": data}).set_index("Date")
```
- **`np.random.seed(42)`**: Imposta il seme per il generatore di numeri casuali, per ottenere risultati riproducibili.
- **`pd.date_range(...)`**: Crea un intervallo di date mensili a partire da gennaio 2010.
- **`trend`**: Crea una tendenza crescente (lineare).
- **`seasonality`**: Aggiunge una componente stagionale annuale alla serie temporale.
- **`noise`**: Aggiunge un rumore casuale alla serie temporale.
- **`df`**: Combina tutti questi elementi in un DataFrame con una colonna "Date" come indice.

#### **2. Fit del modello ARIMA usando `auto_arima`**
```python
model = pm.auto_arima(df["Value"], 
                      seasonal=True,  # Enable seasonal ARIMA
                      m=12,           # Seasonality of 12 months
                      stepwise=True,  # Efficient search
                      suppress_warnings=True)
```
- **`auto_arima`**: Cerca automaticamente il miglior modello ARIMA (o SARIMA) per la serie temporale.
  - **`seasonal=True`**: Indica che vogliamo includere la componente stagionale nel modello (SARIMA).
  - **`m=12`**: La stagionalità è di 12 periodi (mensile con stagionalità annuale).
  - **`stepwise=True`**: Abilita la ricerca passo-passo per trovare i migliori parametri del modello in modo efficiente.
  - **`suppress_warnings=True`**: Disattiva gli avvisi durante l'allenamento del modello.

#### **3. Previsione dei valori futuri**
```python
forecast_horizon = 24
forecast, conf_int = model.predict(n_periods=forecast_horizon, return_conf_int=True)
```
- **`forecast_horizon = 24`**: Imposta l'orizzonte della previsione (24 mesi nel futuro).
- **`model.predict(...)`**: Prevede i valori futuri per i prossimi 24 periodi e restituisce anche gli intervalli di confidenza (conf_int).

#### **4. Creazione dell'intervallo temporale futuro**
```python
future_dates = pd.date_range(start=df.index[-1] + pd.DateOffset(months=1), periods=forecast_horizon, freq="M")
```
- **`pd.date_range(...)`**: Crea un nuovo intervallo di date che parte dal mese successivo all'ultimo dato disponibile e ha una durata pari all'orizzonte della previsione.

#### **5. Creazione del grafico dei risultati**
```python
plt.figure(figsize=(10, 5))
plt.plot(df.index, df["Value"], label="Original Series", color="black")
plt.plot(future_dates, forecast, label="Forecast", linestyle="--", color="blue")
plt.fill_between(future_dates, conf_int[:, 0], conf_int[:, 1], color="blue", alpha=0.2, label="95% Prediction Interval")
plt.axvline(df.index[-1], color="gray", linestyle="--", label="Forecast Start")
plt.legend()
plt.title("ARIMA Forecast Using pmdarima")
plt.grid()
plt.show()
```
- **`plt.plot`**: Disegna la serie originale e le previsioni future.
- **`plt.fill_between`**: Aggiunge l'intervallo di confidenza (95%) per le previsioni.
- **`plt.axvline`**: Aggiunge una linea verticale che segna l'inizio delle previsioni.
- **`plt.legend`**: Aggiunge una legenda per identificare le diverse serie.
- **`plt.show()`**: Mostra il grafico risultante.

### Conclusioni
Il codice genera una serie temporale sintetica, applica il modello ARIMA (con stagionalità) per fare previsioni e visualizza i risultati, inclusi gli intervalli di confidenza delle previsioni future.