(lgm-intro-notebook)=
# Curve di crescita latente 

Quando si vuole studiare le differenze tra le persone, si confrontano i loro punteggi. Ma se l'attenzione è invece sui cambiamenti all'interno di ciascuna persona, sono necessarie informazioni longitudinali, cioè raccolte nel tempo, per descrivere le traiettorie di cambiamento. Per fare questo, occorre utilizzare un modello statistico che tenga conto sia delle differenze tra le persone sia dei cambiamenti nel tempo all'interno di ciascuna persona. Esistono due framework statistici per risolvere questo problema: i modelli misti e un'estensione del framework SEM (Structural Equation Modeling) per dati longitudinali. Nel seguito della dispensa si darà un'introduzione a questi metodi, con particolare attenzione al framework SEM per dati longitudinali.

## Misurare il cambiamento

Il modo più semplice per valutare il cambiamento individuale tra due momenti temporali è calcolare la differenza tra i punteggi ottenuti nelle due occasioni. Tuttavia, questa strategia presenta un problema: non conosciamo il vero punteggio dell'individuo nei due momenti temporali, ma solo un punteggio influenzato dall'errore di misurazione. L'errore di misura può ridurre drasticamente la precisione delle valutazioni sulle differenze individuali nel cambiamento.

Per superare questo problema, è stato introdotto un insieme di modelli SEM per dati longitudinali chiamati *Latent Growth Models* (LGM). Questi modelli LGM assumono che ogni individuo abbia una traiettoria di cambiamento latente unica. Di conseguenza, i dati in ogni momento temporale sono considerati come la somma di (a) punteggi non osservati o latenti che rappresentano il livello dell'individuo in quel momento, (b) punteggi latenti che rappresentano il cambiamento individuale nel tempo e (c) caratteristiche uniche non osservate ma indipendenti delle misurazioni.

Questa descrizione del cambiamento porta alla formulazione di un modello SEM in cui si ipotizzano tre tipi di fattori latenti:

- un fattore latente comune che rappresenta il livello latente dell'individuo in un momento temporale (punto *a*);
- un fattore latente comune che rappresenta il cambiamento latente del livello dell'individuo tra il tempo $t-1$ e $t$ (punto *b*);
- un fattore latente specifico che rappresenta l'errore di misura in ogni momento temporale $t$ (punto *c*).

Il punteggio osservato della persona $i$ al tempo $t$ può essere espresso come:

$$
x_{it} = \tau_i + (1)\xi_1 + (t)\xi_2 + \delta_{it}
$$

dove $\tau_i$ rappresenta il livello latente dell'individuo $i$ al tempo iniziale, $\xi_1$ rappresenta il carico del fattore comune per il livello latente, $\xi_2$ rappresenta il carico del fattore comune per il cambiamento latente e $\delta_{it}$ rappresenta l'errore di misura specifico del momento $t$ per l'individuo $i$.

Vedremo che, nel modello, le intercette osservate sono vincolate ad essere 0, per cui $\tau_i = 0$. Se ci sono cinque misurazioni temporali, per esempio, il modello diventa

$$
\begin{align}
x_{1} &= 0 + (1)\xi_{1} + (0)\xi_{2} + \delta_{1} \notag\\
x_{2} &= 0 + (1)\xi_{1} + (1)\xi_{2} + \delta_{2} \notag\\
x_{3} &= 0 + (1)\xi_{1} + (2)\xi_{2} + \delta_{3} \notag\\
x_{4} &= 0 + (1)\xi_{1} + (3)\xi_{2} + \delta_{4} \notag\\
x_{5} &= 0 + (1)\xi_{1} + (4)\xi_{2} + \delta_{5} \notag
\end{align}
$$

Inoltre, il modello ipotizza che $\xi_1$ e $\xi_e$ siano correlati, come indicato nella matrice di inter-correlazione fattoriale

$$
\mathbf{\Phi} =
\begin{bmatrix}
\phi_{11} & \\
\phi_{21} & \phi_{22}
\end{bmatrix}
$$

dove $\phi_{11}$ è la varianza dell’intercetta latente, $\phi_{22}$ è la varianza della pendenza latente e $\phi_{21}$ è la covarianza dell’intercetta e della pendenza.

La figura {ref}`lgm-fig` mostra il diagramma di percorso che rappresenta il modello LGM che stiamo discutendo:


```{figure} images/lgm_stat_mod.png
---
height: 400px
name: lgm-fig
---
Modello di crescita latente
```

Il modello di crescita latente definito dalle equazioni precedenti porta a una serie di previsioni sulla struttura delle medie e delle covarianze dei dati osservati. Queste previsioni del modello vengono utilizzate nel contesto della modellizzazione delle equazioni strutturali per calcolare le stime dei parametri e gli indici di adattamento del modello. La struttura delle covarianze ($\boldsymbol{\Sigma}$) prevista dal modello di crescita latente è

$$
\boldsymbol{\Sigma} = \boldsymbol{\Lambda} \boldsymbol{\Phi} \boldsymbol{\Lambda}' + \boldsymbol{\Theta}.
$$

Diversi tipi di modelli di crescita latente possono essere specificati cambiando le dimensioni e i valori contenuti nella matrice $\boldsymbol{Λ}$. Per il modello senza crescita, $\boldsymbol{Λ}$ è una matrice T × 1 (colonna) perché c’è solo una variabile latente nel modello senza crescita. Per il modello a crescita lineare, $\boldsymbol{Λ}$ è una matrice T × k, con k rilevazioni temporali, dove le saturazioni fattoriali sono fisse e uguali alla separazione temporale tra le rilevazioni. Per esempio, con cinque misurazioni temporali, le saturazioni fattoriali saranno specificate ai valori 0, 1, 2, 3, 4. Si noti che, in questo modo, si assume che tutte le unità di osservazione siano state misurate nella stessa occasione temporale. A differenza dei modelli CFA tradizionali in cui l’interpretazione si concentra sulle saturazioni fattoriali, nei modelli di crescita latente le saturazioni fattoriali sono fisse

$$
\Lambda =
\begin{pmatrix}
1 & 0 \\
1 & 1 \\
1 & 2 \\
1 & 3 \\
1 & 4 \\
\end{pmatrix}
$$

il che implica che l’attenzione è rivolta all’intercetta latente e al fattore di pendenza latente.


## Domande della ricerca

I modelli LGM (Linear Growth Models) sono utilizzati per l'analisi dei dati longitudinali in cui una misura di esito viene osservata in diversi momenti nel tempo, al fine di studiare il cambiamento nel tempo. Cinque motivi principali per l'utilizzo di questi modelli sono elencati da {cite:t}`grimm2016growth`.

Il primo motivo è l'identificazione diretta del cambiamento e della stabilità intra-individuale. Questo si riferisce alla capacità di identificare se e come specifici attributi dell'individuo cambiano o rimangono gli stessi nel tempo, attraverso la misurazione ripetuta dello stesso individuo. Il cambiamento può essere incrementale o trasformazionale, e l'obiettivo è ottenere una descrizione accurata e parsimoniosa di come e quando gli attributi dell'individuo cambiano nel tempo.

Il secondo motivo è l'identificazione delle differenze interindividuali nel cambiamento intra-individuale. Ci si chiede se diversi individui cambino in modi diversi, in quantità o direzioni diverse o se passino da uno stadio all'altro in momenti diversi.

Il terzo motivo è l'analisi delle interrelazioni nel cambiamento comportamentale. Ci sono cambiamenti simultanei e/o sequenziali in più costrutti, e l'analisi richiede la valutazione di come i cambiamenti in una variabile influenzino i cambiamenti in un'altra variabile.

Il quarto motivo è l'analisi delle cause del cambiamento intra-individuale, al fine di identificare i fattori e/o i meccanismi variabili nel tempo che influenzano i cambiamenti intra-individuali.

Infine, il quinto motivo è l'analisi delle cause delle differenze interindividuali nel cambiamento intra-individuale, al fine di identificare le variabili invarianti nel tempo che sono correlate a specifici aspetti del cambiamento all'interno della persona, come le caratteristiche demografiche, gli interventi sperimentali e le caratteristiche dei contesti degli individui.
