# Affidabilità longitudinale {#sec-sem-longitudinal-reliability}

**Prerequisiti**

**Concetti e Competenze Chiave**

**Preparazione del Notebook**

In [2]:
here::here("code", "_common.R") |>
    source()

# Load packages
if (!requireNamespace("pacman")) install.packages("pacman")
pacman::p_load(semTools, lme4, tidyr, psych)

## Introduzione

Nel @interrater-reliability abbiamo illustrato come calcolare l'affidabilità delle misure di un disegno longitudinale usando il framework della teoria della generalizzabilità. Questo capitolo affronta lo stesso problema usano i modelli di equazioni strutturali.

Grazie ai progressi tecnologici, i metodi di raccolta dati longitudinali intensivi si sono sviluppati notevolmente. Tali dati possono ora essere raccolti in maniera meno invasiva, riducendo gli ostacoli per i partecipanti. Tradizionalmente, i dati longitudinali si caratterizzavano per un numero limitato di misurazioni ripetute con ampi intervalli temporali. Le nuove tecniche di raccolta dati, ad esempio tramite applicazioni per smartphone o tablet, hanno portato a dati con un maggior numero di occasioni di misurazione, vicine tra loro temporalmente. Questi dati longitudinali intensivi permettono di investigare la dinamica di processi variabili, come i cambiamenti quotidiani di vari stati psicologici. 

I dati raccolti con misure quotidiane presentano una struttura annidata, in quanto più occasioni di misurazione sono raggruppate all'interno della stessa persona. Attualmente, due tecniche sono comunemente impiegate per analizzare l'affidabilità con dati annidati: la teoria della generalizzabilità e l'approccio fattoriale. La teoria della generalizzabilità scompone la varianza totale in elementi di tempo, item e persona, valutando così l'affidabilità del cambiamento nel tempo a livello individuale. Nonostante i suoi vantaggi, questo approccio si basa su assunzioni che potrebbero non essere sempre verificate dai dati.

L'approccio fattoriale è più flessibile e permette di modellare le associazioni degli item con il punteggio vero e le varianze degli errori. In particolare, l'analisi fattoriale confermativa multilivello (MCFA) viene utilizzata per ottenere elementi di varianza al fine di determinare l'affidabilità specifica per il tempo (a livello intra-individuale) e per la persona (a livello  inter-individuale). 

L'articolo di {cite:t}`van2022determining` descrive come sia possibile valutare l'affidabilità con dati longitudinali intensivi quotidiani. Nel loro tutorial, gli autori utilizzano dati empirici raccolti tramite una misura dello stress lavorativo quotidiano per insegnanti di scuola secondaria. Inoltre, {cite:t}`van2022determining` confrontano gli indici di affidabilità derivati dal metodo MCFA con quelli ottenuti tramite la teoria della generalizzabilità.

## Affidabilità nei Modelli Fattoriali a Livello Singolo

L'analisi fattoriale confermativa (CFA) è diventata lo standard per determinare la dimensionalità e l'affidabilità dei punteggi in psicologia. L'affidabilità, in dati con un singolo livello, può essere valutata mediante diversi indici. A differenza del coefficiente di consistenza interna $\alpha$, l'indice $\omega$ non assume che i diversi carichi fattoriali degli item contribuiscano equamente al costrutto latente.

I valori di $\omega$ variano da zero a uno, dove valori vicini a uno indicano una migliore affidabilità della scala. Il valore effettivo di $\omega$ può essere interpretato come la proporzione di varianza nei punteggi della scala spiegata dalla variabile latente comune a tutti gli indicatori. 

L'affidabilità composita $\omega$, per un costrutto misurato con $p$ item, è definita come:

$$
\omega = \frac{\sum_{i=1}^{p} \lambda_i^2 \Phi}{\sum_{i=1}^{p} \lambda_i^2 \Phi + \sum_{i=1}^{p} \theta_i},
$$

dove $i$ indica l'item, $\lambda$ rappresenta un carico fattoriale, $\Phi$ rappresenta la varianza del fattore, e $\theta$ rappresenta la varianza residua dell'item. 

{cite:t}`van2022determining` propongono il seguente esempio. Consideriamo un modello unifattoriale in cui la varianza del fattore sia fissata a 1 per l'identificazione del modello, con saturazioni su tre indicatori pari a 0.7, 0.8 e 0.9. Le specificità saranno dunque 0.51, 0.36 e 0.19. Possiamo determinare l'affidabilità $\omega$ della scala inserendo questi valori nell'equazione precedente, il che produce un'affidabilità di .84. 

$$
\begin{equation}
\omega = \frac{\left(0.70 + 0.80 + 0.90\right)^{2} 1}{\left(0.70 + 0.80 + 0.90\right)^{2} 1 + \left(0.51 + 0.36 + 0.19\right)}.
\end{equation}
$$

Questo significa che l'84% della varianza totale nei punteggi della scala è spiegata dal fattore comune.

## Affidabilità nei Modelli Fattoriali Multilivello

Nella ricerca psicologica, i dati spesso presentano una struttura annidata, dove le unità di livello inferiore sono considerate annidate in unità di livello superiore. Ad esempio, gli studenti possono essere annidati nelle classi, o i pazienti negli ospedali. Con misure giornaliere degli individui su diversi giorni, le occasioni di misurazione sono annidate negli individui. Allo stesso modo, i dati empirici utilizzati nell'esempio presentato qui, sono raccolti dagli stessi insegnanti durante 15 occasioni di misurazione. Queste occasioni sono annidate all'interno di ciascun insegnante. L'analisi fattoriale multilivello consente modelli diversi per varianze e covarianze delle differenze intra-individuali e inter-individuali (Muthén, 1994). Nell'esempio discusso, {cite:t}`van2022determining` si concentrano su strutture con due livelli, costituiti da occasioni (Livello 1, o il livello interno) all'interno di individui (Livello 2, o il livello esterno).

La Fig.{ref}`vanalphen-fig` fornisce una rappresentazione grafica di un modello fattoriale multilivello. In tale analisi fattoriale confermativa (CFA) a due livelli, i punteggi degli item sono decomposti in componenti (latenti) a livello interno ed esterno. La parte a livello esterno modella la struttura di covarianza a livello inter-individuale, spiegando le differenze tra gli individui. L'interpretazione di questa parte del modello è paragonabile a una CFA ad un singolo livello. La parte a livello interno modella la struttura di covarianza a livello delle occasioni di misurazione, spiegando le differenze all'interno degli individui tra i diversi punti temporali. In questo esempio, il livello dell'occasione è rappresentativo delle caratteristiche di stato degli individui, perché mostra i cambiamenti giornalieri delle condizioni degli individui. Il livello inter-individuale, quindi, si riferisce alle caratteristiche di tratto degli individui, poiché tali misure sono un aggregato delle misure giornaliere e rappresentano una misura più stabile (cioè, a lungo termine), simile a una misura della personalità.

::: {#fig-like-se}
![](../../figures/vanalphen_fig2.png){width="80%"}

Un modello configurale multilivello con i carichi fattoriali, varianze residuali e varianza del fattoriali dell'esempio discusso da @van2022determining.  (Figura tratta da @van2022determining)
:::

Geldhof et al. (2014) hanno esteso il metodo esistente per determinare ω a modelli a due livelli, risultando in indici di affidabilità a livello interno (ωw) e a livello esterno (ωb). Questo approccio è stato è stato poi sviluppato da Lai (2021). 

## Calcolo dell'Affidabilità della Scala con Dati Giornalieri

@van2022determining considerano un dataset che include misure longitudinali intensive giornaliere sullo stress degli insegnanti. In questo contesto, il fattore comune a livello esterno può essere interpretato come la componente stabile del fattore stress, mentre il fattore comune a livello interno rappresenta la parte variabile nel tempo del fattore stress. Quando ci si concentra sulle componenti a livello interno ed esterno dello stesso fattore, il modello fattoriale multilivello è conosciuto come modello configurale (Stapleton et al., 2016). 

Nel modello fattoriale configurale multilivello, i fattori a livello interno ed esterno riflettono le componenti interne ed esterne della stessa variabile latente. Di conseguenza, la struttura fattoriale è la stessa per entrambi i livelli e i carichi fattoriali sono uguali tra i livelli (Asparouhov & Muthen, 2012). Lai (2021) ha fornito equazioni per calcolare stime di affidabilità a livello interno (ωw) ed esterno (ωb), specificamente per questi modelli configurali. @van2022determining forniscono un esempio di calcolo per entrambi questi indici di affidabilità.

La seguente equazione viene utilizzata per determinare l'affidabilità a livello interno in un modello configurale:

$$ 
\omega_w = \frac{\sum (\lambda_i^2 \Phi_w)}{\sum (\lambda_i^2 \Phi_w) + \sum (\theta_w)},
$$

dove il pedice $w$ si riferisce al livello interno. Si noti che i carichi fattoriali ($\lambda$) non hanno un pedice specifico di livello perché sono vincolati ad essere uguali tra i livelli. 

Confrontando questa equazione omega al livello interno (2) con l'equazione utilizzata per determinare l'affidabilità utilizzando una CFA ad un livello singolo, si vede che la varianza fattoriale a livello interno ($\Phi_w$) viene utilizzata al posto della varianza totale ($\Phi$). In questo contesto multilivello, $\theta_w$ rappresenta la varianza residua solo al livello interno. 

Inserendo i nostri valori esemplificativi della @vanalphen-fig nell'Equazione precedente si ottiene un'affidabilità a livello interno di 0.84. Ciò significa che il fattore comune a livello interno spiega l'84% della varianza totale nei punteggi di deviazione della scala a livello interno:

$$ 
\omega_w = \frac{(0.70 + 0.80 + 0.90)^2}{(0.70 + 0.80 + 0.90)^2 + (0.51 + 0.36 + 0.19)} = 0.84. 
$$

Con il pedice $b$ che si riferisce al livello esterno, l'equazione per l'affidabilità a livello esterno in un modello configurale diventa quindi:

$$ 
\omega_b = \frac{\sum (\lambda_i^2 \Phi_b)}{\sum (\lambda_i^2 (\Phi_b + \Phi_w/n)) + \sum (\theta_b + \theta_w/n)},
$$

dove $n$ è il numero di misurazioni. In questa equazione, la varianza dell'errore di campionamento delle medie osservate a livello di persona viene aggiunta al denominatore aggiungendo $\Phi_w/n$ e $\Sigma \theta_w/n$. Nel nostro esempio, useremo $n = 15$. Nel contesto di misure longitudinali, ciò significa che i dati sono stati raccolti in 15 occasioni. Inserendo i valori esemplificativi di @van2022determining, l'affidabilità a livello esterno è 0.90, indicando che il fattore comune a livello esterno spiega il 90% della varianza totale nelle medie osservate a livello di persona dei punteggi della scala:

$$ 
\omega_b = \frac{(0.70 + 0.80 + 0.90)^2}{(0.70 + 0.80 + 0.90)^2(0.90 + 1/15) + (0.05 + 0.05 + 0.05) + ((0.51 + 0.36 + 0.19)/15)} = 0.90. 
$$

Queste equazioni forniscono un metodo per valutare l'affidabilità delle componenti a livello interno ed esterno di una scala in studi longitudinali intensivi, consentendo ai ricercatori di distinguere tra variazioni stabili e temporanee all'interno dei dati.

## Confronto con la Teoria della Generalizzabilità

@van2022determining hanno anche derivato le componenti di varianza per il calcolo del punteggio di affidabilità a livello interno e a livello esterno utilizzando la teoria della generalizzabilità. Per questi dati, @van2022determining trovano che la stima dell'affidabilità a livello interno è .87, molto simile alla stima ottenuta con l'approccio CFA multilivello. Tuttavia, la stima a livello esterno ottenuta con il metodo della generalizzabilità è 0.99, che è .11 più alta rispetto all'approccio analitico fattoriale. Questa differenza potrebbe essere causata dalle assunzioni più rigide fatte dal metodo della teoria della generalizzabilità. Tuttavia, @van2022determining notano che questi risultati sono specifici al dataset utilizzato e sarebbe necessario uno studio di simulazione per valutare, in generale, quali sono le differenze sistematiche tra le stime di affidabilità ottenute con i due diversi metodi.

Qui sotto viene presentato il metodo SEM per il calcolo dell'affidabilità inter- e intra-persona usando gli script R forniti da @van2022determining.

In [3]:
van_alphen <- read.table("../../data/data_van_alphen.dat", na.strings = "9999")
colnames(van_alphen) <- c("day", "school", "ID", "str1", "str2", "str3", "str4")
van_alphen |> head()

Unnamed: 0_level_0,day,school,ID,str1,str2,str3,str4
Unnamed: 0_level_1,<chr>,<int>,<int>,<int>,<int>,<int>,<int>
1,1,1,1,26.0,,24,78
2,1,1,30,,24.0,24,50
3,1,1,55,,36.0,70,72
4,1,1,92,,37.0,34,41
5,1,2,20,24.0,,24,36
6,1,2,22,12.0,,18,39


In [4]:
van_alphen |> tail()

Unnamed: 0_level_0,day,school,ID,str1,str2,str3,str4
Unnamed: 0_level_1,<chr>,<int>,<int>,<int>,<int>,<int>,<int>
1264,15,6,62,,66.0,57,61.0
1265,15,6,87,,42.0,59,83.0
1266,15,6,115,53.0,,53,45.0
1267,15,6,118,,16.0,32,16.0
1268,15,6,123,23.0,22.0,23,
1269,15,6,143,64.0,64.0,65,


In [5]:
## Step 5: calculating reliability indices

model5 <- "
        level: 1
            stress =~ L1*str1 + L2*str2 + L3*str3 + L4*str4
            stress ~~ 1*stress

            str1 ~~ tw1*str1
            str2 ~~ tw2*str2
            str3 ~~ tw3*str3
            str4 ~~ tw4*str4

        level: 2
            stress =~ L1*str1 + L2*str2 + L3*str3 + L4*str4
            stress ~~ fb*stress

            str1 ~~ tb1*str1
            str2 ~~ tb2*str2
            str3 ~~ tb3*str3
            str4 ~~ tb4*str4

          # means
            str1 + str2 + str3 + str4  ~ 1

          # reliability calculations
          lambda := L1 + L2 + L3 + L4
          thetaw := tw1 + tw2 + tw3 + tw4
          thetab := tb1 + tb2 + tb3 + tb4
          omega_w := lambda^2 / (lambda^2 + thetaw)
          omega_b := (lambda^2 * fb) / (lambda^2 * (1 / 15 + fb) + thetab + thetaw / 15)
    "

In [6]:
fit.step5 <- lavaan(
    model = model5, 
    data = van_alphen, 
    cluster = "ID",
    auto.var = TRUE,
    missing = "fiml"
)

"lavaan->lav_data_full():  
   Level-1 variable "str1" has no variance within some clusters . The cluster 
   ids with zero within variance are: 124, 19, 47, 66, 88, 138, 94."
"lavaan->lav_data_full():  
   Level-1 variable "str2" has no variance within some clusters . The cluster 
   ids with zero within variance are: 124, 83, 90, 19, 47, 66, 27, 51, 61, 
   106, 9, 53, 93, 94, 111."
"lavaan->lav_data_full():  
   Level-1 variable "str3" has no variance within some clusters . The cluster 
   ids with zero within variance are: 124, 19, 47, 66, 94."
"lavaan->lav_data_full():  
   Level-1 variable "str4" has no variance within some clusters . The cluster 
   ids with zero within variance are: 19, 47, 136, 94, 147, 135."
"lavaan->lav_data_full():  
   some cases are empty and will be ignored: 48 98 189 199 348 577 660 793 
   948 950 959 1001 1025 1207."
"lavaan->lav_lavaan_step11_estoptim():  
   Model estimation FAILED! Returning starting values."
"lavaan->lav_lavaan_step11_estoptim(): 

In [7]:
summary(fit.step5) |> print()

lavaan 0.6-18 did not run (perhaps do.fit = FALSE)?

  Estimator                                         ML
  Optimization method                           NLMINB
  Number of model parameters                        21
  Number of equality constraints                     4

                                                  Used       Total
  Number of observations                          1255        1269
  Number of clusters [ID]                          151            
  Number of missing patterns -- level 1              3            


Parameter Estimates:

  Standard errors                             Standard
  Information                                 Observed
  Observed information based on                Hessian


Level 1 [within]:

Latent Variables:
                   Estimate  Std.Err  z-value  P(>|z|)
  stress =~                                           
    str1      (L1)    1.000       NA                  
    str2      (L2)    0.814       NA                  
    str3  

## Informazioni sull'Ambiente di Sviluppo {.unnumbered}

In [3]:
sessionInfo()

R version 4.4.1 (2024-06-14)
Platform: aarch64-apple-darwin20
Running under: macOS 15.0

Matrix products: default
BLAS:   /Library/Frameworks/R.framework/Versions/4.4-arm64/Resources/lib/libRblas.0.dylib 
LAPACK: /Library/Frameworks/R.framework/Versions/4.4-arm64/Resources/lib/libRlapack.dylib;  LAPACK version 3.12.0

locale:
[1] C

time zone: Europe/Rome
tzcode source: internal

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] lme4_1.1-35.5     Matrix_1.7-0      ggokabeito_0.1.0  viridis_0.6.5    
 [5] viridisLite_0.4.2 ggpubr_0.6.0      ggExtra_0.10.1    gridExtra_2.3    
 [9] patchwork_1.3.0   bayesplot_1.11.1  semTools_0.5-6    semPlot_1.1.6    
[13] lavaan_0.6-18     psych_2.4.6.26    scales_1.3.0      markdown_1.13    
[17] knitr_1.48        lubridate_1.9.3   forcats_1.0.0     stringr_1.5.1    
[21] dplyr_1.1.4       purrr_1.0.2       readr_2.1.5       tidyr_1.3.1      
[25] tibble_3.2.1      ggplot2_