(mmm-notebook)=
# CFA per matrici multi-tratto multi-metodo 

In [1]:
source("../_common.R")
suppressPackageStartupMessages(library("lavaan"))

La validità descrive quanto accuratamente un metodo di misurazione riesce a quantificare ciò che è inteso misurare. Esistono diverse categorie di validità, ognuna delle quali si verifica attraverso metodi specifici. Una suddivisione convenzionale delle diverse tipologie di validità, che non riflette necessariamente gli sviluppi più recenti in questo campo, può essere descritta come segue (per ulteriori dettagli si rimanda al capitolo dedicato alla validità nella presente dispena):

- **Validità di facciata**: Valuta se gli item di un test appaiono appropriati e ragionevoli rispetto al costrutto che si intende misurare, sia agli occhi di chi partecipa al test sia di chi lo utilizza. Questo tipo di validità è basato sulla percezione esteriore della misura e si valuta tramite i giudizi di esperti sulla plausibilità delle misure.

- **Validità di contenuto**: Una misura possiede validità di contenuto quando i suoi indicatori rappresentano in modo esaustivo e accurato l'area di contenuto da misurare. Anche questa validità si basa sui giudizi di esperti.

- **Validità di costrutto**: Corrisponde alla definizione generale di validità e si riferisce alla capacità di uno strumento di misurare il costrutto che intende misurare. La validità di costrutto si verifica attraverso la correttezza con cui gli indicatori misurano i costrutti teorici di interesse e si convalida attraverso l'analisi delle relazioni tra il costrutto misurato e altri costrutti correlati, secondo modelli teorici specifici.

- **Validità di criterio**: Indica la capacità di uno strumento di fare previsioni accurate su un criterio esterno, valutando quanto bene la misura predice questo criterio.

- **Validità concorrente**: Si determina osservando quanto uno strumento di misurazione correla con altri strumenti considerati validi per misurare lo stesso attributo. Una forte correlazione è generalmente vista come una conferma della validità.

- **Validità convergente**: Si verifica confrontando e correlando i punteggi ottenuti con la misura da validare con quelli ottenuti da un altro costrutto teoricamente relazionato. La verifica di questa validità dipende dall'esistenza di misure valide per costrutti correlati.

- **Validità discriminante**: È l'opposto della validità convergente e si verifica quando la misura in esame non mostra correlazioni significative con le misure di costrutti teoricamente distinti.

### MTMM e CFA

La Matrice Multi-Tratto Multi-Metodo (MTMM) è un approccio utilizzato per valutare la validità di costrutto, esaminando la correlazione tra diversi costrutti misurati sia con gli stessi metodi sia con metodi differenti. La validità di costrutto è considerata alta quando la misura di un costrutto è indipendente dal metodo di misurazione utilizzato.

### Un esempio concreto

Nell'esempio discusso da {cite:t}`brown2015confirmatory`, il ricercatore desidera esaminare la validità del costrutto dei disturbi di personalità del Cluster A del DSM-IV, che sono pattern persistenti di sintomi caratterizzati da comportamenti strani o eccentrici (American Psychiatric Association, 1994). Il cluster A comprende tre costrutti di disturbo della personalità: 

- *paranoico* (un pattern duraturo di sfiducia e sospetto tale che le motivazioni degli altri sono interpretate come malevole); 
- *schizoide* (un pattern duraturo di distacco dalle relazioni sociali e una gamma ristretta di espressioni emotive); 
- *schizotipico* (un pattern duraturo di disagio acuto nelle relazioni sociali, distorsioni cognitive e percettive ed eccentricità comportamentali). 

In un campione di 500 pazienti, ciascuno di questi tre tratti è misurato mediante tre metodi di valutazione: 

- un inventario di *autovalutazione* dei disturbi di personalità; 
- valutazioni dimensionali da un *colloquio clinico* strutturato sui disturbi della personalità; 
- *valutazioni osservazionali* effettuate da psicologi.

I dati sono contenuti in una matrice 3 (T) × 3 (M), organizzata in modo tale che le correlazioni tra i diversi tratti (disturbi della personalità: paranoico, schizotipico, schizoide) siano annidate all'interno di ciascun metodo (tipo di valutazione: inventario, colloquio clinico, valutazioni degli osservatori). 

I dati sono riportati qui sotto.

In [3]:
sds <- c(3.61,  3.66,  3.59,  2.94,  3.03,  2.85,  2.22,  2.42,  2.04)

cors <- '
  1.000 
  0.290  1.000 
  0.372  0.478  1.000 
  0.587  0.238  0.209  1.000 
  0.201  0.586  0.126  0.213  1.000 
  0.218  0.281  0.681  0.195  0.096  1.000 
  0.557  0.228  0.195  0.664  0.242  0.232  1.000 
  0.196  0.644  0.146  0.261  0.641  0.248  0.383  1.000 
  0.219  0.241  0.676  0.290  0.168  0.749  0.361  0.342  1.000'

covs <- getCov(
  cors, 
  sds = sds, 
  names = c("pari", "szti", "szdi", "parc", "sztc", "szdc", "paro", "szto", "szdo")
  )

La Matrice Multi-Tratto Multi-Metodo (MTMM) si organizza in due tipi di blocchi di coefficienti:

1. **Blocchi di mono-metodo**: contengono le correlazioni tra indicatori che provengono dallo stesso metodo di misurazione. Questi blocchi esaminano come diversi indicatori del medesimo tratto si correlano tra loro quando misurati tramite lo stesso strumento.

2. **Blocchi di etero-metodo**: includono le correlazioni tra indicatori misurati mediante metodi diversi. Particolarmente significativa è la "diagonale di validità" all'interno di questi blocchi, dove le correlazioni rappresentano stime di validità convergente. In altre parole, misure diverse di costrutti teoricamente simili dovrebbero mostrare forti correlazioni.

Nell'analisi MTMM, una forte correlazione tra metodi che misurano lo stesso tratto evidenzia la validità convergente. Per esempio, potrebbe risultare che diverse misure della personalità schizotipica mostrino correlazioni elevate, con coefficienti \( r \) che variano da 0.676 a 0.749. Al contrario, elementi al di fuori della diagonale nei blocchi di etero-metodo rivelano la validità discriminante, dove le misure di costrutti teoricamente distinti non dovrebbero essere altamente correlate. Questa validità è confermata quando tali correlazioni sono significativamente più basse rispetto a quelle della diagonale di validità, ad esempio, coefficienti che variano da 0.126 a 0.290.

Inoltre, è possibile rilevare gli effetti del metodo esaminando gli elementi al di fuori della diagonale nei blocchi di mono-metodo. Qui, la varianza nelle correlazioni tra diversi tratti misurati con lo stesso metodo, rispetto alle correlazioni tra gli stessi tratti misurati con metodi diversi, riflette l'entità degli effetti del metodo. Ad esempio, le valutazioni dell'osservatore dei tratti della personalità paranoica e schizotipica potrebbero essere più correlate (r = 0.383) rispetto alle loro misure con metodi diversi (ad esempio, la correlazione tra le misure di personalità paranoide e schizotipica, con l'uso rispettivamente dell'inventario e della valutazione dell'osservatore, è di 0.196).

La validità del costrutto è supportata quando i dati indicano alta validità convergente e discriminante con effetti del metodo trascurabili.

Il modello CFA per analizzare la matrice MTMM può includere correlazioni residue tra le specificità di ciascun metodo, supponendo che ogni fattore comune (come `paranoid`, `schizotypal`, `schizoid`) sia identificato da item misurati con metodi diversi e che le specificità di ciascun metodo siano correlate tra loro.

{cite:t}`brown2015confirmatory` mostra come sia possibile analizzare la matrice MTMM con un modello CFA nel quale si ipotizza che vi siano correlazioni residue tra le specificità di ciascun metodo. Il modello è dunque formulato nel modo seguente: ogni fattore comune (`paranoid`, `schizotypal`, `schizoid`) è identificato dagli item corrispondenti definiti da metodi diversi; le specificità di ciascun metodo, inoltre, sono correlate tra loro.

In [5]:
model <- '
  paranoid    =~ pari + parc + paro
  schizotypal =~ szti + sztc + szto
  schizoid    =~ szdi + szdc + szdo
  pari ~~ szti + szdi
  szti ~~ szdi
  parc ~~ sztc + szdc
  sztc ~~ szdc
  paro ~~ szto + szdo
  szto ~~ szdo
'  

Adattiamo il modello ai dati.

In [6]:
fit <- cfa(
  model, 
  sample.cov = covs, 
  sample.nobs = 500, 
  std.lv = TRUE
)

Esaminiamo la soluzione ottenuta.

In [7]:
summary(fit, fit.measures = TRUE, standardized = TRUE) |>
    print()

lavaan 0.6.17 ended normally after 59 iterations

  Estimator                                         ML
  Optimization method                           NLMINB
  Number of model parameters                        30

  Number of observations                           500

Model Test User Model:
                                                      
  Test statistic                                14.371
  Degrees of freedom                                15
  P-value (Chi-square)                           0.498

Model Test Baseline Model:

  Test statistic                              2503.656
  Degrees of freedom                                36
  P-value                                        0.000

User Model versus Baseline Model:

  Comparative Fit Index (CFI)                    1.000
  Tucker-Lewis Index (TLI)                       1.001

Loglikelihood and Information Criteria:

  Loglikelihood user model (H0)              -9879.996
  Loglikelihood unrestricted model (H1)      -98

In [8]:
effectsize::interpret(fit) |>
    print()

    Name      Value Threshold Interpretation
1    GFI 0.99376810      0.95   satisfactory
2   AGFI 0.98130431      0.90   satisfactory
3    NFI 0.99425997      0.90   satisfactory
4   NNFI 1.00061169      0.90   satisfactory
5    CFI 1.00000000      0.90   satisfactory
6  RMSEA 0.00000000      0.05   satisfactory
7   SRMR 0.02482894      0.08   satisfactory
8    RFI 0.98622392      0.90   satisfactory
9   PNFI 0.41427499      0.50           poor
10   IFI 1.00025272      0.90   satisfactory


Per i dati considerati da {cite:t}`brown2015confirmatory`, l'adattamento del modello MTMM è eccellente. Ciò fornisce forti evidenze di validità di costrutto per i fattori Paranoico, Schizoide e Schizotipico che sono stati ipotizzati.


## Session Info

In [9]:
sessionInfo()

R version 4.3.3 (2024-02-29)
Platform: aarch64-apple-darwin20 (64-bit)
Running under: macOS Sonoma 14.4.1

Matrix products: default
BLAS:   /Library/Frameworks/R.framework/Versions/4.3-arm64/Resources/lib/libRblas.0.dylib 
LAPACK: /Library/Frameworks/R.framework/Versions/4.3-arm64/Resources/lib/libRlapack.dylib;  LAPACK version 3.11.0

locale:
[1] C

time zone: Europe/Rome
tzcode source: internal

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] ggokabeito_0.1.0  viridis_0.6.5     viridisLite_0.4.2 ggpubr_0.6.0     
 [5] ggExtra_0.10.1    bayesplot_1.11.1  gridExtra_2.3     patchwork_1.2.0  
 [9] semTools_0.5-6    semPlot_1.1.6     lavaan_0.6-17     psych_2.4.3      
[13] scales_1.3.0      markdown_1.12     knitr_1.45        lubridate_1.9.3  
[17] forcats_1.0.0     stringr_1.5.1     dplyr_1.1.4       purrr_1.0.2      
[21] readr_2.1.5       tidyr_1.3.1       tibble_3.2.1      ggplot2_3.5.0    
[25] tidyvers