(rasch-assumptions-notebook)=
# Assunzioni e Proprietà del Modello di Rasch


In questo capitolo, esaminiamo le proprietà importanti del modello di Rasch. Queste proprietà sono il motivo per cui il modello di Rasch è così teoricamente attraente e hanno portato al suo ampio utilizzo. Forse la proprietà più importante è il fatto che permette una misurazione oggettiva dei tratti latenti.

In [19]:
suppressPackageStartupMessages({
    library("tidyverse")
    library("grid")
    library("mirt")
    library("TAM")
    # devtools::install_github("masurp/ggmirt")
    library("ggmirt")
    library("latex2exp")
    })

## Statistiche Sufficienti

Una statistica è definita come qualsiasi funzione dei dati osservati. Tipicamente, le statistiche sono utilizzate per riassumere caratteristiche importanti dei dati. Ad esempio, la media campionaria dei valori di $ x_p $ per le persone da 1 a P,

$$ \bar{x} = \frac{1}{P} \sum_{p=1}^{P} x_p, $$

riassume le informazioni contenute nel campione riguardo la media di una popolazione, il valore atteso. Ecco perché è spesso utilizzata per stimare il valore atteso dai campioni. Da un punto di vista statistico, diciamo che $ \bar{x} $ è uno stimatore per il valore atteso.

$ \bar{x} $ non è l'unica statistica che potremmo usare per stimare una media di popolazione. Ad esempio, potremmo provare a utilizzare la media del primo, terzo e quinto valore, $ x^* = \frac{1}{3} (x_1 + x_3 + x_5) $, invece di $ \bar{x} $. Anche questa statistica stimerebbe la media della popolazione, ma sarebbe meno accurata di $ \bar{x} $ in media. Il motivo è che $ x^* $ ignora le informazioni sulla media della popolazione portate da $ x_2, x_4, $ ecc.

Si scopre che $ \bar{x} $ estrae tutte le informazioni sulla media della popolazione contenute nel campione. Statistiche con questa proprietà sono chiamate statistiche sufficienti. Questo contrasta con statistiche come $ x^* $, che ignorano alcune delle informazioni sulla media della popolazione. Poiché le statistiche sufficienti contengono tutte le informazioni nel campione su una quantità di interesse, conoscere la statistica sufficiente rende i campioni individuali irrilevanti. Questa è la bellezza delle statistiche sufficienti: estraggono tutte le informazioni in un campione su una quantità di interesse e le riassumono usando un singolo numero.

Ogni parametro sconosciuto nel modello di Rasch ha una statistica sufficiente. Il numero di item risolti correttamente dalla persona p, o punteggio totale, è una statistica sufficiente per il parametro della persona $ \theta_p $. Possiamo calcolare il punteggio totale della persona p sommando tutte le voci nella riga p della matrice dei dati. Per questo motivo, i punteggi totali sono spesso chiamati somme di riga, e li indicheremo con $ r_p $. Allo stesso modo, il numero di persone che rispondono correttamente all'item i è una statistica sufficiente per il parametro dell'item $ \beta_i $. Possiamo calcolare questa statistica sommando tutte le voci nella colonna i. Indicheremo la somma della colonna i con $ c_i $. Le somme di riga e colonna per il nostro esempio introduttivo sono mostrate nella Tabella seguente.

|       | Item 1 | Item 2 | Item 3 | Item 4 | Somma di Righe (rp) |
|-------|--------|--------|--------|--------|---------------------|
| Pers. 1 |   1    |   0    |   1    |   1    |         3           |
| Pers. 2 |   1    |   1    |   0    |   0    |         2           |
| Pers. 3 |   0    |   1    |   1    |   1    |         3           |
| **Somma di Colonne (ci)** |   2    |   2    |   2    |   2    |                     |

Il fatto che il punteggio totale di una persona sia una statistica sufficiente per il parametro della persona $ \theta_p $ significa che non abbiamo bisogno di sapere quali item una persona ha risolto per stimare la sua abilità, solo quanti item ha risolto. A prima vista, questo sembra contraddire il nostro requisito che la probabilità di una risposta corretta dipenda sia dall'abilità della persona sia dalla difficoltà dell'item. Se le risposte di una persona agli item di un test dipendono sia dalla sua abilità sia dalle difficoltà degli item del test, come possono le somme di riga contenere tutte le informazioni sull'abilità di una persona? Non dovrebbero contare le difficoltà degli item individuali? Tuttavia, se guardiamo al pattern di risposte corrette e errate di una persona su un intero test, ha senso che il numero totale di item risolti da una persona sia indicativo della sua abilità. Una persona con bassa abilità sarà in grado di risolvere solo item facili, mentre una persona con alta abilità sarà in grado di risolvere sia item facili sia più difficili. Di conseguenza, ci aspetteremmo che le persone con alta abilità rispondano correttamente a più item in totale.

Questo non significa che le persone con maggiore abilità risponderanno sempre correttamente a più item. Il modello di Rasch descrive la relazione tra l'abilità di una persona e le sue risposte al test in modo probabilistico. Questo approccio probabilistico è stato un importante avanzamento del modello di Rasch e dei modelli correlati rispetto alla visione deterministica alla base dei pattern di risposta perfetti di una struttura di Guttman. Per questo motivo, non possiamo dire con certezza come una persona risponderà a un item individuale, anche quando conosciamo l'abilità della persona e la difficoltà dell'item. Molti fattori oltre all'abilità possono influenzare la risposta di una persona in una particolare amministrazione del test. Il modello di Rasch non tiene conto esplicitamente di questi, ma li subsume nella risposta probabilistica. In seguito verranno introdotti modelli che tengono esplicitamente conto di aspetti aggiuntivi, come il guessing negli item a scelta multipla.

Il modello di Rasch afferma che in media una persona con maggiore abilità è più propensa a rispondere correttamente a un item di difficoltà data. Per illustrare questo punto, immagina una persona con maggiore abilità e una con minore abilità. Ognuna completa 100 item diversi della stessa difficoltà media. La persona con maggiore abilità risponderà probabilmente non a tutti, ma ad esempio a circa 80 di quei 100 item correttamente, e la persona con minore abilità non a nessuno, ma circa a 20, perché la risposta non è guidata deterministicamente ma probabilisticamente dall'abilità e dalla difficoltà.

## Indipendenza Stocastica Locale

La maggior parte dei modelli statistici assume che gli eventi individuali siano stocasticamente indipendenti l'uno dall'altro. Ciò significa che sapere come si sviluppa uno degli eventi non ci fornisce informazioni su come si svilupperanno gli altri eventi. Un altro modo di esprimere questo è dire che conoscere l'esito di uno degli eventi non cambia le probabilità degli altri eventi. Nelle applicazioni pratiche, questa assunzione è generalmente ragionevole e rende molto più semplice calcolare la probabilità congiunta di tutti gli eventi. Ad esempio, supponiamo di voler calcolare la probabilità che, lanciando una moneta due volte, si ottengano due volte testa. Per una moneta equilibrata, c'è una probabilità del 50% di ottenere testa ad ogni lancio. Sapere che il primo lancio è risultato in testa non cambia questa probabilità.

La probabilità congiunta di due eventi indipendenti è uguale al prodotto delle loro probabilità individuali. Possiamo utilizzare questo fatto per calcolare la probabilità di ottenere due teste nel nostro esempio del lancio della moneta. Poiché ogni lancio ha una probabilità del 0.5 di risultare in testa, la probabilità che entrambi i lanci diano testa è 0.5 × 0.5 = 0.25.

### Item

Il modello di Rasch utilizza l'assunzione di indipendenza stocastica locale per definire la probabilità congiunta delle risposte al test di una persona data la sua abilità e le difficoltà degli item. Come nell'esempio del lancio della moneta, possiamo calcolare la probabilità che una persona p risponda correttamente ai primi due item di un test moltiplicando $\text{Pr}(U_{p1} = 1 | \theta_p, \beta_1)$ per $\text{Pr}(U_{p2} = 1 | \theta_p, \beta_2)$. Possiamo ottenere la probabilità congiunta di un pattern arbitrario di risposte in due item con difficoltà $\beta_1$ e $\beta_2$ allo stesso modo, ovvero

$$ 
\text{Pr}(U_{p1} = u_{p1}, U_{p2} = u_{p2} | \theta_p, \beta_1, \beta_2) = \text{Pr}(U_{p1} = u_{p1} | \theta_p, \beta_1) \times \text{Pr}(U_{p2} = u_{p2} | \theta_p, \beta_2). 
$$

Chiaramente, questo diventerebbe complicato da scrivere per un test di $I$ item. Possiamo semplificare le cose usando i vettori. Un vettore è semplicemente una collezione indicizzata di numeri. Ad esempio, il vettore $\beta = (\beta_1, ..., \beta_I)$ raccoglie tutti i parametri degli item, e il vettore $u_{p\cdot} = (u_{p1}, ..., u_{pI})$ raccoglie tutte le risposte della persona $p$ agli item del test. Gli i-esimi elementi di questi vettori sono il parametro dell'item $\beta_i$ dell'i-esimo item e la risposta $u_{pi}$ della persona p all'item $i$, rispettivamente.

I vettori casuali estendono questa idea alle variabili casuali. Un vettore casuale è una collezione indicizzata di variabili casuali. Ad esempio, possiamo raccogliere tutte le variabili casuali associate alle risposte della persona p$$ ai $I$ item in un vettore casuale $U_{p\cdot} = (U_{p1}, ..., U_{pI})$. L'i-esimo elemento di $U_{p\cdot}$ è $U_{pi}$, la variabile casuale associata alla risposta della persona $p$ all'item $i$. Questo ci permette di semplificare

$$ 
\text{Pr}(U_{p1} = u_{p1}, ..., U_{pI} = u_{pI} | \theta_p, \beta_1, ..., \beta_I) = \text{Pr}(U_{p\cdot} = u_{p\cdot} | \theta_p, \beta) 
$$

usando il fatto che due vettori sono uguali quando tutti i loro elementi sono uguali.

Possiamo usare vettori casuali per calcolare la probabilità congiunta del pattern di risposte della persona $p$ agli $I$ item del test usando il simbolo del prodotto $\prod_{i=1}^{I}$. La probabilità che la persona $p$ dia il pattern di risposta $u_{p\cdot}$ è

$$ 
\text{Pr}(U_{p\cdot} = u_{p\cdot} | \theta_p, \beta) = \prod_{i=1}^{I} \text{Pr}(U_{pi} = u_{pi} | \theta_p, \beta_i), 
$$

quando tutte le risposte di $p$ sono indipendenti. Sostituendo il lato destro dell'eq. {eq}`eq-rasch-model` per $\text{Pr}(U_{pi} = u_{pi} \mid \theta_p, \beta_i)$, otteniamo

$$ 
\text{Pr}(U_{p\cdot} = u_{p\cdot} \mid \theta_p, \beta) = \frac{\prod_{i=1}^{I} \exp\{u_{pi}(\theta_p - \beta_i)\}}{\prod_{i=1}^{I} [1 + \exp(\theta_p - \beta_i)]} 
$$

dopo aver invertito l'ordine di moltiplicazione e divisione. Concentrandosi solo sul numeratore per ora, possiamo sviluppare il prodotto nell'esponenziale per ottenere

$$ \exp\left\{\sum_{i=1}^{I} u_{pi}(\theta_p - \beta_i)\right\}. $$

Possiamo ulteriormente semplificare il numeratore distribuendo $u_{pi}$ per ottenere

$$ 
\exp\left\{\sum_{i=1}^{I} (u_{pi}\theta_p - u_{pi}\beta_i)\right\} = \exp\left\{\theta_p \sum_{i=1}^{I} u_{pi} - \sum_{i=1}^{I} u_{pi}\beta_i\right\}. 
$$

La prima somma può essere semplificata come

$$ 
\theta_p \sum_{i=1}^{I} u_{pi}, 
$$

poiché $\theta_p$ non dipende da i. Inoltre, $\prod_{i=1}^{I} u_{pi}$ è il numero di item correttamente risolti dalla persona p, che abbiamo denotato $r_p$. Quindi,

$$ 
\theta_p \sum_{i=1}^{I} u_{pi} = \theta_p r_p. 
$$

Sostituendo questi risultati nell'espressione completa per $\text{Pr}(U_{p\cdot} = u_{p\cdot} | \theta_p, \beta)$, otteniamo

$$ 
\text{Pr}(U_{p\cdot} = u_{p\cdot} \mid \theta_p, \beta) = \frac{\exp\{\theta_p r_p - \sum_{i=1}^{I} u_{pi} \beta_i\}}{\prod_{i=1}^{I} [1 + \exp(\theta_p - \beta_i)]}. 
$$

Il concetto di "indipendenza stocastica locale" nel modello di Rasch è cruciale per comprendere come viene calcolata la probabilità congiunta delle risposte agli item in un test. In generale, nella statistica, possiamo moltiplicare le probabilità di eventi separati per ottenere la probabilità congiunta solo se questi eventi sono indipendenti l'uno dall'altro. Questo significa che l'esito di un evento non influisce né ci fornisce informazioni sull'esito di un altro evento. Nel contesto del modello di Rasch, questa indipendenza si applica alle risposte date agli item di un test. L'assunzione è che, per una data abilità di una persona ($ \theta_p $), la probabilità che risponda correttamente a un item è indipendente dalla probabilità di rispondere correttamente a un altro item. In altre parole, sapere che una persona ha risposto correttamente al primo item non ci dà informazioni su come risponderà agli altri item. Il termine "locale" si riferisce alla specificità dell'indipendenza in relazione alle caratteristiche particolari, come l'abilità di una persona o la difficoltà di un item. L'indipendenza degli item è considerata in relazione a un particolare livello di abilità: per un dato livello di abilità, le risposte agli item sono indipendenti tra loro. Analogamente, l'indipendenza delle persone è considerata in relazione a una specifica difficoltà dell'item: per un dato item, le risposte delle diverse persone sono indipendenti tra loro. Questo tipo di indipendenza è fondamentale nel modello di Rasch perché permette di semplificare il calcolo delle probabilità congiunte delle risposte su diversi item. Senza questa assunzione di indipendenza, diventerebbe molto più complicato calcolare la probabilità che una persona risponda in un certo modo a un insieme di item, poiché ogni risposta influenzerebbe la probabilità delle altre risposte.

Una situazione in cui questa assunzione è irragionevole è quando la risposta a un item del test dipende dalla risposta di una persona a un item precedente. Questo accade, ad esempio, nei test di matematica dove i calcoli richiesti per risolvere un item dipendono dai calcoli precedentemente fatti per risolvere un altro. Ad esempio, la probabilità che una persona risolva correttamente il secondo item dipende dal fatto che la persona abbia risolto correttamente il primo item, poiché la soluzione del primo item è richiesta per risolvere il secondo. Questo dimostra perché è importante formulare gli item del test in modo che possano essere risolti senza le risposte ad altri item. Senza l'indipendenza stocastica locale, il modello di Rasch non può essere applicato.

L'assunzione di indipendenza locale è anche violata per i testlet. Un testlet è un gruppo di item che condividono un tema comune. Ad esempio, molti test standardizzati contengono gruppi di tipicamente due a cinque item che chiedono della stessa porzione di testo. In questo caso, le risposte agli item sul passaggio saranno correlate attraverso la comprensione della persona del passaggio. Sapere le risposte della persona a uno o più item offre informazioni su quanto bene egli o ella ha compreso il passaggio, il che influisce sulla loro probabilità di rispondere correttamente agli item rimanenti sullo stesso passaggio, anche data la loro abilità. 

### Persone

Possiamo estendere la probabilità congiunta delle risposte di una singola persona alla probabilità congiunta delle risposte di tutti i partecipanti al test assumendo che le risposte di tutti i partecipanti siano indipendenti. Per comodità notazionale, raccogliamo i parametri di abilità dei partecipanti al test, $ \theta_p $, in un vettore $ \theta $, dove l'elemento p-esimo è il parametro di abilità della persona $p$. Inoltre, impiliamo le $ U_{p\cdot} $ per formare una matrice casuale U. Ogni riga della matrice contiene le variabili casuali associate alle risposte di una singola persona. Ogni colonna contiene le variabili casuali associate a tutte le risposte a un singolo item del test. Allo stesso modo, impiliamo le risposte effettive di ciascuna persona per formare una matrice u. L'entrata nella riga $p$, colonna $i$ è $ u_{pi} $, ovvero la risposta della persona p all'item $i$.

Questo ci permette di derivare la probabilità congiunta di tutte le risposte di tutti i partecipanti al test a tutti gli item. Questa è:

$$ 
\text{Pr}(U = u | \theta, \beta) = \text{Pr}(U_{1\cdot} = u_{1\cdot}, ..., U_{P\cdot} = u_{P\cdot} | \theta_1, ..., \theta_P, \beta) = \prod_{p=1}^{P} \frac{\exp\{r_p \cdot \theta_p - \sum_{i=1}^{I} u_{pi} \cdot \beta_i\}}{\prod_{i=1}^{I} [1 + \exp(\theta_p - \beta_i)]}, 
$$

dopo aver sostituito il nostro risultato per la probabilità delle risposte di una singola persona. Ancora una volta, inseriamo il prodotto nel numeratore e denominatore e portiamo il prodotto nel numeratore nell'esponenziale, ottenendo:

$$ 
\text{Pr}(U = u | \theta, \beta) = \frac{\exp\{\sum_{p=1}^{P}(r_p \cdot \theta_p - \sum_{i=1}^{I} u_{pi} \cdot \beta_i)\}}{\prod_{p=1}^{P} \prod_{i=1}^{I} [1 + \exp(\theta_p - \beta_i)]}. 
$$

Concentrandoci di nuovo solo sul numeratore, possiamo distribuire la somma sui termini $ \theta_p $ e $ \beta_i $ per ottenere:

$$ 
\text{Pr}(U = u | \theta, \beta) = \frac{\exp\{\sum_{p=1}^{P}r_p \cdot \theta_p - \sum_{p=1}^{P}\sum_{i=1}^{I} u_{pi} \cdot \beta_i\}}{\prod_{p=1}^{P} \prod_{i=1}^{I} [1 + \exp(\theta_p - \beta_i)]}. 
$$

Possiamo invertire l'ordine della sommatoria nel doppio sommatorio, poiché:

$$ 
\sum_{p=1}^{P}\sum_{i=1}^{I} u_{pi} \cdot \beta_i = \sum_{i=1}^{I}\sum_{p=1}^{P} u_{pi} \cdot \beta_i. 
$$

I termini $ \beta_i $ non dipendono da p, quindi possiamo estrarli dalla somma interna. Inoltre, $ \sum_{p=1}^{P} u_{pi} $ è la somma della colonna i, che abbiamo denotato con $ c_i $. Quindi:

$$ 
\sum_{i=1}^{I}\sum_{p=1}^{P} u_{pi} \cdot \beta_i = \sum_{i=1}^{I} c_i \cdot \beta_i. 
$$

Riportando questo indietro nell'espressione completa per $ \text{Pr}(U = u | \theta, \beta) $ otteniamo:

$$ 
\text{Pr}(U = u | \theta, \beta) = \frac{\exp\{\sum_{p=1}^{P} r_p \cdot \theta_p - \sum_{i=1}^{I} c_i \cdot \beta_i\}}{\prod_{p=1}^{P} \prod_{i=1}^{I} [1 + \exp(\theta_p - \beta_i)]}, 
$$

la probabilità desiderata.

Come nel caso di una singola persona, dobbiamo anche verificare se l'assunzione che le risposte di persone diverse siano indipendenti sia ragionevole. Questo significa che sapere se una persona ha risposto correttamente a un item non dovrebbe darci alcuna informazione su se una seconda persona ha risposto correttamente allo stesso item. Una situazione in cui questa assunzione è chiaramente violata è quando una persona copia le risposte da un'altra.

La ragionevolezza dell'assunzione di indipendenza locale dovrebbe sempre essere verificata prima di applicare il modello di Rasch. Quando questa assunzione è ragionevole, semplifica il calcolo della probabilità congiunta delle risposte al test. Inoltre, quando combinata con la sufficienza delle somme di riga e alcune altre piccole assunzioni, l'indipendenza stocastica locale implica la funzione di risposta all'item del modello di Rasch. Una prima derivazione del modello di Rasch basata su queste assunzioni è nota come teorema di Andersen (Fischer & Molenaar, 1995; McDonald, 2011).

## Oggettività Specifica

Lo scopo fondamentale dei test psicometrici è quello di confrontare gli individui, e garantire l'equità in questi confronti è di massima importanza. L'oggettività specifica assicura un aspetto di equità richiedendo che i confronti tra le persone dipendano solo dalle rispettive abilità e non dagli specifici item utilizzati per confrontarli. Ciò significa che, se una persona ha una probabilità maggiore rispetto a un'altra di rispondere correttamente a un item, allora deve avere una probabilità maggiore di rispondere correttamente a ogni item. L'oggettività specifica si applica anche agli item. In questo caso, afferma che se un item è più facile di un altro per una persona, allora deve essere più facile di un altro per ogni persona. Un modo intuitivo per verificare se un modello soddisfa l'oggettività specifica è assicurarsi che le ICC teoriche di diversi item non si incrocino. Questo si verifica nel modello di Rasch, come mostrato nella Figura 2.1.

Alcune fonti (ad esempio, Irtel, 1996) definiscono l'oggettività specifica in modo più rigorosamente algebrico e richiedono che il rapporto tra le quote di risposte corrette, o il rapporto di probabilità, per due persone p e q sia lo stesso per ogni item del test. Sia $ O_{pi} $ la probabilità che la persona p risponda correttamente all'item i. L'oggettività specifica richiede quindi che

$$ \frac{O_{p1}}{O_{q1}} = ... = \frac{O_{pI}}{O_{qI}}. $$

Questo significa che per qualsiasi coppia di item i e j, il rapporto di probabilità tra due persone p e q per l'item i è uguale a quello dell'item j, ovvero $ \frac{O_{pi}}{O_{qi}} = \frac{O_{pj}}{O_{qj}} $, il che è equivalente alla condizione che $ O_{pi} \cdot O_{qj} = O_{pj} \cdot O_{qi} $. Quindi, il requisito che il rapporto di probabilità sia costante tra gli item è anche noto come condizione di moltiplicazione.

In alternativa, l'oggettività specifica può essere espressa in termini di item del test. In questo caso, richiede che il rapporto di probabilità tra due item sia lo stesso per ogni persona, ovvero

$$ \frac{O_{1i}}{O_{1j}} = ... = \frac{O_{Pi}}{O_{Pj}}. $$

Queste espressioni sono equivalenti. Se la condizione di moltiplicazione vale per le persone, allora vale anche per gli item del test, e viceversa.

Possiamo comprendere meglio la condizione di moltiplicazione con un esempio. Supponiamo che Marco e Cora completino un test di venti item. Marco ha una probabilità di 0.2 di risolvere il primo item. Quindi, la probabilità che Marco non lo risolva è 1 - 0.2 = 0.8. In generale, le sue quote per risolverlo sono 0.2 : 0.8 = 1 : 4. D'altra parte, Cora ha una probabilità di 0.5 di risolvere questo item, il che corrisponde a quote di 1 : 1. Denotiamo le quote di Marco per il primo item come $ O_{Marco,1} $ e quelle di Cora come $ O_{Cora,1} $. Usando questa notazione, otteniamo

$$ \frac{O_{Cora,1}}{O_{Marco,1}} = \frac{1}{1} / \frac{1}{4} = 4, $$

il che significa che le quote che Cora risponda correttamente al primo item sono quattro volte maggiori delle quote che Marco risponda correttamente al primo item. Ora, sia $ O_{Cora,i} $ e $ O_{Marco,i} $ denotino le corrispondenti quote per un qualsiasi item i arbitrario. L'oggettività specifica richiede che

$$ \frac{O_{Cora,i}}{O_{Marco,i}} = 4 $$

per ciascuno dei diciannove item rimanenti. Questo significa che, se le quote che Marco risponda correttamente al terzo item sono, ad esempio, 1 : 1, le quote che Cora risponda correttamente al terzo item devono essere 4 : 1. Questo ci fornisce un criterio specifico per verificare l'oggettività specifica in questo senso rigoroso: richiede che questa relazione valga per ogni coppia di partecipanti al test.

Supponiamo che una terza persona, Jo, completi il test. Le sue quote di rispondere correttamente al primo item sono 3 : 2. Se confrontiamo le sue quote con quelle di Marco e Cora, lei ha sei volte più probabilità di rispondere correttamente al primo item rispetto a Marco e 1.5 volte più probabilità rispetto a Cora. Quindi, l'oggettività specifica in senso rigoroso richiede che questo rapporto valga anche per gli altri item. Pertanto, le quote che Cora risponda correttamente a qualsiasi item i del test devono essere quattro volte le quote corrispondenti per Marco. Inoltre, le quote che Jo risponda correttamente a qualsiasi item i devono essere sei volte le quote corrispondenti per Marco e 1.5 volte le quote corrispondenti per Cora. Usando la nostra notazione formale, otteniamo

$$ \frac{O_{Cora,i}}{O_{Marco,i}} = 4 \times O_{Marco,i}, \frac{O_{Jo,i}}{O_{Marco,i}} = 6 \times O_{Marco,i}, \frac{O_{Jo,i}}{O_{Cora,i}} = 1.5 \times O_{Cora,i} $$
per ogni item i del test.

Si può mostrare che il modello di Rasch soddisfa l'oggettività specifica esaminando gli ICC: l'oggettività specifica è soddisfatta se i grafici della relazione tra abilità e il logit della probabilità di una risposta corretta formano linee parallele. Non forniamo qui la dimostrazione algebrica e semplicemente sottolineamo che qualsiasi modello che permette discriminazioni diverse tra gli item viola l'oggettività specifica: l'oggettività specifica è violata ogni volta che le ICC non sono parallele o addirittura si incrociano.

L'oggettività specifica è talvolta anche definita come "indipendenza del campione". Sfortunatamente, questa terminologia può essere fuorviante. Supponiamo, ad esempio, di aver sviluppato un questionario per misurare la capacità di leadership e di aver testato la sua scalabilità Rasch su un gruppo di banchieri d'investimento. Pensare all'oggettività specifica come indipendenza del campione potrebbe portare alla conclusione errata che il questionario possa essere trasferito direttamente a ingegneri del software o assistenti di volo. Questo tipo di conclusione non può essere giustificato usando l'oggettività specifica. I banchieri d'investimento potrebbero interpretare gli item del questionario in modo diverso rispetto agli ingegneri del software e agli assistenti di volo. Ciò potrebbe portare ad una difficoltà diversa degli item per gruppi diversi di partecipanti e violare l'oggettività specifica. Dobbiamo stabilire empiricamente se il modello di Rasch e l'oggettività specifica sono appropriati per ciascun nuovo gruppo di persone. Rasch stesso ha sostenuto questo punto in una lezione del 1965, citata da Gustafsson (1980, p. 231): 

> In una scienza empirica, l'oggettività specifica non può mai essere completamente accertata se gli oggetti e/o gli agenti sono un insieme infinito; può essere solo impostata come un'ipotesi di lavoro che deve essere attentamente testata [...]. E ogni volta che vengono raccolti dati aggiuntivi, dobbiamo essere pronti a ripetere il processo [...].

## Unidimensionalità

Il modello di Rasch presuppone che le persone possano essere ordinate su una singola dimensione latente. Questo è esemplificato dal fatto che a ciascuna persona viene assegnato esattamente un valore di abilità. Concettualmente, dire che un test di matematica è "unidimensionale" significa che misura solo l'abilità matematica. Un test come il SAT non sarebbe unidimensionale perché valuta sia l'abilità matematica sia quella verbale. Ad esempio, una persona potrebbe ottenere un punteggio superiore a un'altra in matematica, ma inferiore in abilità verbale. Tuttavia, individualmente, le sezioni di matematica e verbale sono considerate unidimensionali.

La presenza di fattori multidimensionali non considerati in un test può portare al Funzionamento Differenziale degli Item (DIF). Il DIF si riferisce alla situazione in cui determinati item di un test si comportano in modo differente per gruppi diversi di candidati. In altre parole, un item mostra DIF quando la difficoltà o la facilità dell'item varia a seconda del gruppo di test takers a cui appartiene il candidato, indipendentemente dalla loro abilità misurata dal test.

Per esemplificare, consideriamo un test di matematica: il risultato di una persona può essere influenzato non solo dalla sua competenza matematica (la dimensione primaria del test) ma anche dalla sua abilità linguistica (una dimensione secondaria). L'abilità linguistica, in questo contesto, agisce come un fattore di disturbo, influenzando la capacità di comprendere e rispondere agli item del test, pur non essendo l'obiettivo principale della valutazione.

Quando esistono differenze significative nelle abilità linguistiche tra due gruppi di candidati, questi gruppi potrebbero mostrare risultati diversi nel test a causa di questa dimensione secondaria. In altre parole, alcuni item potrebbero risultare più facili o difficili per un gruppo rispetto all'altro a causa delle differenze nella comprensione della lingua, nonostante la competenza matematica sia simile. Questo è un esempio di DIF: gli item del test sono influenzati da una dimensione secondaria, oltre che dalla principale.

Questa situazione dimostra che i test statistici utilizzati per rilevare il DIF devono considerare la possibilità di multidimensionalità. Se un test è pensato per misurare una specifica abilità ma è influenzato anche da altre dimensioni non rilevanti, può portare a conclusioni errate o ingiuste sui candidati. La presenza di DIF può indicare che il test non è adeguatamente tarato per tutti i partecipanti o che alcuni item del test sono imparziali verso certi gruppi. Di conseguenza, è fondamentale esaminare e correggere eventuali DIF per garantire l'equità e l'accuratezza dei risultati dei test.

Molti concetti nel campo della psicologia si caratterizzano per la loro natura intrinsecamente multidimensionale. Un esempio notevole è il modello di intelligenza proposto da Carroll nel 1993, che presenta una struttura gerarchica dividendo l'intelligenza in diverse categorie, come l'intelligenza fluida e quella cristallizzata. Questo approccio evidenzia come un singolo costrutto psicologico possa comprendere diverse dimensioni distinte.

Tuttavia, il modello di Rasch classico è progettato per misurare una singola dimensione latente alla volta e, di conseguenza, non può adeguatamente gestire le caratteristiche multidimensionali di tali costrutti complessi. Nonostante questo limite, sono state sviluppate versioni estese del modello di Rasch che possono affrontare e incorporare aspetti multidimensionali. Queste estensioni multidimensionali del modello di Rasch permettono di valutare più dimensioni simultaneamente, offrendo così un'analisi più completa e dettagliata di costrutti psicologici complessi.

## Scala di Misurazione nel Modello di Rasch

Il modello di Rasch si basa sulla misurazione dell'abilità, che secondo Stevens (1946) significa "l'assegnazione di numeri a oggetti o eventi secondo regole". Questa definizione, ampiamente accettata in psicologia, è sufficientemente ampia da includere sia la misurazione fisica (come usare un righello per misurare una distanza) che quella psicologica (come sperimentare paradigmi per misurare la percezione del volume sonoro).

Stevens classifica i paradigmi di misurazione in quattro categorie, note come scale di misurazione:

1. **Scale Nominali**: Utilizzano i numeri solo come etichette (es. numeri sulle maglie dei giocatori di calcio per distinguerli).
2. **Scale Ordinali**: Utilizzano i numeri per ordinare (es. classifiche olimpiche).
3. **Scale Intervallo e Rapporto**: Entrambe permettono di misurare distanze relative. Le scale di rapporto hanno un punto zero naturale, mentre quelle di intervallo no. Ad esempio, le diverse unità di temperatura (Celsius, Fahrenheit) rappresentano scale di intervallo, mentre le misure di lunghezza (metri, piedi) sono esempi di scale di rapporto.

Passando al modello di Rasch, possiamo considerare le unità di temperatura Celsius e Fahrenheit. Ogni temperatura in Fahrenheit può essere convertita in Celsius sottraendo 32 e poi moltiplicando per 5/9. Possiamo creare una nuova unità di temperatura sostituendo 5/9 con un fattore a e 32 con un fattore b.

Analogamente, nel modello di Rasch, possiamo convertire le abilità delle persone da una unità di misura "Unità A" a un'altra "Unità B" modificando ogni valore di abilità $ \theta_p $ in $ \theta_p' = \theta_p - b $. Dobbiamo anche convertire ogni difficoltà dell'item $ \beta_i $ in $ \beta_i' = \beta_i - b $ per mantenere la corrispondenza sulla nuova scala. Questo cambio di scala non modifica la probabilità di una risposta corretta, il che significa che le due scale producono previsioni comportamentali identiche e non possono essere distinte tramite i dati.

Potremmo anche considerare di riscalare $ \theta_p $ in un'altra unità "Unità C" convertendo $ \theta $ in $ \theta'' = (1/a) \cdot \theta $ e $ \beta $ in $ \beta'' = (1/a) \cdot \beta $. In questo caso, le logit per l'Unità C sono $ 1/a $ volte quelle per l'Unità A. Tuttavia, se sostituiamo la funzione logistica $ f(x) $ con una funzione logistica la cui argomentazione è scalata da a, $ f(a \cdot x) $, le probabilità corrispondenti ad una abilità misurata in Unità A saranno le stesse di quelle in Unità C.

Questo discorso suggerisce che gli item e le persone nel modello di Rasch possono essere considerati misurati su una scala di intervallo, ma il punto zero e la scala non sono determinati. Nella pratica, ciò significa che dobbiamo selezionare il punto zero e la scala della funzione di risposta dell'item, che può essere fatto tramite diverse convenzioni, come impostare la difficoltà del primo item del test a zero, forzare le difficoltà a sommare a zero o forzare le abilità a sommare a zero. La scala è tipicamente impostata a 1 per il modello di Rasch, corrispondente alla fissazione della pendenza per gli item. Queste opzioni verranno discusse nuovamente nel prossimo capitolo sulla stima dei parametri.

## Considerazioni conclusive

Il modello di Rasch si fonda su tre assunzioni essenziali che sono cruciali per la sua validità e applicabilità: unidimensionalità, monotonicità e indipendenza locale. 

1. **Unidimensionalità**: Questa assunzione stabilisce che un singolo tratto latente, o dimensione di attributo di una persona, predomina nell'influenzare la probabilità di risposta agli item. In pratica, ciò significa che le risposte agli item di un test sono determinate principalmente da una sola caratteristica o abilità latente. Se fossero presenti più dimensioni, il modello non sarebbe più unidimensionale e la rappresentazione grafica necessiterebbe di una struttura tridimensionale.

2. **Monotonicità**: Secondo questa assunzione, all'aumentare del valore dell'attributo latente ($\theta $), aumenta anche la probabilità di una risposta corretta. Questo principio è intuitivo in ambito di misurazione: ci si aspetta che rispondenti con un livello più elevato dell'attributo latente tendano a ottenere punteggi più alti nel test.

3. **Indipendenza Locale**: Dopo aver controllato per il tratto latente, qualsiasi correlazione tra le risposte a due item differenti dovrebbe annullarsi. Ciò implica che eventuali associazioni osservate tra le risposte a diversi item sono attribuibili esclusivamente al tratto latente misurato. In altre parole, una volta controllato per il tratto latente, la risposta a un item non dovrebbe essere influenzata né influenzare la risposta a un altro item.

La violazione di una qualsiasi di queste assunzioni suggerisce che potrebbe essere necessario adottare metodologie più complesse o approcci alternativi per analizzare i dati. In tali casi, potrebbe essere richiesto un esame più approfondito dei dati o l'impiego di modelli più avanzati che possano gestire meglio la complessità dei dati osservati.

Un'importante caratteristica del modello di Rasch è la sua capacità di stimare la difficoltà degli item, indipendentemente dalle abilità dei partecipanti. Questo concetto è noto come **oggettività specifica**. Nel modello di Rasch, la difficoltà di ciascun item viene determinata attraverso un metodo chiamato "stima di massima verosimiglianza condizionale". Questo metodo consente di valutare la difficoltà degli item senza che questa stima sia influenzata dalle capacità specifiche dei rispondenti. In altre parole, la difficoltà di ogni item viene calcolata in modo indipendente, basandosi esclusivamente sulle risposte a quel particolare item, senza essere alterata dal livello generale di abilità dei partecipanti al test.

Questa proprietà del modello di Rasch è simile a ciò che avviene in una analisi di regressione, dove la pendenza e l'intercetta di una retta di regressione non cambiano a seconda del campione analizzato. Analogamente, nel modello di Rasch, i parametri di difficoltà degli item rimangono costanti e non vengono influenzati dalle competenze generali dei rispondenti. Questo significa che le valutazioni della difficoltà degli item sono stabili e affidabili, indipendentemente dalla varietà o dal livello generale di abilità del campione di rispondenti.

L'oggettività specifica è particolarmente importante perché elimina la necessità di avere campioni di rispondenti normati o rappresentativi della popolazione generale. In pratica, quasi qualsiasi gruppo di persone può essere utilizzato per stabilire la difficoltà degli item, a condizione che ci sia una varietà sufficiente nelle loro risposte. Questo contrasta con l'approccio dei test convenzionali, dove è spesso necessario selezionare un campione rappresentativo e utilizzare le risposte per creare tabelle normative basate sulle percentuali di risposte corrette. 