# Causalità {#sec-solutions-causality}

In [16]:
# Standard library imports
import os

# Third-party imports
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import arviz as az
import scipy.stats as stats
from scipy.special import expit  # Funzione logistica
from cmdstanpy import cmdstan_path, CmdStanModel

# Configuration
seed = sum(map(ord, "stan_poisson_regression"))
rng = np.random.default_rng(seed=seed)
az.style.use("arviz-darkgrid")
%config InlineBackend.figure_format = "retina"

# Define directories
home_directory = os.path.expanduser("~")
project_directory = f"{home_directory}/_repositories/psicometria"

# Print project directory to verify
print(f"Project directory: {project_directory}")

Project directory: /Users/corradocaudek/_repositories/psicometria


# @sec-causality {.unnumbered} 

@exr-causality-1

Risposta corretta: 

a) Controllare per B è sufficiente e necessario per ottenere una stima non distorta dell'effetto di A su C.

Spiegazione: In questo DAG, B agisce come un mediatore nella catena causale da A a C (A → B → C). Controllare per B è sufficiente per bloccare il flusso di informazioni lungo questo percorso. Inoltre, B è anche un collider nel percorso A → B ← D, ma questo percorso non crea un back-door path tra A e C, quindi non è necessario controllare per D. Controllare per B è necessario perché altrimenti l'effetto di A su C attraverso B non verrebbe rimosso. Le altre opzioni sono errate perché:

b) Non c'è un back-door path da A a C attraverso D.
c) B è un mediatore che deve essere controllato.
d) Controllare per D non è necessario e potrebbe introdurre bias.
e) B non è un collider nel percorso rilevante per l'effetto di A su C.

@exr-causality-2

Risposta corretta: 

b) È necessario controllare solo per Z per bloccare tutti i back-door paths tra X e Y.

Spiegazione: In questo DAG, esiste un back-door path tra X e Y attraverso Z (X ← Z → W → Y). Secondo il criterio del back-door, per ottenere una stima non distorta dell'effetto causale di X su Y, dobbiamo bloccare tutti i back-door paths tra queste variabili.

Controllare per Z è sufficiente per bloccare questo back-door path, poiché Z è una "forchetta" (fork) nel percorso. Una volta che controlliamo per Z, il flusso di informazioni non causali da X a Y attraverso questo percorso viene bloccato.

Le altre opzioni sono errate perché:

a) C'è un back-door path che deve essere bloccato.
c) Controllare solo per W non è sufficiente, poiché non blocca il flusso di informazioni attraverso Z.
d) Non è necessario controllare per W una volta che si è controllato per Z. Controllare per variabili non necessarie può ridurre la precisione della stima.
e) È possibile stimare l'effetto causale in questo DAG utilizzando il criterio del back-door, controllando per Z.

Questo esercizio illustra l'importanza di identificare correttamente i back-door paths e di selezionare il set minimo di variabili necessarie per bloccarli quando si applica il criterio del back-door nell'inferenza causale.

@exr-causality-3

Risposta corretta: 

a) A e B sono indipendenti, ma diventano dipendenti se controlliamo per C.

Spiegazione: In questo DAG, C è un collider rispetto ad A e B. Un collider è una variabile che riceve frecce da due o più altre variabili nel grafo. Il comportamento dei collider è particolare e contro-intuitivo nell'analisi causale.

Quando non controlliamo per un collider o per i suoi discendenti:

- Le variabili che influenzano il collider (in questo caso, A e B) sono indipendenti tra loro.

Quando controlliamo per un collider o per i suoi discendenti:

- Introduciamo una dipendenza tra le variabili che influenzano il collider.

Quindi, in questo caso:

- A e B sono originariamente indipendenti.
- Se controlliamo per C (il collider), creiamo una dipendenza tra A e B.
- Anche controllare per D (discendente del collider) creerebbe una dipendenza tra A e B.

Le altre opzioni sono errate perché:

b) La direzione della dipendenza è opposta a quella corretta.
c) A e B non sono sempre dipendenti; lo diventano solo se controlliamo per C o D.
d) A e B diventano dipendenti se controlliamo per C o D.
e) Controllare per D non rende A e B indipendenti, ma al contrario crea una dipendenza.

Questo esercizio illustra l'importanza di identificare correttamente i collider in un DAG e di comprendere come il controllo di queste variabili possa influenzare le relazioni tra altre variabili nel sistema.

@exr-causality-4

Risposta corretta: 

e) Controllare per Z potrebbe introdurre un bias nella stima dell'effetto causale di X su Y.

Spiegazione: In questo DAG, abbiamo la seguente situazione:

1. C'è un back-door path da X a Y attraverso U (X ← U → Y). Questo percorso crea confondimento.
2. Z è un collider nel percorso X → Z ← Y.
3. U non è osservata, quindi non possiamo controllare direttamente per essa.

Applicando il criterio del back-door:

- Non possiamo bloccare il back-door path X ← U → Y perché U non è osservata.
- Controllare per Z non aiuterebbe a bloccare questo back-door path.
- Anzi, controllare per Z (un collider) aprirebbe un nuovo percorso non causale tra X e Y, introducendo un bias nella stima dell'effetto causale.

Le altre opzioni sono errate perché:

a) Anche se U non è osservata, possiamo ancora applicare il criterio del back-door per analizzare la situazione.
b) Controllare per Z non è sufficiente e anzi introdurrebbe un bias.
c) C'è un back-door path attraverso U.
d) Non possiamo controllare per U poiché non è osservata.

Questo esercizio illustra l'importanza di identificare correttamente i back-door paths e i collider in un DAG, e di comprendere come la presenza di variabili non osservate possa complicare l'applicazione del criterio del back-door nell'inferenza causale.

@exr-causality-5

La struttura causale è quella della mediazione.

```python
import numpy as np
import matplotlib.pyplot as plt

# Numero di punti dati
n = 10000

# A è una variabile casuale distribuita secondo una normale standard
A = np.random.normal(0, 1, n)

# M è una funzione lineare di A con un termine di errore
M = A + np.random.normal(0, 1, n)

# B è una funzione lineare di M con un termine di errore
B = M + np.random.normal(0, 1, n)

# Plot di A contro B
plt.scatter(A, B, alpha=0.5)
plt.xlabel('A')
plt.ylabel('B')
plt.title('Relazione tra A e B')
plt.show()

# Calcolo della correlazione tra A e B
correlation_matrix = np.corrcoef(A, B)
correlation = correlation_matrix[0, 1]

# Stampa il valore della correlazione
print(f"Correlazione tra A e B: {correlation:.4f}")
```

@exr-causality-6

Se \( A \) e \( B \) condividono un antenato comune \( C \) (biforcazione causale), \( A \) e \( B \) saranno correlati nei dati. Questo fenomeno è chiamato confondimento. La regola si applica anche se l'effetto di C su A e/o su B è mediato da altre variabili.

```python
import numpy as np
import matplotlib.pyplot as plt

# Numero di punti dati
n = 10000

# C è una variabile casuale distribuita secondo una normale standard
C = np.random.normal(0, 1, n)

# A è una funzione lineare di C con un termine di errore
A = C + np.random.normal(0, 1, n)

# B è una funzione lineare di C con un termine di errore
B = C + np.random.normal(0, 1, n)

# Plot di A contro B
plt.scatter(A, B, alpha=0.5)
plt.xlabel('A')
plt.ylabel('B')
plt.title('Relazione tra A e B')
plt.show()

# Calcolo della correlazione tra A e B
correlation_matrix = np.corrcoef(A, B)
correlation = correlation_matrix[0, 1]

# Stampa il valore della correlazione
print(f"Correlazione tra A e B: {correlation:.4f}")
```

@exr-causality-7

```python
import numpy as np
import statsmodels.api as sm
import matplotlib.pyplot as plt

# Numero di punti dati
n = 10000

# Generazione delle variabili secondo le specifiche
C = np.random.normal(0, 1, n)
A = C + np.random.normal(0, 1, n)
B = C + np.random.normal(0, 1, n)

# Regressione A ~ C per ottenere i residui
model_A_C = sm.OLS(A, sm.add_constant(C)).fit()
residuals_A = model_A_C.resid

# Regressione B ~ C per ottenere i residui
model_B_C = sm.OLS(B, sm.add_constant(C)).fit()
residuals_B = model_B_C.resid

# Calcolo della correlazione tra i residui di A e B
correlation_residuals = np.corrcoef(residuals_A, residuals_B)[0, 1]

# Stampa del risultato
print(f"Correlazione tra A e B dopo aver controllato per C: {correlation_residuals:.4f}")

# Plot dei residui di A contro i residui di B
plt.scatter(residuals_A, residuals_B, alpha=0.5)
plt.xlabel('Residui di A')
plt.ylabel('Residui di B')
plt.title('Correlazione tra i residui di A e B')
plt.show()
```

@exr-causality-8

```python
import numpy as np
import statsmodels.api as sm
import matplotlib.pyplot as plt

# Numero di punti dati
n = 10000

# Generazione delle variabili secondo le specifiche
A = np.random.normal(0, 1, n)
M = A + np.random.normal(0, 1, n)
B = M + np.random.normal(0, 1, n)

# Regressione M ~ A per ottenere i residui
model_M_A = sm.OLS(M, sm.add_constant(A)).fit()
residuals_M = model_M_A.resid

# Regressione B ~ M per ottenere i residui
model_B_M = sm.OLS(B, sm.add_constant(M)).fit()
residuals_B = model_B_M.resid

# Calcolo della correlazione tra A e i residui di B
correlation_residuals = np.corrcoef(A, residuals_B)[0, 1]

# Stampa del risultato
print(f"Correlazione tra A e i residui di B (dopo aver controllato per M): {correlation_residuals:.4f}")

# Plot di A contro i residui di B
plt.scatter(A, residuals_B, alpha=0.5)
plt.xlabel('A')
plt.ylabel('Residui di B')
plt.title('Correlazione tra A e i residui di B')
plt.show()
```

Se \( M \) media completamente l'effetto di \( A \) su \( B \), ci aspettiamo che, una volta controllato \( M \), non ci sia alcuna correlazione residua significativa tra \( A \) e \( B \). La correlazione calcolata dovrebbe essere prossima a zero se la mediazione è completa. Se la correlazione è significativamente diversa da zero, potrebbe indicare che esistono effetti diretti di \( A \) su \( B \) non mediati da \( M \) o che esistono altri percorsi attraverso i quali \( A \) influenza \( B \).

@exr-causality-9

```python
import numpy as np
import statsmodels.api as sm
import matplotlib.pyplot as plt

# Numero di punti dati
n = 10000

# Generazione delle variabili secondo le specifiche
A = np.random.normal(0, 1, n)
B = np.random.normal(0, 1, n)
D = A + B + np.random.normal(0, 1, n)

# Regressione A ~ D per ottenere i residui
model_A_D = sm.OLS(A, sm.add_constant(D)).fit()
residuals_A = model_A_D.resid

# Regressione B ~ D per ottenere i residui
model_B_D = sm.OLS(B, sm.add_constant(D)).fit()
residuals_B = model_B_D.resid

# Plot dei residui di A contro i residui di B
plt.scatter(residuals_A, residuals_B, alpha=0.5)
plt.xlabel("Residui di A")
plt.ylabel("Residui di B")
plt.title("Correlazione tra i residui di A e B dopo aver controllato per D")
plt.show()

# Calcolo della correlazione tra A e i residui di B
correlation_residuals = np.corrcoef(residuals_A, residuals_B)[0, 1]

# Stampa del risultato
print(
    f"Correlazione tra A e i residui di B (dopo aver controllato per D): {correlation_residuals:.4f}"
)
```

In una struttura causale di tipo collider, A e B sono indipendenti, ma quando si controlla per 
D si può generare una correlazione spuria tra A e B. Questo effetto è dovuto alla struttura del collider: controllare per D introduce una dipendenza tra A e B, anche se non esiste un legame diretto tra loro.
