# Analisi delle distribuzioni A, B e della loro differenza

## Passaggi

### 1. **Statistiche dei vettori $A$ e $B$**

1. **Media empirica**:  
   - $\bar{A} = \frac{1}{n} \sum_{i=1}^{n} A_i$  
   - $\bar{B} = \frac{1}{n} \sum_{i=1}^{n} B_i$

2. **Varianza empirica**:  
   - $s_A^2 = \frac{1}{n-1} \sum_{i=1}^{n} (A_i - \bar{A})^2$  
   - $s_B^2 = \frac{1}{n-1} \sum_{i=1}^{n} (B_i - \bar{B})^2$

3. **Covarianza tra $A$ e $B$**:  
   - $\text{Cov}(A, B) = \frac{1}{n-1} \sum_{i=1}^{n} (A_i - \bar{A}) (B_i - \bar{B})$

---

### 2. **Intervalli di confidenza per $A$ e $B$**

1. **Intervallo di confidenza per la media** (usando la distribuzione t di Student):  
   - $\bar{X} \pm t_{\alpha/2, n-1} \cdot \frac{s_X}{\sqrt{n}}$
   
2. **Intervallo di confidenza per la varianza** (usando la distribuzione chi-quadrato):  
   - $\left( \frac{(n-1)s_X^2}{\chi^2_{\alpha/2, n-1}}, \frac{(n-1)s_X^2}{\chi^2_{1-\alpha/2, n-1}} \right)$

---

### 3. **Analisi della differenza $Δ = B - A$**

1. **Media della differenza**:  
   - $\bar{Δ} = \frac{1}{n} \sum_{i=1}^{n} Δ_i$ con $Δ_i = B_i - A_i$

2. **Varianza della differenza**:  
   - $s_Δ^2 = \frac{1}{n-1} \sum_{i=1}^{n} (Δ_i - \bar{Δ})^2$

3. **Intervallo di confidenza per la media di $Δ$**:
   - Usando **t di Student**:  
     $\bar{Δ} \pm t_{\alpha/2, n-1} \cdot \frac{s_Δ}{\sqrt{n}}$
   - Usando **distribuzione normale standard**:  
     $\bar{Δ} \pm Z_{\alpha/2} \cdot \frac{s_Δ}{\sqrt{n}}$

4. **Intervallo di confidenza per la varianza di $Δ$** (usando chi-quadrato):  
   - $\left( \frac{(n-1)s_Δ^2}{\chi^2_{\alpha/2, n-1}}, \frac{(n-1)s_Δ^2}{\chi^2_{1-\alpha/2, n-1}} \right)$

---

## **Schematizzazione dell'algoritmo**

|  | **`Algoritmo Unificato per l'Analisi Statistica`** |
| --- | --- |
|  | **`STAT_ANALYSIS(A, B)`** |
| 1. | Calcola la media $\bar{A}$ e $\bar{B}$ |
| 2. | Calcola la varianza $s_A^2$ e $s_B^2$ |
| 3. | Calcola la covarianza tra $A$ e $B$ |
| 4. | Calcola gli intervalli di confidenza per le medie di $A$ e $B$ |
| 5. | Calcola gli intervalli di confidenza per le varianze di $A$ e $B$ |
| 6. | Calcola la differenza $Δ = B - A$ |
| 7. | Calcola la media $\bar{Δ}$ e la varianza $s_Δ^2$ |
| 8. | Calcola gli intervalli di confidenza per la media di $Δ$ (t di Student e Normale) |
| 9. | Calcola l'intervallo di confidenza per la varianza di $Δ$ |



In [13]:
import numpy as np
import scipy.stats as stats

# dati esempio algoritmi 
A = np.array([0.067, 0.678, 0.835, 3.032, 1.023, 0.559, 2.456, 0.469, 0.409, 0.621, 0.966, 1.827, 0.616, 0.620, 1.986, 2.499, 0.973, 0.376, 0.253, 1.697, 1.206, 0.728, 0.397, 1.862, 0.351])
B = np.array([0.189, 1.092, 0.300, 0.587, 0.428, 0.704, 0.598, 0.165, 0.743, 1.278, 0.410, 0.176, 0.105, 0.901, 0.873, 1.230, 0.816, 0.797, 2.007, 0.872, 3.830, 0.559, 0.406, 0.155, 0.217])

# distribiuzione differenza D = B - A
D = B - A
n = len(A)
alpha = 0.05

# medie
mean_A = np.mean(A)
mean_B = np.mean(B)
mean_D = np.mean(D)

# varianze
var_A = np.var(A, ddof=1)
var_B = np.var(B, ddof=1)
c_var_D = np.var(D, ddof=1) # campionaria corretta di D ramite ddof

# covarianza tra A e B
cov_AB = np.cov(A, B, ddof=1)[0, 1]

# intervalli di confidenza per la media (t di Student)
t_stima = stats.t.ppf(1 - alpha/2, df=n-1)
conf_int_mean_A_t = (mean_A - t_stima * np.sqrt(var_A/n), mean_A + t_stima * np.sqrt(var_A/n))
conf_int_mean_B_t = (mean_B - t_stima * np.sqrt(var_B/n), mean_B + t_stima * np.sqrt(var_B/n))
conf_int_mean_D_t = (mean_D - t_stima * np.sqrt(c_var_D/n), mean_D + t_stima * np.sqrt(c_var_D/n))

# intervalli di confidenza per la media (normale)
z_stima = stats.norm.ppf(1 - alpha/2)
conf_int_mean_A_z = (mean_A - z_stima * np.sqrt(var_A/n), mean_A + z_stima * np.sqrt(var_A/n))
conf_int_mean_B_z = (mean_B - z_stima * np.sqrt(var_B/n), mean_B + z_stima * np.sqrt(var_B/n))
conf_int_mean_D_z = (mean_D - z_stima * np.sqrt(c_var_D/n), mean_D + z_stima * np.sqrt(c_var_D/n))

# intervalli di confidenza per la varianza
chi2_lower = stats.chi2.ppf(alpha/2, df=n-1)
chi2_upper = stats.chi2.ppf(1 - alpha/2, df=n-1)
conf_int_var_A = ((n-1)*var_A/chi2_upper, (n-1)*var_A/chi2_lower)
conf_int_var_B = ((n-1)*var_B/chi2_upper, (n-1)*var_B/chi2_lower)
conf_int_c_var_D = ((n-1)*c_var_D/chi2_upper, (n-1)*c_var_D/chi2_lower)


# Errore standard di D
std_error_D = np.sqrt(c_var_D / n)

# Stampa dei risultati
print("Media:")
print(f"  A: {mean_A:.3f}, B: {mean_B:.3f}, D: {mean_D:.3f}")
print("\nVarianza (campionaria corretta):")
print(f"  A: {var_A:.3f}, B: {var_B:.3f}, D: {c_var_D:.3f}")
print(f"\nCovarianza AB: {cov_AB:.3f}")
print("\nIntervalli di confidenza per la media (t di Student):")
print(f"  A: {conf_int_mean_A_t}, \n  B: {conf_int_mean_B_t}, \n  D: {conf_int_mean_D_t}")
print("\nIntervalli di confidenza per la media (normale):")
print(f"  A: {conf_int_mean_A_z}, \n  B: {conf_int_mean_B_z}, \n  D: {conf_int_mean_D_z}")
print("\nIntervalli di confidenza per la varianza:")
print(f"  A: {conf_int_var_A} \n  B: {conf_int_var_B}, \n  D: {conf_int_c_var_D}")
print(f"\nVarianza campionaria corretta di D: {c_var_D:.3f}")
print(f"Errore standard di D: {std_error_D:.3f}")

Media:
  A: 1.060, B: 0.778, D: -0.283

Varianza (campionaria corretta):
  A: 0.642, B: 0.600, D: 1.206

Covarianza AB: 0.018

Intervalli di confidenza per la media (t di Student):
  A: (0.7295450454526855, 1.3909349545473142), 
  B: (0.4577595375439806, 1.0972804624560193), 
  D: (-0.7360273605878829, 0.17058736058788276)

Intervalli di confidenza per la media (normale):
  A: (0.7461983058817676, 1.374281694118232), 
  B: (0.47386215472328785, 1.081177845276712), 
  D: (-0.7131995386738059, 0.14775953867380587)

Intervalli di confidenza per la varianza:
  A: (0.39131781369062496, 1.2421319224350422) 
  B: (0.3658676470495292, 1.1613472933938782), 
  D: (0.7352923077667578, 2.3339853588165513)

Varianza campionaria corretta di D: 1.206
Errore standard di D: 0.220
