# Przedziały ufności - symulacje
Generujemy $k$ próbek $n$-elementowych z rozkładu normalnego $N(\mu,\sigma)$.<br>
Wyznaczamy przedziały ufności dla średniej $\mu$ na poziomie ufności $1-\alpha$.<br>
Domyslnie $k=100$, $n=100$, $\mu=0$, $\sigma=1$, $\alpha=0.05$.

In [54]:
import matplotlib.pyplot as plt
import numpy as np
from scipy import stats
from scipy import integrate

## Model 1.
Przedział ufności dla <b>nieznanej wartości średniej $\mu$</b> populacji, w której <b>badana cecha ma rozkład $N(\mu,\sigma)$</b>, w przypadku gdy <b>$\sigma$ jest znana</b>, na podstawie $n$-elementowej próby prostej $X_1,\ldots,X_n$.

$$
\left( \bar X - u(1-\frac{\alpha}{2}) \frac{\sigma}{\sqrt{n}} , \bar X + u(1-\frac{\alpha}{2}) \frac{\sigma}{\sqrt{n}} \right)
$$
gdzie 

$$
\bar X = \frac{1}{n} \sum_{i=1}^{n} X_{i} 
$$

oraz $u(\alpha)$ oznacza kwantyl rzędu $\alpha$ rozkładu normalnego $N(0,1)$.

In [58]:
mu=0
sigma=1
norm_dist = stats.norm(mu,sigma)
alpha = 0.05
k=100 #liczba generowowanych próbek 
n=100 #liczba danych w próbce
licznik = 0
for i in range(k):
    data = norm_dist.rvs(size=n)
    ci = stats.norm.interval(1-alpha, loc=np.mean(data), scale=sigma/np.sqrt(n))
    if ci[0]>mu or ci[1]<mu:
        licznik = licznik +1
        print(ci)
print('Częstość przedziałów niezawierających wartosci mi:', r'%2.2f' %(licznik/k))

(-0.3958175326487462, -0.0038247357407354132)
(-0.43757340769120834, -0.045580610783197556)
(-0.4309560009959382, -0.03896320408792739)
Częstość przedziałów niezawierających wartosci mi: 0.03


## Model 2.
Przedział ufności dla <b>nieznanej wartości przeciętnej $\mu$</b> populacji, w której <b>badana cecha ma rozkład $N(\mu,\sigma^2)$</b>, w przypadku gdy <b>zarówno $\mu$ jak $\sigma$ są nieznane</b>, na podstawie $n$--elementowej próby $X_1,\ldots,X_n$ <b>($n<100$)</b> 
wynosi

$$
\left(
\bar X - t \left(1-\frac{\alpha}{2},n-1 \right) \frac{S}{\sqrt{n-1}},
\bar X + t \left(1-\frac{\alpha}{2},n-1 \right) \frac{S}{\sqrt{n-1}}
\right)
$$

gdzie 

$$
S^2 = \frac{1}{n} \sum_{i=1}^{n} (X_{i} - \bar X)^2
\mbox{ oraz }
\bar X = \frac{1}{n} \sum_{i=1}^{n} X_{i} 
$$

oraz $t(\alpha,n)$ oznacza kwantyl rzędu $\alpha$ o $n$ stopniach swobody rozkładu $t$--Studenta.

In [50]:
mu=0
sigma=1
norm_dist = stats.norm(mu,sigma)
alpha = 0.05
k=100 #liczba generowowanych próbek 
n=100 #liczba danych w próbce
licznik = 0
for i in range(k):
    data = norm_dist.rvs(size=n)
    ci = stats.t.interval(1-alpha, n-1, loc=np.mean(data), scale=np.std(data, ddof=0)/np.sqrt(n-1))
    if ci[0]>mu or ci[1]<mu:
        licznik = licznik +1
        print(ci)
print('Częstość przedziałów niezawierających wartosci mi:', r'%2.2f' %(licznik/k))

(-0.42761184586430045, -0.03697969553569966)
(0.0018520887489457127, 0.3842512739444701)
(-0.3540341226917328, -0.003221284174604766)
(0.001262711305357822, 0.32710480594893887)
Częstość przedziałów niezawierających wartosci mi: 0.04


## Model 3.
Przedział ufności dla <b>nieznanej wartości przeciętnej $\mu$</b> populacji, w której </b>badana cecha ma rozkład $N(\mu,\sigma^2)$</b>, w przypadku gdy <b>zarówno $\mu$ jak $\sigma$ są nieznane</b>, na podstawie $n$--elementowej próby $X_1,\ldots,X_n$ <b>($n
\geq100$)</b> wynosi

$$
\left(
\bar X - u \left(1-\frac{\alpha}{2} \right) \frac{S^{*}}{\sqrt{n}},
\bar X + u \left(1-\frac{\alpha}{2} \right) \frac{S^{*}}{\sqrt{n}}
\right)
$$

gdzie $u(\alpha)$ oznacza kwantyl rzędu $\alpha$ rozkładu normalnego $N(0,1)$ oraz

$$
S^{*2} = \frac{1}{n-1} \sum_{i=1}^{n} (X_{i} - \bar X)^2.
$$

In [53]:
mu=0
sigma=1
norm_dist = stats.norm(mu,sigma)
alpha = 0.05
k=100 #liczba generowowanych próbek 
n=100 #liczba danych w próbce
licznik = 0
for i in range(k):
    data = norm_dist.rvs(size=n)
    ci = stats.norm.interval(1-alpha, loc=np.mean(data), scale=np.std(data, ddof=1)/np.sqrt(n))
    if ci[0]>mu or ci[1]<mu:
        licznik = licznik +1
        print(ci)
print('Częstość przedziałów niezawierających wartosci mi:', r'%2.2f' %(licznik/k))

(0.005242641762597311, 0.42338773757895953)
(-0.4710374110719544, -0.10827712271602849)
(0.05438238985959559, 0.444460458284581)
(-0.4304078143504039, -0.019452866398923047)
(0.05784288161292597, 0.4117405917112653)
Częstość przedziałów niezawierających wartosci mi: 0.05
