In [1]:
#this loads functions for numerical arrays
from numpy import array, arange, linspace, concatenate

# this loads functions for statistical functions
from scipy.stats import uniform, norm
from scipy.stats import t as tstudent

# this loads functions for graphic output and set some global options
from bokeh.io import push_notebook, show, output_notebook, output_file
from bokeh.plotting import figure
output_notebook()
options = dict(plot_height=300, plot_width=600, tools="pan,wheel_zoom,reset,save,crosshair")

# this loads functions for interactions with the graphic
from ipywidgets import interact, fixed, FloatSlider, IntSlider, Button, Checkbox, HBox, Label

# this loads some HTML style files
from IPython.display import HTML
with open( './style/custom.css', 'r' ) as f: html_style = f.read()
HTML( html_style )

# Intervallo di confidenza (distribuzione t di Student)

Se $T\sim T(n-1)$ scriviamo $t_{\alpha/2}$ per quel numero tale che

$\qquad\Pr\big(T < - t_{\alpha/2}\big)
\ =\ 
\dfrac{\alpha}{2}$
 
Ovvero $t_{\alpha/2}$ è quello che si computa col comando `-t.ppf(α/2, n-1)`.

Equivalentemente

$\qquad\Pr\big(-t_{\alpha/2} < T < t_{\alpha/2}\big)
\ =\ 
1-\alpha$


Sia $X_1,\dots,X_n$ un campione con distribusione $N(\mu,\sigma)$ con $\mu$ e $\sigma$ ignote. Siano $\bar X$ e $S$ le usuali statistiche.

$\qquad\displaystyle\Pr \left (-t_{\alpha/2} < \frac{\bar X - \mu}{S\big/\sqrt{n}} < t_{\alpha/2} \right)
\ =\ 
1-\alpha$

Equivalentemente

$\qquad\displaystyle\Pr \left (\bar X-t_{\alpha/2}\dfrac{S}{\sqrt{n}} < \mu < \bar X + t_{\alpha/2}\dfrac{S}{\sqrt{n}} \right)
\ =\ 
1-\alpha$


Se i valori delle statistiche sono $\bar x$ e $s$, diremo che $(\bar x-\varepsilon,\bar x+\varepsilon)$, dove $\varepsilon=t_{\alpha/2}\big(s\big/\sqrt{n}\big)$, è un intervallo di confidenza di livello $1-\alpha$.

L'interpretazione è la stessa che nel caso normale: se ripetiamo l'esperimento, con probabilità $1-\alpha$ ritroveremo un intervallo che contiene $\mu$. In questo caso però anche l'ampiezza dell'intervallo è aleatoria.

In [2]:
df = 5
x  =  linspace(-10,10,200)
a  = -3.0
b  =  3.0
plot1 = figure(title=f"Distribuzione di X ~ T(ν), con ν={df}",
               x_axis_label = "x",
               y_axis_label = "densità di probabilità",
               x_range=(-4, 4  ),       # range x da visualizzare inizialmente
               y_range=( 0, .7 ),         # range y da visualizzare inizialmente 
               **options,)
p1 = plot1.line(x,  tstudent.pdf(x,df), color='#119911' )
ab  = concatenate( ([a], linspace(a,b), [b]) )
pab = concatenate( ([0], tstudent.pdf(linspace(a,b),df), [0] ) )
p2 = plot1.patch(ab, pab, color='#119911')
show(plot1, notebook_handle=True)
def update1(a  = -3, b  =  3): 
    p1.data_source.data['x'] = x
    p1.data_source.data['y'] = tstudent.pdf(x,df)
    ab  = concatenate( ([a], linspace(a,b), [b]) )
    pab = concatenate( ([0], tstudent.pdf(linspace(a,b),df), [0] ) )
    p2.data_source.data['x'] =  ab
    p2.data_source.data['y'] =  pab
    pr =  tstudent.cdf(a,df) - tstudent.cdf(b,df)
    data = {'a':a, 'b':b, 'df':df,'pr':tstudent.cdf(b,df) - tstudent.cdf(a,df)}
    print('Pr(a<X<b) = tstudent.cdf(b,ν) - tstudent.cdf(a,ν)\n' )
    print('Pr(a<X<b) = tstudent.cdf({b}, {df}) - tstudent.cdf({a}, {df}) = {pr:04.2f}'.format(**data) )
    push_notebook()

interact(update1,  
         a      = FloatSlider(description="a", min=-5, max=5, step=.2, value=-5),
         b      = FloatSlider(description="b", min=-5, max=5, step=.2, value= 5),
         );

interactive(children=(FloatSlider(value=-5.0, description='a', max=5.0, min=-5.0, step=0.2), FloatSlider(value…