In [1]:
# RUN THIS CELL: it loads some style files
from IPython.core.display import HTML, display, Math
with open( './style/custom.css', 'r' ) as f: html_style = f.read()
HTML( html_style )

In [2]:
from scipy.stats import binom                               # lib. for statistical functions
from ipywidgets import interactive, FloatSlider, IntSlider  # lib. for interactive graphic
from bokeh.io import push_notebook, show, output_notebook   # lib. for graphic output
from bokeh.plotting import figure
output_notebook()
options = dict(plot_height=250,plot_width=700,
               tools="pan,wheel_zoom,reset,save,crosshair,box_select")
def printred(s):
    display(HTML('<pre style="font: bold 12pt Courier, serif;color:#a02">' + s + '</pre>') )
def printgrn(s):
    display(HTML('<pre style="font: bold 12pt Courier, serif;color:#080">' + s + '</pre>') )

# Prevalenza mancinismo tra gli studenti di biotecnologie

Il $10\%$ è delle persone sono mancine. Vogliamo stabilire se i mancini hanno una preferenza per le biotecnologie. Supponiamo che gli studenti in classe siano $100$ e che rappresentino un campione casuale. Abbiamo contato $16$ mancini in classe.

Il test di ipotesi che faremo è

$H_0:\kern3.5ex p=0.1\quad$ la prevalenza del mancinismo tra i biotecnologi è identica

$H_A:\kern3.5ex p\neq 0.1\quad$  la prevalenza del mancinismo tra i biotecnologi è diversa

Il test è una variabile aleatoria $X$ a valori in $\{0,\dots,100\}$. 

Condizionando a $H_0$ otteniamo $X\sim {\rm B}(100,\ 0.1)$. 

Condizionando a $H_A$ otteniamo $X\sim {\rm B}(100,\ p)$ con $p\neq 0.1$ ignota.

Gli errori del I tipo per diverse regioni di rifoiuto sono plottate nel grafico sottostante. 

In [5]:
n = 100; p0 = 0.1; k_max = 8                                # Set the initial values of the parameters
x = range(0,n+1)

plot = figure(title="PMF of X ~ B(100, 0.1) and the region [0, 10 - k] ∪ [10 + k, 100].",  # Create an empty figure
              x_axis_label = "# successes", y_axis_label = "probability", 
              x_range=(0,n*0.3), y_range=(0,max(binom.pmf(x,n,p0)*1.1)), **options )               
plot.title.text_font="courier"
plot.title.text_font_size="12pt"


r1 = plot.vbar(x, top=[0 for i in x], bottom=0, width=.9, color='green', alpha=0.5) # Initialize barplot
r2 = plot.vbar(x, top=[0 for i in x], bottom=0, width=.9, color='red',   alpha=0.5) # Initialize barplot
        
def f(k, one_tail=False): 
    k1 = int(n*p0)-k; k2 = int(n*p0)+k
    data = {'x':x, 'top':  binom.pmf(x, n, p0) }
    r1.data_source.data = data
    printred('T = [0, {}]  ∪  [ {}, 100 ] zona di rifiuto'.format(k1,k2) )
    if not one_tail : 
        printred('Pr( T | p = {:.2f}) = α = {:.3f} (falso positivo) ERRORE I tipo'.format(p0,binom.cdf(k1, n, p0)-binom.cdf(k2-1, n, p0) +1) ) 
        x_rif = [ i for i in x if i <= int(n*p0)-k or i>= int(n*p0) + k ]
    else: 
        printred('Pr( T | p = {:.2f}) = α = {:.3f} (falso positivo) ERRORE I tipo'.format(p0, 1 - binom.cdf(k2-1, n, p0) ) )
        x_rif = [ i for i in x if i>= int(n*p0) + k ]
    data2 = {'x':x_rif, 'top':binom.pmf(x_rif, n, p0) }
    r2.data_source.data = data2
    push_notebook()

show(plot, notebook_handle=True)                                                    # Show barplot
w = interactive(f,
         #tail = ToggleButtons(description="tail(s) ", options=['1 tail', '2 tails']),
         k = IntSlider  (description="k", min=1, max=k_max, step=1, value=k_max),)
display(w)

interactive(children=(IntSlider(value=8, description='k', max=8, min=1), Checkbox(value=False, description='on…