In [1]:
# RUN THIS CELL: it loads some style files
from IPython.core.display import HTML
with open( './style/custom.css', 'r' ) as f: html_style = f.read()
HTML( html_style )

# Le v.a. geometriche

Immaginiamo una sequenza infinita di v.a.i. di Bernoulli, $X_i\sim B(1,p)$ per $i=0,1,\dots$.  

Sia $Y$ la variabile aleatoria che da il primo $i$ tale che $X_i=1$. Più concretamente $Y$ corrisponde a contare quanti insuccessi abbiamo prima del primo successo se lanciamo una moneta con probabilità di successo $p$.  

Diremo che $Y$ è una variabile geometrica con parametro $p$, in simboli $Y\sim G(p)$.

## La distribuzione geometrica

Sia $Y\sim G(p)$. Data l'interpretazione esposta qui sopra è immediato calcolare la pmf

$P(Y=i)\ \ =\ \ (1-p)^ip$



In [6]:
from scipy.stats import geom                      # libraries for statistical functions
from numpy import arange                      # libraries for statistical functions
from ipywidgets import interact, FloatSlider, IntSlider   # libraries for interactions with the graphic
from bokeh.io import push_notebook, show, output_notebook, output_file # libraries for graphic output
from bokeh.plotting import figure
output_notebook()
options = dict(plot_height=400,plot_width=700,tools="pan,wheel_zoom,reset,save,crosshair,box_select")

In [14]:
p = .5
n = 100               # maximal number of trials computed
n_vis = 20           # maximal number of trials initially visible
x = arange(n)   # inizialization
plot1 = figure(title="PMF of X ~ G(p)", x_axis_label = "number of failures before the first success", # create an empty figure
               y_axis_label = "probability", x_range=(-1,n_vis), y_range=(0,0.4), **options )
plot1.title.text_font="times"
plot1.title.text_font_size="16pt"
r1 = plot1.vbar(x, top=[0 for i in x], bottom=0, # initialize barplot
                width=0.8, color="#111188", alpha=0.5 
               )
show(plot1, notebook_handle=True)
    
def update1(p):
    data = {'x':x-1, 'top': geom.pmf(x,p) }
    r1.data_source.data = data
    push_notebook()

interact(update1,
         p = FloatSlider(description="p", min=0.1, max=0.95,  step=0.05, value=0.5));

interactive(children=(FloatSlider(value=0.5, description='p', max=0.95, min=0.1, step=0.05), Output()), _dom_c…

## Valore atteso e varianza

Per calcolare il valore atteso usiamo un argomento basato sul calcolo differenziale $\def\E{{\rm E}}$

$\qquad\displaystyle\E(Y)
\ \ =\ \ 
\sum_{i=1}^\infty i\,(1-p)^i\,p\qquad$ (l'addendo $i=0$ si può omettere)

$\qquad\displaystyle\phantom{\E(Y)}
\ \ =\ \ 
p\,(1-p)\,\sum_{i=1}^\infty i\,(1-p)^{i-1}$

$\qquad\displaystyle\phantom{\E(Y)}
\ \ =\ \ 
p\,(1-p)\,\sum_{i=1}^\infty -\dfrac{{\rm d}(1-p)^i}{{\rm d}p}$

$\qquad\displaystyle\phantom{\E(Y)}
\ \ =\ \ 
p\,(1-p)\,\dfrac{{\rm d}}{{\rm d}p}\sum_{i=1}^\infty -(1-p)^i$

$\qquad\displaystyle\phantom{\E(Y)}
\ \ =\ \ 
p\,(1-p)\,\dfrac{{\rm d}}{{\rm d}p}\sum_{i=1}^\infty -(1-p)^i$

$\qquad\displaystyle\phantom{\E(Y)}
\ \ =\ \ 
p\,(1-p)\,\dfrac{{\rm d}}{{\rm d}p}-\dfrac{1}{p}$

$\qquad\displaystyle\phantom{\E(Y)}
\ \ =\ \ $
<mark style="padding:2ex;">$\dfrac{1-p}{p}$</mark>

Il calcolo della varianza è simile (lo prendiamo per buono) $\def\Var{{\rm Var}}$

$\qquad\Var \left(Y\right)\ \ =\ \  $<mark style="padding:2ex;">$\dfrac p {\left({1 - p}\right)^2}$</mark>