In [19]:
# This loads some style files
from IPython.core.display import HTML
with open( './style/custom.css', 'r' ) as f: html_style = f.read()
HTML( html_style )

# Il valore atteso 


Sia $X\in R$ una v.a. numerica discreta. Per semplicità assumiamo che $R$ sia un insieme finito. Il <mark>valore atteso</mark> o  <mark class="ita">expected value</mark> di $X$ è

$\def\E{{\rm E}}\def\Pr{{\rm Pr}\,}$
$\quad$<mark>$\E(X)$</mark>$\displaystyle\ \ =\ \ \sum_{x\in R} x\cdot \Pr(X=x)$

Molto spesso si chiama anche <mark>media (di popolazione)</mark>, o  <mark class="ita">(population) mean</mark>, più raramente,  <mark class="ita">average</mark>.

La lettera $\mu$ viene usata per denotare $\E(X)$ quando è chiaro a quale variabile ci si riferisce. Per evitare ambiguità a volte si scrive <mark>$\mu_X$</mark>.

ATTENZIONE: non si confonda il concetto di *media di popolazione* con quello di*media campionaria* (che introdurremo più avanti). Entrambi vengono spesso abbreviati con *media*!


# Esempio

Supponiamo che $R=\{0,1,2,3\}$ e che

$\Pr(X=0)=0.2$

$\Pr(X=1)=0.3$

$\Pr(X=2)=0.1$

$\Pr(X=3)=1-\Pr(X\in\{0,1,2\}) = 0.4$

La pmf di $X$ è plottata nel grafico sottostante.

In [63]:
from bokeh.io import show, output_notebook, output_file # libraries for graphic output
from bokeh.plotting import figure
output_notebook()
options = dict(plot_height=400,plot_width=700,tools="pan,wheel_zoom,reset,save,crosshair")# options for the graphic

x = [i-0.15 for i in range(4)]
p = [0.2,0.3,0.1,0.4] 
plot1 = figure(title="pmf of X", x_axis_label = "risultato", # create an empty figure
               y_axis_label = "probabilità", x_range=(-1,4), y_range=(0,1), **options 
              )
r1 = plot1.vbar(x, top=p, bottom=0, width=0.3, color="#111188", alpha=0.5 )
show(plot1, notebook_handle=True);

 # Esempio (continua)

Scriviamo $\E(X)$ con notazioni diverse ma equivalenti:

$\displaystyle
\begin{array}{lcl}
\E(X)
&=&\displaystyle\sum_{x\in R} x\cdot \Pr(X=x)\\[1ex]
&=&\displaystyle \sum^3_{k=0} k\cdot \Pr(X=k)\quad\textrm{(N.B. il nome l'indice è irrilevante)}\\
\end{array}$

$\displaystyle
\begin{array}{lcrcrcrcr}
\phantom{\E(X)}
&=&0\cdot \Pr(X=0) &+& 1\cdot \Pr(X=1) &+& 2\cdot \Pr(X=2) &+& 3\cdot \Pr(X=3)\\
&=&0               &+&        \Pr(X=1) &+& 2\cdot \Pr(X=2) &+& 3\cdot \Pr(X=3)\\
&=&0               &+&             0.3 &+& 2\cdot 0.1      &+& 3\cdot 0.4\\
&=&1.7\\
\end{array}$

La *media* (nel senso che la parola ha nel linguaggio comune) dei $4$ valori $0,1,2,3$ risulterebbe $(0+1+2+3)/4=3/2=1.5$. Come da grafico.

In [64]:
p2 = [ i for i in range(4)]
x2 = [i+0.3 for i in x]
plot2 = figure(title="plottiamo x per x=0,1,2,3 e la loro media (0+1+2+3)/4" , 
               x_axis_label = "risultato", x_range=(-1,4), y_range=(0,3.25), **options )
plot2.vbar(x2, top=p2, bottom=0, width=0.3, color="#118811", alpha=0.5 )
plot2.vbar([i+0.3 for i in x], top=[1.5]*4, bottom=0, width=0.3, color="#118811", alpha=0.1 )
plot2.line([0,3+0.3], [1.5, 1.5], line_width=3, color="#115511", alpha=0.8 )
show(plot2, notebook_handle=True);

Il valore $\E(X)$ calcolato è un operazione simile alla media (nel senso del linguaggio comune), ma è fatta tra valori opportunamente *pesati*. Al valore $x$ diamo peso $4\cdot\Pr(X=x)$. Nel caso precedente tutti i valori avevano peso $1$. In entrambi i casi la somma dei pesi è $4$. (Il fattore per cui dividiamo.)

In [65]:
p1 = [ 4*p [i] for i in range(4)] 
p3 = [ i*p1[i] for i in range(4)]
plot1 = figure(title="a sinistra in viola il peso 4.Pr (X=x),   a destra in verde  x\
               la barra orrizzontale corrisponde a E(X)", 
               x_axis_label = "risultato", x_range=(-1,4), y_range=(0,5.2), **options )
plot1.vbar(x, top=p1,  bottom=0, width=0.3, color="#111188", alpha=0.5 )
plot1.vbar(x2, top=p3, bottom=0, width=0.3, color="#118811", alpha=0.5 )
plot1.vbar([i+0.3 for i in x], top=[1.7]*4, bottom=0, width=0.3, color="#118811", alpha=0.1 )
plot1.line([0, 3+0.3], [1.7,1.7], line_width=3, color="#116611", alpha=0.8  )
show(plot1, notebook_handle=True);