In [1]:
# This loads some style files
from IPython.core.display import HTML
with open( './style/custom.css', 'r' ) as f: html_style = f.read()
HTML( html_style )

# Il valore atteso 


Sia $X\in R$ una v.a. numerica discreta. Per semplicità assumiamo che $R$ sia un insieme finito. Il <mark>valore atteso</mark> o  <mark class="ita">expected value</mark> di $X$ è

$\def\E{{\rm E}}\def\Pr{{\rm Pr}\,}$
$\quad$<mark>$\E(X)$</mark>$\displaystyle\ \ =\ \ \sum_{x\in R} x\cdot \Pr(X=x)$

Molto spesso si chiama anche <mark>media (di popolazione)</mark>, o  <mark class="ita">(population) mean</mark>, più raramente,  <mark class="ita">average</mark>.

La lettera $\mu$ viene usata per denotare $\E(X)$ quando è chiaro a quale variabile ci si riferisce. Per evitare ambiguità a volte si scrive <mark>$\mu_X$</mark>.

ATTENZIONE: non si confonda il concetto di *media di popolazione* con quello di *media campionaria* (che introdurremo più avanti). Entrambi vengono spesso abbreviati con *media*!


# Esempio

Supponiamo che $R=\{0,1,2,3\}$ e che

$\Pr(X=0)=0.2$

$\Pr(X=1)=0.3$

$\Pr(X=2)=0.1$

$\Pr(X=3)=1-\Pr(X\in\{0,1,2\}) = 0.4$

La pmf di $X$ è plottata nel grafico sottostante.

In [2]:
from bokeh.io import show, output_notebook, output_file # libraries for graphic output
from bokeh.plotting import figure
output_notebook()
options = dict(plot_height=400,plot_width=700,tools="pan,wheel_zoom,reset,save,crosshair,box_select")

x = [i for i in range(4)]
p = [0.2,0.3,0.1,0.4] 
plot1 = figure(title="PMF of X", x_axis_label = "risultato", # create an empty figure
               y_axis_label = "probabilità", x_range=(-1,4), y_range=(0,1), **options )
plot1.title.text_font="times"
plot1.title.text_font_size="16pt"
bar_width = 0.5
r1 = plot1.vbar(x, top=p, bottom=0, width=bar_width, color="#111188", alpha=0.5 )
show(plot1, notebook_handle=True);

 # Esempio (continua)

Scriviamo $\E(X)$ con notazioni diverse ma equivalenti:

$\displaystyle
\begin{array}{lcl}
\E(X)
&=&\displaystyle\sum_{x\in R} x\cdot \Pr(X=x)\\[1ex]
&=&\displaystyle \sum^3_{k=0} k\cdot \Pr(X=k)\quad\textrm{(N.B. il nome l'indice è irrilevante)}\\
\end{array}$

$\displaystyle
\begin{array}{lcrcrcrcr}
\phantom{\E(X)}
&=&0\cdot \Pr(X=0) &+& 1\cdot \Pr(X=1) &+& 2\cdot \Pr(X=2) &+& 3\cdot \Pr(X=3)\\
&=&0               &+&        \Pr(X=1) &+& 2\cdot \Pr(X=2) &+& 3\cdot \Pr(X=3)\\
&=&0               &+&             0.3 &+& 2\cdot 0.1      &+& 3\cdot 0.4\\
&=&1.7\\
\end{array}$

# Valore atteso e cambiamento di scala (linearità 1)

Per ogni costante $c$ 

$\def\E{{\rm E}}\def\Pr{{\rm Pr}\,}
\quad\E(c\, X)\ \ =\ \ c\,\E(X)$

Infatti osserviamo che $c\,X\in\{cx:x\in R\}$. Quindi

$\quad\E(c\, X)\ \ =\ \ \displaystyle \phantom{c}\sum_{x\in R}\ c\,x\, \Pr(cX=cx)$

$\quad\phantom{\E(c\, X)}\ \ =\ \ \displaystyle\phantom{c}\sum_{x\in R}\ c\,x\, \Pr(X=x)$

$\quad\phantom{\E(c\, X)}\ \ =\ \ \displaystyle c\sum_{x\in R}\ \phantom{c}\,x\,\Pr(X=x)$

$\quad\phantom{\E(c\, X)}\ \ =\ \ \displaystyle c\; \E(X)$.

# Valore atteso e somma di v.a. (linearità 2)

Per ogni coppia di v.a. $X$, $Y$

$\quad\E(X+Y)\ \ =\ \ \E(X)+\E(Y)$

Questa proprietà la assumiamo senza verifica.

Si noti che non è necessario assumere che le variabili $X$ ed $Y$ siano indipendenti.

La proprietà vale anche per la somma di più variabili indipendenti $X_i$, con $i=1,\dots,n$

$\quad\E\bigg(\displaystyle\sum^n_{i=1} X_i\bigg)\ \ =\ \ \displaystyle\sum^n_{i=1} \E(X_i)$

<!--Per semplicità assumiamo che $X,Y\in R$. Infatti osserviamo che $(X,Y)\in R^2$. Quindi

$\quad\E(X+Y)\ \ =\ \ \displaystyle \sum_{(x,y)\in R^2}\ (x+y)\Pr(X,Y=x,y)$

$\quad\E(X+Y)\ \ =\ \ \displaystyle \sum_{(x,y)\in R^2}\ x\,\Pr(X,Y=x,y) + y\,\Pr(X,Y=x,y)$

$\quad\E(X+Y)\ \ =\ \ \displaystyle \sum_{(x,y)\in R^2}\ x\,\Pr(X,Y=x,y) + \sum_{(x,y)\in R^2}\ y\,\Pr(X,Y=x,y)$-->

# Valore atteso del prodotto

In generale **non è** vero che per ogni coppia di v.a. $X$, $Y$

$\quad\E(X\,Y)\ \ =\ \ \E(X)\,\E(Y)$

Questa proprietà vale sono assumendo opportune (forti) ipotesi su $X$, $Y$. (Vedremo più avanti la proprietà dell'indipendenza.)

# Altre funzioni

I casi visti sopra sono relativamente fortunati.

In generale, se $g(x)$ una funzione qualsiasi (come $x^2$, $\log(x)$, $e^x$, ecc.) avremo che 

$\quad\E\big(g(X)\big)\neq g\big(\E\big(X)\big)$

Per esempio, vediamo un semplice esempio dove 

$\quad\E\big(X^2\big)\neq \E\big(X)^2$

Prendiamo $X\in\{0,2\}$ con distribuzione $\Pr(X=0)\ =\ \Pr(X=2)\ =\ \dfrac12$

$\quad\ \E\big(X\big)\,\ =\ 2\ \Pr(X=2)\ =\ 1$

$\quad\E\big(X^2\big)\ =\ 4\ \Pr(X=2)\ =\ 2\ \neq\ \E\big(X\big)^2$


In [1]:
2+2

4