# Modelli

In [1]:
import ipywidgets as widgets
from src.models import *

%matplotlib inline

## Table of Contents

<ul>
    <li><a href="#Modello-di-Bernoulli">Modello di Bernoulli</a></li>
    <li><a href="#Modello-binomiale">Modello binomiale</a></li>
    <li><a href="#Modello-uniforme-discreto">Modello uniforme discreto</a></li>
    <li><a href="#Modello-geometrico">Modello geometrico</a></li>
    <li><a href="#Modello-di-Poisson">Modello di Poisson</a></li>
    <li><a href="#Modello-ipergeometrico">Modello ipergeometrico</a></li>
    <li><a href="#Modello-uniforme-continuo">Modello uniforme continuo</a></li>
    <li><a href="#Modello-esponenziale">Modello esponenziale</a></li>
    <li><a href="#Modello-gaussiano">Modello gaussiano</a></li>
</ul> 

## Modello di Bernoulli

$$X \sim B(p)$$
$$D_X = \{0,1\}$$

La variabile $X$ assume valore 1 se l'esperimento ha avuto successo, 0 se è fallito.
L'argomento $p$ indica la probabilità del successo dell'esperimento.

**Funzione di massa di probabilità**
$$p_X(x) = p^x(1-p)^{1-x}I_{\{0,1\}}(x)$$

**Funzione di ripartizione**
$$F_x(x) = \begin{cases}0\quad & x<0
\\1-p\quad & 0\leq x<1
\\1\quad & 1\leq x\end{cases}$$

**Valore atteso**
$$E[X] = p$$

**Varianza**
$$\operatorname{Var}(X) = p(1-p)$$

In [2]:
_ = widgets.interact(plot_bern, p=widgets.FloatSlider(value=.5, min=0, max=1, step=.05, description='$p$'))

interactive(children=(FloatSlider(value=0.5, description='$p$', max=1.0, step=0.05), Output()), _dom_classes=(…

## Modello binomiale

$$X \sim B(n, p)$$
$$D_X = \{0,\dots,n\}$$

Questo modello consiste in $n$ ripetizioni indipendenti di un esperimento bernoulliano di parametro $p$. La variabile $X$ assume come valore il numero di successi ottenuti.

Quando il parametro $n$ è molto alto, per il *TCL* questo modello può essere approssimato dal modello normale: data $X \sim B(n, p)$, allora $X ~ \dot{\sim} ~ N(np, \sqrt{np(1-p)})$, quindi effettuando la normalizzazione si ottiene $\dfrac{X-np}{\sqrt{np(1-p)}} ~ \dot{\sim} ~ N(0, 1)$.

**Funzione di massa di probabilità**
$$p_X(i) = \displaystyle\binom{n}{i} p^i(1-p)^{n-i}I_{\{0,\dots,n\}}(x)$$

Da notare che nel caso di tutti successi $p_X(i) = (1-p)^n$ mentre se si verificano solo fallimenti $p_X(i) = p^n$.

**Funzione di ripartizione**
$$F_x(x) = \sum_{i=0}^{\lfloor x\rfloor}\binom{n}{i} p^i (1-p)^{n-i}I_{[0,n]}(x)+I_{(n,+\infty)}(x)$$

**Valore atteso**
$$E[X] = np$$

**Varianza**
$$\operatorname{Var}(X) = np(1-p)$$

In [3]:
_ = widgets.interact(plot_binom,
                     n=widgets.IntSlider(value=15, min=1, max=20, step=1, description='$n$'),
                     p=widgets.FloatSlider(value=.5, min=0, max=1, step=.05, description='$p$'))

interactive(children=(IntSlider(value=15, description='$n$', max=20, min=1), FloatSlider(value=0.5, descriptio…

## Modello uniforme discreto

$$X \sim U(n)$$
$$D_X = \{1,\dots,n\}$$

La variabile $X$ assume il valore dell'esito di un esperimento composto da $n$ esiti equiprobabili, numerati da 1 a $n$.

**Funzione di massa di probabilità**
$$p_X(i) = \dfrac{1}{n} I_{\{1,\dots,n\}}(i)$$

**Funzione di ripartizione**
$$F_x(x) = \dfrac{\lfloor x\rfloor}{n}\cdot I_{[1,\dots,n]}(x)+I_{(n,\dots,+\infty)}(x)$$

**Valore atteso**
$$E[X] = \dfrac{n+1}{2}$$

**Varianza**
$$\operatorname{Var}(X) = \dfrac{n^2-1}{12}$$

In [4]:
_ = widgets.interact(plot_unif_discr, n=widgets.IntSlider(value=10, min=1, max=20, step=1, description='$n$'))

interactive(children=(IntSlider(value=10, description='$n$', max=20, min=1), Output()), _dom_classes=('widget-…

## Modello geometrico

$$X \sim G(p)$$
$$D_X = \mathbb{N}$$

Questo modello calcola il numero di esperimenti bernoulliani di parametro $p$ necessari per ottenere un successo. In altre parole, la variabile $X$ assume come valore il numero di insuccessi prima del primo successo.

Una caratteristica di questo modello è che gode della proprietà di *assenza di memoria*, cioè sapere che $i$ esperimenti sono falliti non dà informazioni su quanti insuccessi mancano per ottenere il primo successo. Più formalmente, $P(X\geq i+j ~ | ~ X \geq i) = P(X\geq j)$.

**Funzione di massa di probabilità**
$$p_X(i) = (1-p)^ip ~ I_\mathbb{N} (i)$$

**Funzione di ripartizione**
$$F_x(x) = 1 - (1-p)^{\lfloor x\rfloor+1}$$

**Valore atteso**
$$E[X] = \dfrac{1-p}{p}$$

**Varianza**
$$\operatorname{Var}(X) = \dfrac{1-p}{p^2}$$

In [5]:
_ = widgets.interact(plot_geom, p=widgets.FloatSlider(value=.5, min=.05, max=1, step=.05, description='$p$'))

interactive(children=(FloatSlider(value=0.5, description='$p$', max=1.0, min=0.05, step=0.05), Output()), _dom…

## Modello di Poisson

$$X \sim P(\lambda), ~ \lambda > 0$$
$$D_X = \mathbb{N}$$

Questo modello esprime la probabilità che un certo numero di eventi si verificano successivamente ed indipendentemente in un intervallo di tempo, sapendo che mediamente in quell'intervallo se ne verificano $\lambda$. La variabile $X$ assume come valore il numero di eventi che si verificano.

Rappresenta anche un'approssimazione del modello binomiale nel caso in cui il prodotto dei suoi parametri è costante e la $n$ è molto grande (quindi la $p$ è molto piccola): $X \sim B(n,p)$ con $\lambda = np$.

Questo modello gode della proprietà di *riproducibilità*: date $X_1, \dots X_n$ variabili tali che $X_i \sim P(\lambda_i)$ e $Y = \sum_{i}X_i$, allora $Y \sim P(\sum_{i}\lambda_i)$. Da notare come nel caso in cui $\forall i ~ \lambda = \lambda_i$, allora $Y \sim P(n\lambda)$.

**Funzione di massa di probabilità**
$$p_X(i) = e^{-\lambda}\frac{\lambda^i}{i!} ~ I_\mathbb{N}(i)$$

**Funzione di ripartizione**
$$-$$

**Valore atteso**
$$E[X] = \lambda$$

**Varianza**
$$\operatorname{Var}(X) = \lambda$$

In [6]:
_ = widgets.interact(plot_poisson, lambd=widgets.IntSlider(value=12, min=0, max=20, step=1, description='$\lambda$'))

interactive(children=(IntSlider(value=12, description='$\\lambda$', max=20), Output()), _dom_classes=('widget-…

## Modello ipergeometrico

$$X \sim H(N+M, N, n)$$
$$D_X = \{0, \dots, n\}$$

Questo modello descrive le situazioni che possono essere modellate come l'estrazione di $n$ oggetti da un'urna senza effettuare la reimmissione. In particolare l'urna è formata da $N$ oggetti funzionanti e $M$ oggetti difettosi.

La variabile aleatoria $X$ assume come valore il numero di oggetti funzionanti estratti.

Questo modello si differenzia dal binomiale per il fatto che non effettua la reimmissione, ma nel caso in cui la dimensione dell'urna è molto elevata, reimmettere gli oggetti non ha un grande impatto e quindi il binomiale ne rappresenta una buona approssimazione (guardare la varianza).

**Funzione di massa di probabilità**
$$p_X(i) = \dfrac{\binom{N}{i}\binom{M}{n-i}}{\binom{N+M}{n}}$$

**Funzione di ripartizione**
$$-$$

**Valore atteso**
$$E[X] = np$$

**Varianza**
$$\operatorname{Var}(X) = np(1-p)\left(1-\frac{n-1}{N+M-1}\right)$$

Dove con $p$ si intende la probabilità del successo di una singola estrazione: $\dfrac{N}{N+M}$.

Da notare come per $N+M \rightarrow +\infty$ la varianza diventa quella del modello binomiale: $np(1-p)$.

In [7]:
N = widgets.IntSlider(value=8, min=0, max=10, description='$N$')
M = widgets.IntSlider(value=8, min=0, max=10, description='$M$')
n = widgets.IntSlider(value=6, min=0, max=8, description='$n$')
def on_value_change(change): n.max = N.value
N.observe(on_value_change, names='value')
_ = widgets.interact(plot_hyper, N=N, M=M, n=n)

interactive(children=(IntSlider(value=8, description='$N$', max=10), IntSlider(value=8, description='$M$', max…

## Modello uniforme continuo

$$X \sim U([a,b])$$
$$D_X = [a,b]$$

Estensione del modello discreto nel continuo.

**Funzione di densità di probabilità**
$$f_X(x) = \dfrac{1}{b-a}I_{[a,b]}(x)$$

**Calcolo della probabilità**
$$P(x \in I) = \dfrac{|I|}{b-a}$$

Da notare come dati due intervalli $I, J$ che hanno la stessa dimensione, $P(X\in I)=P(X\in J)$.

**Funzione di ripartizione**
$$F_X(x) = \dfrac{x-a}{b-a}I_{[a,b]}(x)+I_{(b,+\infty)}(x)$$

**Valore atteso**
$$E[X] = \dfrac{b+a}{2}$$

**Varianza**
$$\operatorname{Var}(X) = \dfrac{(b-a)^2}{12}$$

In [8]:
_ = widgets.interact(plot_unif_cont,
                     ab=widgets.FloatRangeSlider(value=(3, 7), min=0, max=10, step=.5, description='$[a,b]$'),
                     I=widgets.FloatRangeSlider(value=(4, 6), min=0, max=10, step=.5, description='$I$'))

interactive(children=(FloatRangeSlider(value=(3.0, 7.0), description='$[a,b]$', max=10.0, step=0.5), FloatRang…

## Modello esponenziale

$$X \sim E(\lambda), ~ \lambda \in \mathbb{R}^+$$
$$D_X = \mathbb{R}^+$$

Questo modello viene utilizzato per rappresentare il tempo di attesa prima che si verifichi un certo evento casuale, e gode della proprietà di *assenza di memoria*.

Esiste una forte relazione tra questo modello e quello di Poisson, infatti la relazione tra i loro parametri è la seguente: $\lambda_P = L\lambda_E$, dove $L$ è la dimensione dell'intervallo preso in considerazione e $\lambda_P, \lambda_E$ sono rispettivamente il parametro della distribuzione di Poisson e della esponenziale.

**Funzione di densità di probabilità**
$$f_X(x) = \lambda e^{-\lambda x} I_{\mathbb{R}^+}(x)$$

**Funzione di ripartizione**
$$F_X(x) = 1-e^{-\lambda x}$$

**Valore atteso**
$$E[X] = \frac{1}{\lambda}$$

**Varianza**
$$\operatorname{Var}(X) = \frac{1}{\lambda^2}$$

In [9]:
_ = widgets.interact(plot_exp, lambd=widgets.FloatSlider(value=1.5, min=.1, max=2, step=.05, description='$\lambda$'))

interactive(children=(FloatSlider(value=1.5, description='$\\lambda$', max=2.0, min=0.1, step=0.05), Output())…

## Modello gaussiano

$$X\sim N(\mu,\sigma), ~ \mu \in \mathbb{R}, \sigma \in \mathbb{R}^+$$
$$D_X = \mathbb{R}$$

Questo modello gode di alcune proprietà:
- *linearità*: se $Y=aX+b$ con $X\sim N(\mu,\sigma)$, allora $Y\sim N(a\mu+b,a\sigma)$,
- *riproducibilità*: sommando $n$ variabili aleatorie indipendenti dello stesso modello se ne ottiene un'altra di quel modello. Quindi date $X_1, \dots, X_n$ indipendenti con $X_i \sim N(\mu_i,\sigma_i)$ e $Y = \sum_iX_i$, allora $Y\sim N(\sum_i\mu_i,\sqrt{\sum_i\sigma_i^2})$,
- *media e mediana*: la media e la mediana di una variabile gaussiana coincidono.

### Modello Normale Standard

Quando una variabile gaussiana viene standardizzata, quindi viene posto $\mu=0$ e $\sigma=1$, prende il nome di *Normale Standard*. Più formalmente, $Z := \dfrac{X-\mu}{\sigma} \sim G(0,1)$.

In questo caso le funzioni di densità e di ripartizione si indicano rispettivamente con $\phi(z)$ e $\Phi(z)$, e data la simmetria della funzione di ripartizione $\Phi(-x) = 1-\Phi(x)$.

**Funzione di densità di probabilità**
$$f_X(x) = \dfrac{1}{\sqrt{2\pi}~\sigma}e^{-\dfrac{(x-\mu)^2}{2\sigma^2}}$$

**Funzione di ripartizione**
$$F_X(x) = \int_{-\infty}^x \dfrac{1}{\sqrt{2\pi}~\sigma} e^{-\frac{1}{2}\left(\dfrac{y-\mu}{\sigma}\right)^2} dy$$

**Valore atteso**
$$E[X] = \mu$$

**Varianza**
$$\operatorname{Var}(X) = \sigma^2$$

In [10]:
_ = widgets.interact(plot_gauss,
                     mu=widgets.FloatSlider(value=0, min=-15, max=15, step=.5, description='$\mu$'),
                     sigma=widgets.FloatSlider(value=1, min=.2, max=5, step=.1, description='$\sigma$'))

interactive(children=(FloatSlider(value=0.0, description='$\\mu$', max=15.0, min=-15.0, step=0.5), FloatSlider…