<a href="https://colab.research.google.com/github/QwertyJacob/colab_handouts_PSI/blob/main/Geometric.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### 3.3.3 Variabile Aleatoria Geometrica

Consideriamo nuovamente una sequenza di prove di Bernoulli indipendenti. Ogni prova ha come esito un "successo" o un "insuccesso". Immagina di essere in un pub con i tuoi amici e di decidere di giocare a freccette. Ogni volta che tiri una freccetta, hai una probabilità $ p $ di colpire il centro (bullseye), e una probabilità $ 1 - p $ di mancarlo.

La variabile aleatoria geometrica $ X$ rappresenta il numero di tentativi necessari per ottenere il primo successo (colpire il bullseye).

**Esempio:**
- Supponiamo che $$ p = 0.2 $$.
- Vuoi sapere qual è la probabilità che tu colpisca il bullseye per la prima volta al terzo tentativo.

La probabilità che ciò accada è data da:

$$ P(X = k) = (1 - p)^{k-1} \cdot p $$

Per $ k = 3 $:

$$ P(X = 3) = (1 - 0.2)^{3-1} \cdot 0.2 = 0.8^2 \cdot 0.2 = 0.128 $$

In [None]:
import math

def prob_geometrica(p, k):
    return (1 - p)**(k - 1) * p

p = 0.2
k = 3
print(f"La probabilità di colpire il bullseye al terzo tentativo è: {prob_geometrica(p, k):.3f}")

La probabilità di colpire il bullseye al terzo tentativo è: 0.128


> **DEFINIZIONE 3.12**   Il numero di prove di Bernoulli necessarie per ottenere il primo successo ha **distribuzione geometrica**.



**Esempio 3.18.** Un motore di ricerca esamina una lista di siti alla ricerca di una determinata frase chiave. Si supponga che la ricerca termini non appena la frase viene trovata. Il numero di siti visitati ha distribuzione geometrica.♦


**Esempio 3.19.** Un responsabile delle assunzioni intervista i candidati uno alla volta per coprire un posto vacante. Il numero di candidati intervistati fino a quando uno di essi riceve un'offerta di lavoro ha distribuzione geometrica.

♦



Le variabili aleatorie geometriche possono assumere qualsiasi valore intero da 1 a infinito, poiché sono necessarie almeno 1 prova per ottenere il primo successo, e il numero di prove richieste non è limitato superiormente da alcun valore fisso. (Ad esempio, non c'è alcuna garanzia che tra i primi 10 lanci di una moneta ci sia almeno una testa.) L'unico parametro è $ p $, la probabilità di successo.

La funzione di massa di probabilità geometrica ha la forma:

$$ P(x) = P(\text{il 1° successo si verifica all'x-esima prova}) = (1 - p)^{x-1} p, \quad x = 1, 2, \ldots $$

> **Questa rappresenta la probabilità di avere $ x - 1 $ insuccessi seguiti da un successo. Rispetto alla (3.9), in questa formula non compare alcun coefficiente binomiale perché esiste un solo esito in cui il primo successo si verifica esattamente all’$ x $-esima prova.**



È la prima volta che incontriamo una variabile aleatoria illimitata, ovvero senza un limite superiore. La variabile $ X $ può assumere qualsiasi valore intero positivo, da $ 1 $ a $ \infty $. È utile verificare che $ \sum_x P(x) = 1 $, come richiesto da ogni funzione di massa di probabilità. Effettivamente:

$$
\sum_{x=1}^{\infty} P(x) = \sum_{x=1}^{\infty} (1 - p)^{x-1} p = p \sum_{k=0}^{\infty} (1 - p)^k = p \cdot \frac{1}{1 - (1 - p)} = p \cdot \frac{1}{p} = 1,
$$

dove si è riconosciuto che la somma a sinistra è una serie geometrica, da cui deriva il nome "distribuzione geometrica".

Infine, la distribuzione geometrica ha valore atteso $ \mu = \frac{1}{p} $ e varianza $ \sigma^2 = \frac{1 - p}{p^2} $.

**Dimostrazione del valore atteso:** Consideriamo la serie geometrica

$$
s(q) = \sum_{x=0}^{\infty} q^x = \frac{1}{1 - q}, \quad \text{per } |q| < 1.
$$

Derivando rispetto a $ q $:

$$
s'(q) = \left( \frac{1}{1 - q} \right)' = \frac{1}{(1 - q)^2} = \sum_{x=1}^{\infty} x q^{x-1}.
$$

Moltiplicando entrambi i membri per $ p $ e ricordando che $ p = 1 - q $, otteniamo:

$$
E(X) = \sum_{x=1}^{\infty} x (1 - p)^{x-1} p = p \sum_{x=1}^{\infty} x q^{x-1} = p \cdot \frac{1}{(1 - q)^2} = p \cdot \frac{1}{p^2} = \frac{1}{p}.
$$

La derivazione della varianza è simile: si calcola la seconda derivata della serie geometrica e, dopo alcuni passaggi, si ottiene un'espressione per $ \sum x^2 q^{x-1} $, da cui si ricava $ Var(X) $.

$$\square$$

**Distribuzione geometrica**  
$ p $ = probabilità di successo  
$$ P(x) = (1 - p)^{x-1} p, \quad x = 1, 2, \ldots $$
$$ E(X) = \frac{1}{p} $$

$$ Var(X) = \frac{1 - p}{p^2} $$
$$ \tag{3.10} $$


> **Esempio 3.20 (Paradosso di San Pietroburgo).**  Questo paradosso fu osservato dal matematico svizzero Daniel Bernoulli (1700–1782), nipote di Jacob. Descrive una strategia di gioco d’azzardo che permetterebbe di vincere una somma di denaro desiderata con probabilità uno. Non sembra una strategia molto attraente? È reale, non c’è alcuna truffa!

Consideriamo un gioco che può essere ripetuto un numero arbitrario di volte. I turni sono indipendenti e, ogni volta, la probabilità di vincere è $ p $. Il gioco non deve essere favorevole al giocatore né tantomeno equo: $ p $ può essere qualsiasi probabilità positiva. In ogni turno si scommette una certa somma $ x $. In caso di successo, si vince $ x $. In caso di insuccesso, si perde $ x $.

La strategia è semplice: la puntata iniziale è pari all’importo che si desidera vincere. Se si vince un turno, si smette. Se si perde, si raddoppia la puntata e si continua.

Supponiamo che il guadagno desiderato sia 100 euro. Il gioco si svolgerà nel modo seguente:

| Turno     | 1     | 2     | 3     | ...   |
|-----------|-------|-------|-------|-------|
| Puntata   | 100   | 200   | 400   | ...   |
| Bilancio se si perde | -100  | -300  | -700  | ...   |
| Bilancio se si vince | +100 e si ferma | +100 e si ferma | +100 e si ferma | ...   |

Prima o poi, si vincerà un turno e, in quel momento, il bilancio sarà +100 euro. Garantito! Tuttavia, non è questo ciò che D. Bernoulli chiamava un paradosso.

Quanti turni bisognerà giocare? Poiché ogni turno è una prova di Bernoulli, il numero di turni $ X $ fino al primo successo è una variabile aleatoria geometrica con parametro $ p $.

Il gioco è potenzialmente infinito? No. In media, durerà $ E(X) = \frac{1}{p} $ turni. In un gioco equo con $ p = \frac{1}{2} $, serviranno in media 2 turni per ottenere la vittoria. In un gioco "sfavorevole", con $ p < \frac{1}{2} $, ci vorrà più tempo, ma comunque un numero finito di turni. Ad esempio, se $ p = 0{,}2 $ (una vittoria ogni cinque turni in media), ci si fermerà dopo $ \frac{1}{p} = 5 $ turni in media. Ancora, nessun paradosso.

Infine, quanto denaro serve per poter seguire questa strategia? Sia $ Y $ l’importo dell’ultima puntata. Secondo la strategia, $ Y = 100 \cdot 2^{X-1} $. È una variabile aleatoria discreta il cui valore atteso è:

$$
E(Y) = \sum_{x=1}^{\infty} \left(100 \cdot 2^{x-1}\right) P_X(x) = 100 \sum_{x=1}^{\infty} 2^{x-1} (1 - p)^{x-1} p = 100p \sum_{x=1}^{\infty} \left(2(1 - p)\right)^{x-1}
$$

Questa è una serie geometrica di ragione $ 2(1 - p) $. La somma converge solo se $ 2(1 - p) < 1 $, cioè $ p > \frac{1}{2} $. Altrimenti diverge. Pertanto:

$$
E(Y) = 
\begin{cases}
\frac{100p}{1 - 2(1 - p)} = \frac{100p}{2p - 1} & \text{se } p > \frac{1}{2}, \\
+\infty & \text{se } p \leq \frac{1}{2}.
\end{cases}
$$

**Questo è il Paradosso di San Pietroburgo!** Una variabile aleatoria che assume sempre valori finiti (cioè, il gioco termina quasi certamente) ha un valore atteso infinito. Anche quando il gioco è equo, con $ p = \frac{1}{2} $, il valore atteso dell’ultima puntata è infinito. Ciò significa che, in media, sarebbe necessario un capitale infinito per applicare questa strategia.

Per quanto ne sappiamo, ogni casinò impone un limite massimo alla puntata, impedendo ai giocatori di applicare completamente la strategia di San Pietroburgo. Quando un tale limite è presente, si può dimostrare che non esiste una strategia vincente.

♦



#### **Variabile Aleatoria di Pascal (o Binomiale Negativa)**

**Definizione:** La variabile aleatoria di Pascal $ Y $ rappresenta il numero di tentativi necessari per ottenere $ r $ successi.

**Esempio:**
- Ora, invece, vuoi sapere quanti tentativi ti servono per colpire il bullseye esattamente 2 volte ($ r = 2 $).

La probabilità che tu ottenga il secondo successo al $ k $-esimo tentativo è:
$ P(Y = k) = \binom{k-1}{r-1} \cdot p^r \cdot (1-p)^{k-r} $

Per $ r = 2 $ e $ k = 5 $:

$$ P(Y = 5) = \binom{4}{1} \cdot 0.2^2 \cdot 0.8^3 = 4 \cdot 0.04 \cdot 0.512 = 0.08192 $$

**Codice Python per calcolare questa probabilità:**





### **Discussione:**

- **Geometrica:** Questa distribuzione è utile quando si vuole sapere quanto tempo ci vuole per ottenere il primo successo in una serie di tentativi indipendenti.
- **Pascal:** Questa estende il concetto, utile per sapere quanto tempo ci vuole per ottenere un numero fisso di successi, il che è molto utile in situazioni dove non ti basta un solo successo, ma ne servono diversi.

### **Ricorda:**

1. **Geometrica:** Calcolare la probabilità che il primo bullseye arrivi al quarto tentativo, con \( p = 0.3 \).
   
2. **Pascal:** Calcolare la probabilità di ottenere il terzo bullseye al settimo tentativo, sempre con \( p = 0.3 \).

In [None]:
import math

def prob_pascal(r, p, k):
    return math.comb(k-1, r-1) * (p**r) * ((1-p)**(k-r))

r, p, k = 2, 0.2, 5
print(f"La probabilità di colpire il bullseye 2 volte entro il quinto tentativo è: {prob_pascal(r, p, k):.5f}")

La probabilità di colpire il bullseye 2 volte entro il quinto tentativo è: 0.08192


### Un'altro esempio:

Immagina di trovarci in un mondo in cui i giochi d'azzardo sono all'ordine del giorno. Un gruppo di amici decide di giocare a un gioco di dadi, e vogliono calcolare le probabilità di ottenere un certo risultato.

#### La Variabile Aleatoria Geometrica

Iniziamo con la variabile aleatoria geometrica. Supponiamo che uno dei nostri amici, Marco, voglia sapere quante volte deve lanciare un dado per ottenere un **6**. Ogni lancio del dado è un esperimento indipendente, e la probabilità di ottenere un **6** è $ p = \frac{1}{6} $.

La variabile aleatoria geometrica $ X $ rappresenta il numero di lanci necessari fino al primo successo (ovvero, fino a quando Marco ottiene un **6**).

La funzione di probabilità della variabile aleatoria geometrica è data da:

$$
P(X = k) = (1 - p)^{k-1} \cdot p
$$

dove:
- $ k $ è il numero di lanci necessari,
- $ p $ è la probabilità di successo in un singolo lancio.

#### Esempio di Calcolo con Python

Vediamo come calcolare la probabilità che Marco ottenga un **6** al quarto lancio:

In [None]:
def probabilita_geometrica(k, p):
    q = 1 - p  # probabilità di insuccesso
    return (q ** (k - 1)) * p

# Parametri
k = 4  # numero di lanci
p = 1/6  # probabilità di ottenere un 6

# Calcolo della probabilità
probabilita = probabilita_geometrica(k, p)
print(f"La probabilità di ottenere un 6 al quarto lancio è: {probabilita:.4f}")

La probabilità di ottenere un 6 al quarto lancio è: 0.0965


### Media e Varianza della Distribuzione Geometrica

## Media (Valore atteso)

La media si calcola come:

$$ \mathbb{E}[X] = \sum_{k=1}^{\infty} k(1-p)^{k-1}p $$

Per risolverla, usiamo la derivata della serie geometrica:
$$ \sum_{k=0}^{\infty} x^k = \frac{1}{1-x} \text{ per }|x|<1 $$

Derivando rispetto a x:
$$ \sum_{k=1}^{\infty} kx^{k-1} = \frac{1}{(1-x)^2} $$

Moltiplicando per x:
$$ \sum_{k=1}^{\infty} kx^k = \frac{x}{(1-x)^2} $$

Sostituendo $x = (1-p)$:
$$ E[X] = p\sum_{k=1}^{\infty} k(1-p)^{k-1} = \frac{1}{p} $$

## Varianza

La varianza si calcola come:
$$ Var(X) = \mathbb{E}[X^2] - (\mathbb{E}[X])^2 $$

Per trovare $\mathbb{E}[X^2]$, usiamo la seconda derivata della serie geometrica:
$$ \sum_{k=1}^{\infty} k^2x^{k-1} = \frac{1+x}{(1-x)^3} $$

Dopo alcuni passaggi algebrici:
$$ \mathbb{E}[X^2] = \frac{2-p}{p^2} $$

Quindi:
$$ Var(X) = \mathbb{E}[X^2] - (\mathbb{E}[X])^2 = \frac{2-p}{p^2} - \frac{1}{p^2} = \frac{1-p}{p^2} $$

## Risultati finali

Media: $$ \mathbb{E}[X] = \frac{1}{p} $$

Varianza: $$ Var(X) = \frac{1-p}{p^2} $$

- **Approfondimento**: https://dariomalchiodi.gitlab.io/sad-python-book/L11-Distribuzione_geometrica.html