In [1]:
from scipy.stats import binom
from scipy.stats import poisson

# Esercizi sulle distribuzioni discrete

* Durante la pandemia molti esami furono sostituiti da test online a risposta multipla. Se un test prevede 5 domande, ciascuna con 3 risposte, calcolare la probabilità di indovinare almeno 4 risposte a caso. Come cambia la probabilità se invece ci sono 5 risposte?

**Soluzione:**

Se scelgo a caso una risposta su 3, la probabilità di scegliere quella giusta è $p=1/3$.
Il  numero di domande è $N=5$, quindi devo trovare la probabilità che il numero di risposte giuste sia $n\ge 4$.
Il problema è binomiale, quindi devo calcolare $P(n\ge 4; N, p)$.

In [2]:
p = 1.0/3.0
N = 5
n_min = 4
def print_prob():
    b = binom(N, p)
    prob = 1.0 - b.cdf(n_min)
    print("P(N >= {}; {}, {:.2f}) = {:.4%}".format(n_min, N, p, prob))
print_prob()
p = 1.0/5.0
print_prob()
p = 1.0/2.0
print_prob()

P(N >= 4; 5, 0.33) = 0.4115%
P(N >= 4; 5, 0.20) = 0.0320%
P(N >= 4; 5, 0.50) = 3.1250%


* In una produzione industriale viene riscontrato lo 0.1% di componenti difettosi. Calcolare la probabilità di averne almeno 2 difettosi in uno scatolo con 1000 componenti. Ripetere il calcolo utilizzando la distribuzione di Poisson.

**Soluzione:**

Il problema è binomiale con $p=0.001$ e $N=1\,000$. Dobbiamo calcolare $P(n\ge 2; N, p)$. Siccome $N$ è molto grande e $p$ molto piccolo, l'approssimazione poissoniana è ragionevole, con $\nu = Np$: $P(n\ge 2; \nu)$.

In [3]:
p = 0.001
N = 1000
n_min = 2
def print_prob(distr):
    prob = 1.0 - distr.cdf(n_min)
    print("P(N >= {}; {}, {:.4f}) = {:.4%}".format(n_min, N, p, prob))
print("caso binomiale:")
print_prob(binom(N, p))
print("caso poissoniano:")
nu = N*p
print_prob(poisson(nu))

caso binomiale:
P(N >= 2; 1000, 0.0010) = 8.0209%
caso poissoniano:
P(N >= 2; 1000, 0.0010) = 8.0301%


* Supponiamo che in un paese la probabilità che una spedizione tracciabile vada persa sia il 3 per mille. Calcolare la probabilità che un venditore su interenet abbia almeno 3 feedback negativi su 500 acquisti per colpa delle poste. Ripetere il calcolo assumendo distribuzione di probabilità binominale e poissoniana.

**Soluzione:**

Il problema è praticamente identico al precedente.

In [4]:
p = 0.003
N = 500
n_min = 3
def print_prob(distr):
    prob = 1.0 - distr.cdf(n_min)
    print("P(N >= {}; {}, {:.4f}) = {:.4%}".format(n_min, N, p, prob))
print("caso binomiale:")
print_prob(binom(N, p))
print("caso poissoniano:")
nu = N*p
print_prob(poisson(nu))

caso binomiale:
P(N >= 3; 500, 0.0030) = 6.5359%
caso poissoniano:
P(N >= 3; 500, 0.0030) = 6.5642%


* Una ditta produce monitor 4K (3840 x 2160 pixel). Calcolare quale deve essere la probabilità massima di avere un pixel morto se la ditta deve garantire di avere il 95% dei monitor con al massimo un pixel morto. Si può approssimare la distribuzione binomiale con quella di Poisson?

**Soluzione:**

Assumiamo un modello poissoniano. La probabilità di avere un pixel morto è $p$. Per invertire l'equazione con metodi numerici, utilizziamo la funzione di ```scipy.optimize``` [bisect](https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.bisect.html), di cui parleremo nel notebook dedicato.

In [32]:
from scipy.optimize import bisect
N = 3840*2160
p = 0.425e-7
def accept_prob(p):
    nu = N*p
    print("N, p = ", N, p)
    distr = poisson(nu)
    return distr.cdf(1)
print(accept_prob(p))
def f(p):
    return accept_prob(p) - 0.95
p_sol = bisect(f, 0.4e-7, 0.5e-7)
print(p_sol)

N, p =  8294400 4.25e-08
0.9507079172483758
N, p =  8294400 4e-08
N, p =  8294400 5e-08
N, p =  8294400 4.5e-08
N, p =  8294400 4.2500000000000003e-08
N, p =  8294400 4.3750000000000005e-08
N, p =  8294400 4.3125000000000004e-08
N, p =  8294400 4.28125e-08
N, p =  8294400 4.296875e-08
N, p =  8294400 4.2890625e-08
N, p =  8294400 4.28515625e-08
N, p =  8294400 4.2832031250000004e-08
N, p =  8294400 4.2841796875000005e-08
N, p =  8294400 4.28466796875e-08
N, p =  8294400 4.2844238281250004e-08
N, p =  8294400 4.2843017578125004e-08
4.2843017578125004e-08


* In un anno si stima che circa 17000 meteoriti colpiscano la terra con una massa da qualche grammo a mezzo chilo[*] . Calcolare la probabilità che entro vent'anni cada almeno un meteorite sul terrazzo di copertura di un edificio. Assumere una superficie di 300 metri quadri.

$[*]$ [Meteorites on Earth: how many fall per year and why don't we see them?](https://www.iberdrola.com/innovation/meteorites-earth)

**Soluzione:**

La distribuzione del numero $n$ di meteoriti che cadono sul terrazzo in vent'anni segue la distribuzione di Poisson perché il numero di meteoriti che colpiscono la terra è variabile da anno in anno con numero atteso $\nu=17000$ in un anno.

Il raggio terrestre vale circa $R=6378\mathrm{km}$ e la superficie è $S=4\pi R^2$. Il numero atteso di meteoriti sul tetto può essere valutato con una proporzione, ossia paria $\nu \times 20 * s /S$, con $s=300\mathrm{m}$.

La probabilità di avere $n\ge 1$ meteoriti è:

$P(n\ge 1) = 1 - P(n=0) = 1 - e^{-\nu}$

Per $\nu \ll 1$ posso scrivere:

$P(n\ge 1) = 1 - e^{-\nu} \simeq 1 - 1 + \nu = \nu$


In [43]:
import math
R = 6378e3 # metri
S = 4*math.pi*R**2
s0 = 300
N = 17000
n = 20*N*s0/S
print("n atteso in 20 anni = P(n >= 1) = " , n)

n atteso in 20 anni = P(n >= 1) =  1.9953600737145745e-07


* In un prato cadono 25mm di pioggia, che vengono misurati con un pluviometro che ha una base di 10cm$^2$. Calcolare la varianza e la deviazione standard della misura, assumendo che le gocce di pioggia abbiano tutte un volume di 0.1ml[*]

$[*]$ [Rain drop size and speed of a falling rain drop](https://www.baranidesign.com/faq-articles/2020/1/19/rain-drop-size-and-speed-of-a-falling-rain-drop)

**Soluzione:**

Il volume di una gocciolina è $0.1\mathrm{ml} = 10^{-7}\mathrm{m}^3$.


* In Italia nel 2019 per incidenti d'auto sono morte 3.173 persone e 241.384 sono risultate ferite (fonte: [ISTAT](https://www.istat.it/it/archivio/245757)) su un totale di [59.816.673 abitanti](http://demo.istat.it/popres/index.php?anno=2019). Qual è la probabilità che a Pozzuoli (79.752 abitanti) ci siano meno di 2 morti in un anno (assumendo una probabilità uniforme sul territorio nazionale)?

**Soluzione:**

...

* Il 17/3/2021 il Paul-Erlich-Institut ha circolato un [comunicato](https://www.pei.de/SharedDocs/Downloads/EN/newsroom-en/hp-news/faq-temporary-suspension-astrazeneca.pdf) che ha portato alla sospenzione del vaccino AstraZeneca. Erano stati osservati 7 casi (su 1.7 milioni) di una rara trombosi quandi ne era atteso, in media 1. Calcolare qual è la probabilità di avere 7 o più casi quando ne sono attesi 1. Calcolare la stessa probabilità quando se ne attendono invece 2 o 3.

**Soluzione:**

...

* in Italia ad una certa data del 2022 c'erano 50.701.722 persone vaccinate con almeno due dosi contro il Sars-Cov-2 su una popolazione di circa 59.816.673 abitanti. Il 56% delle persone in terapia intensiva risultava vaccinata con almeno due dosi. Calcolare il rischio relativo di andare in terapia infettiva per vaccinati e non.

**Soluzione:**

...

* In una città gli autobus partono ad orari a caso anziché secondo un orario regolare. In un'ora passano 3 autobus, in media. Calcolare la probabilità che entro 5 minuti successivi al passaggio di un autobus ne passi almeno un altro.

**Soluzione:**

...

* si vuole misurare l'efficienza di un rivelatore contando le particelle che vengono rivelate. Assumendo che l'efficienza sia vicina al 90%, calcolare quante particelle vanno acquisite in modo da avere una deviazione standard del valore misurto intorno all'1%.

**Soluzione:**

...

* i vuole misurare l'intensità dei fasci di un collider di elettroni e positroni[*] contando in numero di coppie elettrone-positrone prodotti attravreso un rivelatore posto a piccolo angolo. In un anno vengono acquisti 123456 eventi di questo tipo. Stimare l'incertezza relativa nella misura di intensità come rapporto tra deviazione standard e valore atteso.

$[*]$ tecnicamente, questa si chiama misura di *luminosità integrata*

**Soluzione:**

...

* Ad una certa data, in Italia 1.200.000 persone erano state identificate come infette (e in isolamneto) da Covid-19. Assumiamo che altrettante persone siano infette e circolassero tranquillamente senza sapere di essere infetti. In un treno ci sono 200 persone. Trovare la probabilità che almeno 4 siano infette.

**Soluzione:**

...

* Un rivelatore posto in un esperimento su un acceleratore è attraversato da 100 particelle in media per ogni collissione registrata. Considerando che il sistema di acquisizione riesce ad acquisire segnali di 150 particelle contemporaneamente, al massimo, calcolare la frazione di collisioni per la quale il sistema di aquisizione va in "saturazione". Si assuma, per semplicità, che il numero di particelle che attraversa il rivelatore segua una distribuzione di Poisson, anche se questo non è necessariamente vero.

$[*]$ questa frazione si chiama tecnicamente frazione di *tempo morto* del sistema di acquisizione.

**Soluzione:**

...

* Un rivelatore di particelle è fatto da 5 piani di rivelatori piani, ciascuno con efficienza del 90%. Consideriamo di identificare una particella se, attraversando tutti i 5 piani, dà un segnale su almeno 3 dei 5 rivelatori. Calcolare l'efficienza di questa selezione, e dire qual è la distribuzione del numero di particelle selezionate in un tempo $\Delta t$.

**Soluzione:**

...