# Poisson Distribution - Distribuzione di Poisson

`La Distribuzione di Poisson` è una distribuzione di probabilità discreta
che viene utilizzata quando si vuole conoscere la probabilità che un certo **numero di successi/eventi si verifichino in un determinato intervallo temporale.**

<u>Esempi:</u>

<ul>
    
<li>Calcolare la probabilità di avere un determinato numero di visitatori sul proprio sito entro un'ora, conoscendo la media dei visitatori passati per ora. </li>

<li>Stimare il numero di incidenti d'auto a un incrocio sulla base dello storico passato.</li></ul>
    
<u>I parametri per utilizzare la formula di Poisson sono i seguenti:</u>
    
**x** = numero di eventi in un determinato intervallo
    
**λ** = il numero medio di eventi per intervallo (media)
    
<em><strong>e</strong></em> = numero di Eulero (costante uguale a 2,71828...)

<img src="https://andymath.com/wp-content/uploads/2019/03/PoissonProbability.jpg" alt="350" width="500" align="left"/>




## ESEMPIO 1: Call Center

Il numero di chiamate in arrivo ad un call center segue una distribuzione di Poisson a un tasso di **5** chiamate/ora. 

Qual'è la probabilità che arrivino esattamente **6** chiamate tra le 22 e le 23? (praticamente la probabilità di avere 6 chiamate in un ora piuttosto che 5)

In [2]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

In [3]:
#Let'use Scipy

import scipy.stats as stats

In [5]:
proba_6= stats.poisson.pmf(
         k=6,  #x -> 6 chiamate/ora
         mu=5) #mean(λ) 5 chiamate/ora

proba_6 #Abbiamo il 14.6% di probabilità di avere esattamente 6 chiamate/ora.

0.1462228081398754

## ESEMPIO 2: Ristorante

Un Ristorante riceve in media **100 clienti** al giorno. 

<u>Determina le seguenti probabilità:</u>

**P(X > 110 clienti in un determinato giorno)** ❓

**P(X > 120 clienti in un determinato giorno)** ❓

**P(X > 130 clienti in un determinato giorno)** ❓

In [6]:
proba_g_110= 1 - stats.poisson.cdf(k=110, mu=100) 

proba_g_110 

0.14713734844226967

In [8]:
proba_g_120= 1 - stats.poisson.cdf(k=120, mu=100) 

proba_g_120 

0.02266932907835273

In [10]:
proba_g_130= 1 - stats.poisson.cdf(k=130, mu=100) 

proba_g_130 

0.0017068403705013946

## ESEMPIO 3: Azienda di produzione

Il responsabile della produzione di un'azienda ha rilevato che, 
negli ultimi **100** giorni, si sono riscontrate **10** anomalie. 

<u>Qual è la probabilità di avere almeno **2** guasti nei 3 giorni successivi?</u>

<ul>

<li><strong>Abbiamo quindi una media di 0.1 guasti al giorno (10/100), che in 3 giorni è pari a una media di 0.3 guasti (0.1*3)</strong></li>
 
<li><strong><em> Quindi quello che stiamo cercando è P(X >= 2) in 3 giorni</em></strong></li>
    
</ul>



In [11]:
proba= 1 - stats.poisson.cdf(k=1, mu=0.3) #1(100%) - pmf(1)- pmf(0) --> cioè 1(100%) - cdf(1) 
proba

0.03693631311376677

In [12]:
#Stessa cosa usando pmf():

proba= 1 - stats.poisson.pmf(k=1, mu=0.3) - stats.poisson.pmf(k=0, mu=0.3)
proba

0.03693631311376677

## ESEMPIO 4: Number of Website Visitors per Hour

Website hosting companies use the Poisson distribution to model the number of expected visitors per hour that websites will receive.

For example, suppose a given website receives an average of **20** visitors per hour. 

<u>We can use the Poisson distribution calculator to find the probability that the website receives more than a certain number of visitors in a given hour:</u>

**P(X > 25 visitors)**❓ = 0.11218

**P(X > 30 visitors)**❓ = 0.01347

**P(X > 35 visitors)**❓ = 0.00080



In [13]:
proba_g_25= 1 - stats.poisson.cdf(k=25, mu=20) 

proba_g_25

0.1121849727179699

In [14]:
proba_g_30= 1 - stats.poisson.cdf(k=30, mu=20) 

proba_g_30 

0.01347468127992224

In [15]:
proba_g_35= 1 - stats.poisson.cdf(k=35, mu=20) 

proba_g_35

0.0008036599614044126

<img src="https://media.istockphoto.com/vectors/congratulations-greeting-sign-congrats-graduated-vector-id1148641884?k=20&m=1148641884&s=170667a&w=0&h=UZvEyiD5nxDJiLz5n0i1jdvWn-MR6wt1nomiPV1wSDE=" alt="400" width="500" align="left"/>