# Modelos probabilísticos para variáveis aleatórias discretas

Uma variável aleatória X é discreta se assume valores (x) que podem ser contados, ou seja, se houver um número finito ou contável de resultados possíveis que possam ser enumerados.

Os tipos de distribuição de probabilidade mais comuns para o caso em que X é uma variável aleatória discreta são:

- Uniforme discreta
- Bernoulli
- Geométrica
- Pascal ou Binomial negativa
- Hipergeométrica
- Polinomial ou multinomial
- Binomial
- Poisson

Neste material abordaremos as distribuições Binomial e Poisson.

## Distribuição Binomial

Considere um experimento aleatório consistindo em n tentativas independentes e a probabilidade de ocorrer sucesso em cada uma das n tentativas é sempre igual a p e de fracasso é q, onde p + q = 1. A probabilidade de sucesso e fracasso são as mesmas para cada tentativa.

**Definição**: Seja X o número de sucesso em n tentativas, então X pode assumir os valores 0, 1, 2,..., n. Nesta condição a v.a. X tem distribuição Binomial com parâmetro n e p, isto é, $X \sim B(n; p)$.
Considere que se $X \sim B(n; p)$, então a média e a variância de X são definidos por:

- Média de X: $E(X) = np$.
- Variância de X: $\sigma^2npq$, onde $q = 1 - p$.

A função de probabilidade da variável aleatória X  B(n; p) é dada por:

$$
P(X = x) = \binom{n}{x} p^x . (1-p)^{n-x}, x= 0, 1, 2, ..., n
$$

Onde $\binom{n}{x}$ representa o coeficiente binomial calculado por $\binom{n}{x}=\frac{n!}{x!(n-x)}$

## Distribuição Poisson

Consideremos as seguintes variáveis aleatórias:

    X1 = Número de chamadas recebidas por uma central telefônica durante um período de 30 minutos;
    X2 = Número de bactérias em um litro de água não-purificada;
    X3 = Número de partículas radiativas que, em um experimento de laboratório, entram em um contador durante um milissegundo;
    X4 = Número de acidentes com automóveis particulares em determinado trecho de estrada, no período de 12 horas.

Note-se que em todos esses exemplos a variável aleatória (X) consiste na contagem de eventos discretos que ocorrem em um meio contínuo (tempo, volume, área, etc.). Essas variáveis tomam os valores x= 0, 1, 2, ..., e seu comportamento pode ser descrito pela chamada distribuição de Poisson cuja função de probabilidade é:

$$
P(X = x) = \frac{e^{-\lambda}\lambda^x}{x!} \quad x = 0, 1, 2, ...
$$

Onde $\lambda > 0$ é o parâmetro da distribuição, sendo referido como a taxa de ocorrência, ou seja, o número médio de eventos ocorrendo no intervalo considerado. Utiliza-se a notação: $X \sim Po(\lambda)$.

Se X tiver distribuição de Poisson com parâmetro , então o valor esperado
e a variância são:

$$
E(X) = \lambda \\
Var(X)=\lambda
$$
Teorema: Seja X uma variável aleatória distribuída binomialmente com parâmetro p (baseado em n repetições de um experimento). Isto é:

$$
P(X=x) = \binom{n}{x} . p^x .(1-p)^{n-x}
$$

Admita-se que quando $n \rightarrow \infin$, $p \rightarrow 0$, de modo que $n.p \rightarrow \lambda$. Nessas condições teremos:

$$
\lim_{n \rightarrow \infin} P(X=x) =
\lim_{n \rightarrow \infin} \binom{n}{x} . p^x .(1-p)^{n-x} =
\frac{e^{-\lambda} \lambda^x}{x!}
$$

que é a distribuição de Poisson com parâmetro $\lambda$.

O Teorema acima diz, essencialmente, que poderemos obter uma aproximação das probabilidades binomiais com as probabilidades da distribuição Poisson, toda vez que n seja grande e p seja pequeno. Por esse motivo a distribuição Poisson também é chamada “distribuição dos eventos raros”.


## Exercício Binômial

In [None]:
from scipy.stats import poisson

In [None]:
x=8 # G3
media=6 # H3

In [None]:
# P(X=x)
poisson.pmf(x,media)
# dpois(x,media) # R
# =DIST.POISSON([x];[media];FALSO) # Excel

0.1032577335308442

In [None]:
# P(0<=X<=x)=P(X<=x)
poisson.cdf(x,media)
# ppois(x,media,lower.tail=TRUE) # R
# =DIST.POISSON([x];[media];VERDADEIRO) # Excel

0.8472374939845612

In [None]:
# P(0>X>x)=P(X>x)
poisson.sf(x,media)
# ppois(x,media,lower.tail=FALSE) # R
# =1-DIST.POISSON([x];[media];VERDADEIRO) # Excel

0.1527625060154388

In [None]:
# P(0>=X>=x)=P(X>=x)
poisson.sf(x-1,media)
# ppois(x,media,lower.tail=FALSE) # R
# =1-DIST.POISSON([x]-1;[media];VERDADEIRO) # Excel

0.256020239546283

In [None]:
# P(0<X<x)=P(X<x)
poisson.cdf(x-1,media)
# ppois(x,media,lower.tail=TRUE) # R
# =DIST.POISSON([x]-1;[media];VERDADEIRO) # Excel

0.743979760453717

## Exercício Poisson

In [1]:
from scipy.stats import binom

In [2]:
x=2 #B3
p=12 # C3: size
q=0.05 # D3: prob

In [3]:
# P(X=2)
binom.pmf(x,p,q)
# dbinom(x,p,q) # R
# =DISTR.BINOM([x];[p];[q];FALSO) # Excel

0.09879159497433242

In [4]:
# P(X<=2)
binom.cdf(x,p,q)
# pbinom(x,p,q,lower.tail=TRUE) # R
# =DISTR.BINOM([x];[p];[q];VERDADEIRO) # Excel

0.9804317380028454

In [5]:
# P(X>2)
binom.sf(x,p,q)
# pbinom(x,p,q,lower.tail=FALSE) # R
# =1-DISTR.BINOM([x];[p];[q];VERDADEIRO) # Excel

0.019568261997154543

In [6]:
# P(X>=2)
binom.sf(x-1,p,q)
# pbinom(x,p,q,lower.tail=FALSE) # R
# =1-DISTR.BINOM([x]-1;[p];[q];VERDADEIRO) # Excel

0.11835985697148706

In [7]:
# P(X<2)
binom.cdf(x-1,p,q)
# pbinom(x,p,q,lower.tail=TRUE) # R
# =DISTR.BINOM([x]-1;[p];[q];VERDADEIRO) # Excel

0.8816401430285129