# <font face="Verdana" size=6 color='#6495ED'> ANÁLISE ESTATÍSTICA DE DADOS
<font face="Verdana" size=3 color='#40E0D0'> Profa. Larissa Driemeier
<center><img src='https://drive.google.com/uc?export=view&id=1nW_7p_LyFhbR0ipjSekPcAj6kDoyK73R' width="800"></center>

Este notebook faz parte da aula 09 do curso IAD-001.

# Distribuições contínuas

As distribuições de probabilidade de variáveis aleatórias contínuas, conhecidas como funções densidade de probabilidade (PDF em inglês, de probability distribution functions), são as funções que assumem valores contínuos. A probabilidade de observar qualquer valor único é igual a $0$, pois uma variável aleatória $x$ pode assumir qualquer valor ao longo de um intervalo de números reais. Portanto, o número de valores que podem ser assumidos pela variável aleatória é infinito.


Então, a probabilidade de $x$ estar no conjunto de resultados $A$, i.é, $P(A)$ é definida como a área que abrange o intervalo $A$ sob uma curva. A curva que representa uma função densidade de probabilidade $f(x)$, deve satisfazer o seguinte:

1.   não possui valores negativos ($f(x)>0$ para todos os valores admissíveis de $x$)
2.   a área total sob a curva é igual a 1.


Ainda, todas as variáveis aleatórias (discretas e contínuas) têm uma função de distribuição cumulativa. É uma função que fornece a probabilidade de que a variável aleatória $x$ seja menor ou igual a $x=a$, para cada valor $a$. Para uma variável aleatória discreta, a função de distribuição cumulativa é encontrada pela soma das probabilidades, para a variável contínua, esse valor é encontrado pela integral da função de $ - \infty$ até $a$.

Alguns exemplos de distribuições de probabilidade contínuas são distribuição Uniforme, Normal, Exponencial, Gama, etc... Vamos tratar de cada uma delas a seguir.

Vamos nos preocupar também em gerar variáveis pseudo randômicas para cada distribuição. Para explorar mais o assunto, sugere-se o site [random — Generate pseudo-random numbers](https://docs.python.org/2/library/random.html).

In [None]:
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
import random
import pandas as pd

# para plotagem
import seaborn as sns
# settings: seaborn plotting style
sns.set_style("darkgrid")
sns.set(color_codes=True)
# settings: seaborn plot sizes
sns.set(rc={'figure.figsize':(8,8)})
colors=['skyblue','darkblue','darkred','darkolivegreen','darkmagenta']

# para Latex
from IPython.display import Math, Latex



## Distribuição Uniforme
A função densidade de probabilidade (em inglês PDF, de probability density function)  de uma distribuição uniforme é dada por:

\begin{equation}
p(x)= \begin{cases} \begin{split}
&\frac{1}{b-a} \qquad &\text{se } a \leq x \leq b \\
&0   \qquad &\text{se } x \leq a \text{ e } x\geq b \\
\end{split} \end{cases}
\end{equation}

sendo $x$ a variável aleatória.

![Uniforme](https://drive.google.com/uc?export=view&id=1Qsy5EYf9zINaL9aLjje7uCHkZKUIH4Da)




A característica dessa distribuição é que qualquer intervalo de números de largura igual tem uma probabilidade igual de ser observado.

A função

```
uniform.pdf(x,loc, scale)
```
gera o valor da função de distribuição $p(x)$. Veja que esse valor não é uma probabilidade. Dado que a variável é contínua uniforme entre o intervalo especificado por meio dos argumentos `loc` e `scale`, isto é, entre `loc` e `loc+scale`, então a probabilidade deve ser sempre dentro de um intervalo.
Porém, a função cumulativa

```
uniform.cdf(x,loc, scale)
```
gera a probabilidade da variável assumir valores até `loc+scale`.



In [None]:
# importe distribuição uniforme
from scipy.stats import uniform

In [None]:
# Parâmetros
a = 4
loc = 2
scale = 5

# Cálculos estatísticos
print(f'p(x={a}) vale: {uniform.pdf(a, loc=loc, scale=scale):.4f}')
print(f'P(x<{a}) vale: {uniform.cdf(a, loc=loc, scale=scale):.4f}')


intervalo = np.linspace(1, 8, 1000)
fig, ax = plt.subplots(figsize=(10, 6))

# Plotagem da distribuição uniforme
plt.plot(intervalo, uniform.pdf(intervalo, loc=loc, scale=scale),
         color='darkgreen', linewidth=3, alpha=0.6,
         label=f'Dist. Uniforme [loc={loc}, scale={scale}]')

# Destacar o ponto x=a
plt.axvline(x=a, color='darkolivegreen', linestyle='--', alpha=0.5)
plt.text(a+0.1, 0.02, f'x = {a}', color='darkolivegreen')

# Formatação do gráfico
ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('Densidade de probabilidade', fontsize=10)
ax.set_title('Distribuição Uniforme Contínua', fontsize=14)
ax.legend(fontsize=10)
ax.grid(True, alpha=0.3)

# Ajustar limites para melhor visualização
plt.xlim(loc-1, loc+scale+1)
plt.ylim(-0.01, 0.25)

plt.tight_layout()
plt.show()

### Exercício

Um jogo de azar é realizado da seguinte forma: um ponteiro é fixado no centro de um círculo. Girando o ponteiro, qual a probabilidade dele, quando parar, estar sinalizando um ângulo entre $30^o$ e $60^o$?


In [None]:
#Resposta
prob=uniform.cdf(60, loc = 0, scale = 360)-uniform.cdf(30, loc = 0, scale = 360)
print('A probabilidade do ponteiro estar entre 30 e 60 graus é: ','{:.2%}'.format(prob))


A função uniforme `uniform.rvs(size, loc, scale)` gera valores pseudo aleatórios de uma distribuição uniforme. O argumento `size` descreve o número de variáveis aleatórias a serem geradas. Se você deseja manter a repetibilidade, inclua um argumento `random_state` atribuído a um número. Existe também a opção `np.random.uniform(low, high=None, size=None)`. Importante ressaltar que usando o default `high=None`, valores são são gerados entre `[0, low)`. Se você deseja manter a repetibilidade, inclua um argumento `np.random.seed` atribuído a um número.Por exemplo,

```
np.random.seed = 42
np.random(2, size=10)
```

gera sempre os mesmos valores aleatórios (relacionados ao seed 42)  $0 \leq x <2$.

In [None]:
n = 100
start = 10
width = 20
data_uniform = uniform.rvs(size=n, loc = start, scale=width, random_state = 42)
data_uniform2 = np.random.uniform(start, start+width, n)
print(data_uniform)
print(data_uniform2)

In [None]:
ax = sns.histplot(data_uniform,
                  bins=10,
                  kde=True, #kernel density estimation (KDE) is a non-parametric way to estimate the probability density function (PDF) of a random variable
                  color='darkgreen'
                  )
ax.set(xlabel='Distribuição uniforme', ylabel='Frequencia');

In [None]:
np.random.seed(42)
print(np.random.uniform(low=2, size=5))

### Modelo randômico para geração de variáveis inteiras
Com a função `np.random.randint(low, high=None, size=None)` você também gera valores, porém inteiros, maiores ou iguais a `low` e menores que `high`(se definido). Se o default `high=None` é utilizado, valores são são gerados entre `[0, low)`.

Por exemplo,

`np.random.randint(2, size=10)`

gera 10 valores aleatórios entre 0 e 1. Outro exemplo: a função

`np.random.randint(5,10, size=(3,2))`

gera 3 eventos, cada um com 2 tentativas, de variáveis entre 5 e 9.


In [None]:
#Veja inicialmente como funciona
print(np.random.randint(2, size=10))
print(np.random.randint(5,10, size=(3,2)))

#### Exemplo

Utilize a função, `np.random.randint` para gerar um evento de lançamento de dois dados 1000 vezes. Plote a soma dos dados em cada evento.

In [None]:
# Resposta
evento_dados = np.sum(np.random.randint(1,7, size=(10000,2)),axis=1)
ax = sns.histplot(evento_dados, bins=np.linspace(1,13,13)-0.5,
                  kde=True, color='darkgreen')
ax.set(xlabel='Distribuição uniforme', ylabel='Frequencia');

### <font color='green'> Este é o seu exercício de Distribuição Uniforme</font>
<p style="font-family: Arial; font-size:1.4em">
<font color='green'>

Suponha que você esteja esperando pelo metrô. Você tem de zero a dez minutos para esperar. Sua probabilidade de ter que esperar qualquer número de minutos nesse intervalo é a mesma.

<font color='green'> Dada a história acima, construa os seguintes gráficos:
1. Qual é a probabilidade de você esperar de 4 a 6 minutos pelo trem?
2. Qual é a probabilidade de aparecer um trem depois de 5 minutos?
3. Qual é a probabilidade de não se esperar mais que 2,5 minutos para o próximo trem?
4. Qual é a probabilidade de se esperar mais de 2 minutos por um trem, dado que já passou 1 minuto sem aparecer?
5. Qual é a probabilidade de você esperar exatamente 1,375 minutos?


## Gauss

A distribuição normal, também conhecida como distribuição gaussiana, é onipresente na ciência de dados. Gauss fornece uma abordagem bastante conveninente para solucionar problemas de aprendizado de máquina supervisionados e não supervisionados.

Uma distribuição normal tem uma curva densidade de probabilidade em forma de sino, descrita por sua média $\mu$ e desvio padrão $\sigma$. A curva é simétrica, centrada em torno de sua média, variando de $ - \infty$ até $ + \infty$. Dados  próximos à média são mais frequentes na ocorrência do que os dados distantes da média e o nível dessa dispersão é definido pelo desvio padrão. Quase 68% dos dados estão a uma distância de $\pm \sigma$ e 95% em $\pm 2\sigma$, 99.7% em $\pm 3\sigma$, e assim por diante...

A função de distribuição de probabilidade de uma curva normal com média $\mu$ e desvio padrão $\sigma$ em um determinado ponto $x$ é dada por:

\begin{equation}
p(x)=\frac{1}{\sigma\sqrt(2\pi)}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}
\end{equation}




In [None]:
from scipy.stats import norm

In [None]:
## funçao de Gauss
def gaussian_f(x, m, v):
    out = np.zeros(x.shape)
    for i,xx in enumerate(x):
        out[i] = (1 / np.sqrt(2*np.pi*v)) * np.exp(-(xx- m)**2 / (2*v))
    return out
## previsão de um único dado
def gaussian(x, m, v):

    out = (1 / np.sqrt(2*np.pi*v)) * np.exp(-(x - m)**2 / (2*v))
    return out

In [None]:
# modelos possíveis

intervalo = np.arange(130, 180, 0.01)

plt.figure(figsize=(10,6))
plt.plot(intervalo, gaussian_f(intervalo, 155, 2**2), label='mu=155, var=4')
plt.plot(intervalo, gaussian_f(intervalo, 155, 10**2), label='mu=155, var=100')
plt.plot(intervalo, gaussian_f(intervalo, 150, 5**2), label='mu=150, var=25')
plt.plot(intervalo, gaussian_f(intervalo, 159, 5**2), label='mu=159, var=25')
plt.xlim([130,180])
plt.xlabel('altura')
plt.legend()
plt.show()

In [None]:
gaussian(150, 150, 5**2)

Uma das maneiras de definir a função densidade de probabilidade da função normal em Python é
```
norm.pdf(x, loc=0, scale=1))
```
onde agora, `loc` especifica a média (default=0) e `scale` especifica o desvio padrão (default=1). Novamente, essa função não define o valor da probabilidade. O valor é definido em intervalos. Uma maneira simples de encontrar a probabilidade de um intervalo é com a função que calcula a acumulada,


```
norm.cdf(x, loc=0, scale=1)
```

In [None]:
plt.figure(figsize=(10,6))
plt.plot(intervalo,  norm.pdf(intervalo, loc = 155, scale = 2), label='mu=155, var=4')
plt.plot(intervalo,  norm.pdf(intervalo, loc = 155, scale = 15), label='mu=156, var=100')
plt.plot(intervalo,  norm.pdf(intervalo, loc = 150, scale = 5), label='mu=150, var=25')
plt.plot(intervalo,  norm.pdf(intervalo, loc = 159, scale = 5), label='mu=159, var=25')
plt.xlim([130,180])
plt.xlabel('altura')
plt.legend()
plt.show()

In [None]:
norm.pdf(150, loc = 150, scale = 5)

Também vale mencionar que uma distribuição com média $0$ e desvio padrão $1$ é chamada distribuição normal padrão. O valor de $x$ normalizado é dado por:
\begin{equation}
z=\frac{x-\mu}{\sigma}
\end{equation}




### Exemplo com a variável padronizada $z$

Considerando a *distribuição normal padronizada*, calcule as seguintes probabilidades:

1.   $P\left( z \leq 2.62\right)=$
1.   $P\left( z \leq -1.45\right)=$
1.   $P\left( z > 1.45 \right)=$
2.   $P\left( -1.5 \leq z \leq 2.5\right)=$

Por último, calcule $s$ dado que,
5.   $P\left( z > s \right)= 0.0771$

Para o último item lembrem-se que `x=norm.ppf(0.99)` dá o valor de  `x`  para o qual a probabilidade acumulada é 99% de uma distribuição normal padronizada, ié, , `loc =0, scale = 1`.

In [None]:
#Resposta
#Item 1
prob = norm.cdf(2.62)
print('1. P(z<2.62)= ','{:.2%}'.format(prob))
#Item 2
prob = norm.cdf(-1.45)
print('2. P(z<-1.45)= ','{:.2%}'.format(prob))
#Item 3
#não precisaria fazer contas, como a curva é simétrica, P(z>1.45)=P(z<-1.45)
prob = 1.0 - norm.cdf(1.45) #=norm.cdf(-1.45)
print('3. P(z>1.45)= ','{:.2%}'.format(prob))
#Item 4
prob = norm.cdf(2.5)-norm.cdf(-1.5)
print('4. P(-1.5<z<2.5)= ','{:.2%}'.format(prob))
#Item 5
valor = norm.ppf(1.-0.0771)
print('5. s = ','{:03.2f}'.format(valor))

In [None]:
#Plot das curvas, para você visualizar as áreas
intervalo = np.arange(-4, 4, 0.001)
intervalo1 = np.arange(-4, 2.62, 0.001)
intervalo2 = np.arange(-4, -1.45, 0.001)
intervalo3 = np.arange(1.45, 4, 0.001)
intervalo4 = np.arange(-1.5, 2.5, 0.001)

#fig, ax = plt.subplots()
fig, (ax1, ax2, ax3, ax4) = plt.subplots(1,4,figsize=(20,5))

plt.style.use('fivethirtyeight')

#Item 01
sns.lineplot(x=intervalo, y=norm.pdf(intervalo), color='darkgreen', lw=5, alpha=0.6, label='P(z<2.62)', ax=ax1)
ax1.fill_between(intervalo1, norm.pdf(intervalo1), 0, alpha=0.3, color='darkgreen')

#Item 02
sns.lineplot(x=intervalo, y=norm.pdf(intervalo), color='darkgreen', lw=5, alpha=0.6, label='P(z<-1.45)', ax=ax2)
ax2.fill_between(intervalo2, norm.pdf(intervalo2), 0, alpha=0.3, color='darkgreen')

#Item 03
sns.lineplot(x=intervalo, y=norm.pdf(intervalo), color='darkgreen', lw=5, alpha=0.6, label='P(z>1.45)', ax=ax3)
ax3.fill_between(intervalo3, norm.pdf(intervalo3), 0, alpha=0.3, color='darkgreen')

#Item 04
sns.lineplot(x=intervalo, y=norm.pdf(intervalo), color='darkgreen', lw=5, alpha=0.6, label='P(-1.5<z<2.5)', ax=ax4)
ax4.fill_between(intervalo4, norm.pdf(intervalo4), 0, alpha=0.3, color='darkgreen');

### Exemplo sobre distribuição de Gauss

Seleciona-se, aleatoriamente, de uma certa universidade, um estudante do sexo masculino e mede-se o valor de sua altura $x$, em $cm$. Admitindo-se que nesta universidade os estudantes têm altura média de $160 cm$ com desvio padrão de $10 cm$,

1.   plote a curva da função densidade de probabilidade normal para este problema.
1.   qual a probabilidade do estudante sorteado ter altura superior a $175 cm$?
2.   qual a probabilidade do estudante sorteado ter menos de $180 cm$?
1.   qual a probabilidade do estudante sorteado ter entre $155$ e $170 cm$?
2.   qual a altura mínima dos $5\%$ mais altos da universidade?

Dica: trabalhe com a soma e subtração das acumuladas. Para o último item lembrem-se que `x=norm.ppf(0.95, loc =0, scale = 1)` dá o valor de $x$ para o qual a probabilidade acumulada é 95%.

In [None]:
# Resposta
mu_altura = 160.0
sigma_altura = 10.0
lim_inf = mu_altura - 4.0*sigma_altura; lim_sup = mu_altura + 4.0*sigma_altura
intervalo = np.arange(lim_inf, lim_sup, 0.001)
fig, ax = plt.subplots(1, 1)

#Item 01
sns.lineplot(x=intervalo, y=norm.pdf(intervalo, loc=mu_altura, scale = sigma_altura), color='darkgreen',
             lw=5, alpha=0.6, label=r'$\mu =$ '+str(mu_altura)+r', $\sigma_x$ = '+str(sigma_altura))
#Item 02
prob = 1.0 - norm.cdf(175, loc=mu_altura, scale = sigma_altura) #norm.sf(180, loc=mu_altura, scale = sigma_altura) dá o mesmo valor,ié, sf = 1-cdf
print('A probabilidade do estudante ter mais de 175cm é: ','{:.2%}'.format(prob))

#Item 03
prob=norm.cdf(180, loc=mu_altura, scale = sigma_altura)
print('A probabilidade estudante ter menos de 180 cm é: ','{:.2%}'.format(prob))

#Item 04
prob=norm.cdf(170, loc=mu_altura, scale = sigma_altura)-norm.cdf(155, loc=mu_altura, scale = sigma_altura)
print('A probabilidade estudante ter altura entre 170 e 155 cm é: ','{:.2%}'.format(prob))

#Item 05
altura=norm.ppf(0.95, loc=mu_altura, scale = sigma_altura)
print('A altura mínima dos  5%  mais altos da universidade é: ','{:03.2f}'.format(altura))


### Onde Gauss e Binomial se encontram


Um dado não viciado é lançado 1200 vezes. Qual é a probabilidade da face 4 ocorrer entre **195 e 210 vezes** (inclusive)?

#### Modelo Binomial (Solução Exata)
A distribuição binomial é o modelo exato para esse cenário:
- **n = 1200** tentativas independentes
- **p = 1/6** (probabilidade de sucesso em cada tentativa)

**Fórmula exata**:
$$
P(195 \leq X \leq 210) = \sum_{k=195}^{210} \binom{1200}{k} \left(\frac{1}{6}\right)^k \left(\frac{5}{6}\right)^{1200-k}
$$

In [None]:
from scipy.stats import binom

In [None]:
# Variáveis de entrada:
# Número de eventos independentes, n
n = 1200
# Probabilidade de sucesso de cada experimento, p
p = 1./6.
Y = binom(n,p)

In [None]:
sucessos = np.arange(195,211)
prob = 0.

prob = Y.cdf(210) - Y.cdf(194)  # P(195 ≤ X ≤ 210)
print('A probabilidade da face 4 ocorrer entre 195 e 210 vezes é: ','{:4.3f}'.format(prob))

#### Aproximação Normal (Gauss) para Distribuição Binomial

Quando temos:
- **n grande** (neste caso, n=1200 lançamentos)
- **p não muito próximo de 0 ou 1** (aqui, p=1/6 ≈ 0.1667)
- **np ≥ 10** e **n(1-p) ≥ 10** (200 e 1000 respectivamente)

Podemos aproximar a distribuição binomial por uma normal com:

$$
X \sim \text{Binomial}(n,p) \approx Y \sim \mathcal{N}(\mu=np, \sigma^2=np(1-p))
$$

Para transformar a variável discreta (binomial) em contínua (normal):

$$
P(195 \leq X \leq 210) \approx P(194.5 \leq Y \leq 210.5)
$$

A correção de continuidade ($\pm 0.5$) é aplicada quando aproximamos uma distribuição discreta (como a Binomial) por uma contínua (como a Normal). Essa técnica compensa a diferença fundamental entre como as duas distribuições tratam intervalos.

In [None]:
# Parâmetros
n = 1200
p = 1/6
mu = n * p
sigma = np.sqrt(n * p * (1 - p))

# Correção de continuidade: P(195 ≤ X ≤ 210) ≈ P(194.5 < Y < 210.5)
lower = 194.5
upper = 210.5

# Cálculo da probabilidade
prob = norm.cdf(upper, mu, sigma) - norm.cdf(lower, mu, sigma)
print('A probabilidade da face 4 ocorrer entre 195 e 210 vezes é: ','{:4.3f}'.format(prob))

Para o problema dado, a aproximação Gaussiana é prática para cálculos manuais ou $n$ muito grande. Já a Binomial é exata, mas computacionalmente intensiva.

### Onde Gauss e Poisson se encontram

O código abaixo visualiza como a distribuição de **Poisson** se aproxima da distribuição **Normal (Gaussiana)** à medida que o parâmetro $\lambda$ aumenta.

Você deve selembrar que a distribuição de Poisson modela o número de eventos que ocorrem em um intervalo fixo de tempo ou espaço, com uma taxa média $\lambda$. Ela é discreta e assimétrica para valores pequenos de $\lambda$.

Contudo, à medida que $\lambda$ aumenta, a Poisson tende a se tornar mais simétrica. Nesse limite, pode ser bem aproximada por uma distribuição Normal (contínua) com média $\mu = \lambda$  e desvio padrão $\sigma = \sqrt{\lambda}$.

Essa aproximação é válida para valores razoavelmente grandes de $\lambda$ (tipicamente, $\lambda$ ≥ 10), e é justificada pelo **Teorema Central do Limite**.

O código plota as distribuições de Poisson para diferentes valores de $\lambda$ e, para cada uma delas, sobrepõe a curva da Normal correspondente:

- **$\lambda$ = 1 ou 4**: a Poisson é assimétrica; a aproximação pela Normal é ruim.
- **$\lambda$ = 10**: a Poisson começa a se parecer com a Normal.
- **$\lambda$ = 30**: a Poisson se aproxima muito bem da Gaussiana — as curvas praticamente coincidem.

In [None]:
from scipy.stats import poisson

# Configuração dos parâmetros
lambdas = [1, 4, 10, 30]  # Valores de lambda
colors = ['blue', 'green', 'red', 'purple']  # Cores para cada curva

# Configuração do plot
plt.figure(figsize=(12, 8))

for idx, lam in enumerate(lambdas):
    # Cálculo da Poisson
    k = np.arange(0, 3 * lam)  # Intervalo de valores
    k = np.arange(0, 60)  # Intervalo de valores
    poisson_pmf = poisson.pmf(k, lam)  # Função massa de probabilidade

    # Gráfico da Poisson
    plt.bar(k, poisson_pmf, color=colors[idx], alpha=0.6,
            label=f'Poisson ($\lambda$={lam})', width=0.8)

    # Aproximação normal (Gaussiana)
    if lam >= 1:  # Aproximação válida para $\lambda$ grande
        mu = lam  # Média
        sigma = np.sqrt(lam)  # Desvio padrão
        x = np.linspace(mu - 4*sigma, mu + 4*sigma, 1000)
        gaussian_pdf = norm.pdf(x, mu, sigma)

        # Gráfico da Gaussiana
        plt.plot(x, gaussian_pdf, color=colors[idx], linestyle='--',
                linewidth=2, label=f'Normal (μ={mu}, σ={sigma:.1f})')


plt.title('Distribuição de Poisson e Aproximação Normal', fontsize=14)
plt.xlabel('Número de Eventos (k)', fontsize=12)
plt.ylabel('Probabilidade', fontsize=12)
plt.legend(fontsize=12)
plt.grid(True, linestyle='--', alpha=0.6)
plt.xticks(fontsize=12)
plt.yticks(fontsize=12)
plt.tight_layout()

plt.show()

### Exercício para treinar

Uma empresa produz televisores de 2 tipos, tipo A (comum) e tipo B (luxo), e garante a restituição da quantia paga se qualquer televisor apresentar defeito grave no prazo de seis meses.
O tempo para ocorrência de algum defeito grave nos televisores tem distribuição normal sendo que, no tipo A, com média de 10 meses e desvio padrão de 2 meses e no tipo B, com média de 11 meses e desvio padrão de 3 meses. Os televisores de tipo A e B são produzidos com lucro  de 1200 u.m. e 2100 u.m., respectivamente. Mas caso haja restituição, são produzidos com prejuízo de 2500 u.m. e 7000 u.m., respectivamente.


1.   Calcule as probabilidades de haver restituição nos televisores do tipo A e do tipo B.
2.   Calcule o lucro médio para os televisores do tipo A e para os televisores do tipo B.
3. Baseando-se nos lucros médios, a empresa deveria incentivar as vendas dos aparelhos do tipo A ou do tipo B?

In [None]:
# Parâmetros das distribuições
mu_A = 10.0
sigma_A = 2.0
Lucro_A = 1200
Prej_A = 2500

mu_B = 11.0
sigma_B = 3.0
Lucro_B = 2100
Prej_B = 7000


fig, ax = plt.subplots(figsize=(10, 6))

# Item 01

# Distribuição A
lim_inf_A = mu_A - 4.0*sigma_A
lim_sup_A = mu_A + 4.0*sigma_A
intervalo_A = np.arange(lim_inf_A, lim_sup_A, 0.001)

plt.plot(intervalo_A, norm.pdf(intervalo_A, loc=mu_A, scale=sigma_A),
         color='darkgreen', linewidth=3, alpha=0.6,
         label=f'A: μ={mu_A}, σ={sigma_A} (Lucro: R\${Lucro_A:.0f}, Prejuízo: R\${Prej_A:.0f})')

# Distribuição B
lim_inf_B = mu_B - 4.0*sigma_B
lim_sup_B = mu_B + 4.0*sigma_B
intervalo_B = np.arange(lim_inf_B, lim_sup_B, 0.001)
plt.plot(intervalo_B, norm.pdf(intervalo_B, loc=mu_B, scale=sigma_B),
         color='darkolivegreen', linewidth=3, alpha=0.6,
         label=f'B: μ={mu_B}, σ={sigma_B} (Lucro: R\${Lucro_B:.0f}, Prejuízo: R\${Prej_B:.0f})')

#
plt.title('Comparação das Distribuições Normais A e B', fontsize=14)
plt.xlabel('Valor', fontsize=10)
plt.ylabel('Densidade de Probabilidade', fontsize=10)
plt.legend(fontsize=10, frameon=True, shadow=True)
plt.grid(True, alpha=0.3)
plt.xlim(min(lim_inf_A, lim_inf_B), max(lim_sup_A, lim_sup_B))

plt.tight_layout()
plt.show()

A probabilidade de restituição é definida como,
$$
P(x) \leq 6
$$
onde $x$ é o número de meses para a televisão (A ou B) apresentar defeito grave. Se for menor que 6 meses, a empresa deve restituir o dinheiro.

In [None]:
# Item 1
lim = 6
P_A = norm.cdf(lim, loc=mu_A, scale = sigma_A)
print('A probabilidade de haver restituição nos televisores do tipo A é: ','{:.3%}'.format(P_A))
P_B = norm.cdf(lim, loc=mu_B, scale = sigma_B)
print('A probabilidade de haver restituição nos televisores do tipo B é: ','{:.3%}'.format(P_B))


O lucro médio dos televisores A e B são obtidos, restectivamente, através das equações:
$$
LucroMedio_A= Lucro_A \times P_A^C-Prej_A \times P_A
$$
$$
LucroMedio_B= Lucro_B \times P_B^C-Prej_B \times P_B
$$

In [None]:
# Item 2
P_Ac = 1.0 - P_A
LucroMedio_A = Lucro_A*P_Ac - Prej_A*P_A
print('O lucro médio dos televisores do tipo A é: ','{:6.2f}'.format(LucroMedio_A))

P_Bc = 1.0 - P_B
LucroMedio_B = Lucro_B*P_Bc - Prej_B*P_B
print('O lucro médio dos televisores do tipo B é: ','{:6.2f}'.format(LucroMedio_B))


In [None]:
# Item 3
if LucroMedio_A > LucroMedio_B:
  print('A empresa deveria incentivar as vendas dos aparelhos do tipo A, \n pois o lucro médio de A é maior que o lucro médio de B.')
else:
  print('A empresa deveria incentivar as vendas dos aparelhos do tipo B, \n pois o lucro médio de B é maior que o lucro médio de A.')


### Exercício com valores randômicos de variáveis normais

Vamos, agora, *fabricar* alguns dados de altura. Para isso, suponha que serão feitas *10000 pesquisas* com 10 medições em pessoas diferentes em cada pesquisa.
1.   Crie a sua pesquisa, com média 160cm e desvio padrão 10cm;
1.   Calcule a média e o desvio padrão da pesquisa (deve ser muito similar ao valor definido no item anterior);
2.   Plote, em um gráfico, a distribuição das médias das pesquisas e em outro gráfico os 100000 valores obtidos;
1.   Comente os resultados.

No código abaixo,
```
np.random.normal()
```
gera um número aleatório que é normalmente distribuído com uma média de $0$ e um desvio padrão de $1$.
Em seguida, multiplicamos por pelo desvio padrão para obter a volatilidade desejada e adicionamos a média para mudar a localização central.

Isto é,
*   Você pode mudar a média adicionando uma constante à sua variável aleatória distribuída normalmente (onde a constante é a média desejada). Ele altera a localização central da variável aleatória de 0 para qualquer número que você adicionou a ela.
*   Você pode modificar o desvio padrão da sua variável aleatória distribuída normalmente, multiplicando uma constante pela sua variável aleatória (onde a constante é o desvio padrão desejado).

In [None]:
z = np.random.normal()
print('A variável padronizada z vale:', z)
mu_altura = 160.0
sigma_altura = 10.0
print('A variável aleatória x vale:', mu_altura + z *sigma_altura)

Você pode atribuir à função variável aleatória uma média e um desvio padrão,

```
np.random.normal(loc=media, scale=dsv padrao, size=None)
```

mas colocamos manualmente a média e o desvio padrão da sua variável aleatória no item anterior somente para dar a você a intuição da variável padronizada $z$, conforme estudamos na teoria.

In [None]:
mu_altura = 160.0
sigma_altura = 10.0
x = np.random.normal(loc = mu_altura, scale = sigma_altura)
print('A variável padronizada x vale:', x)

Vamos usar diretamente a última opção:

In [None]:
mu_altura = 160.0
sigma_altura = 10.0
target = mu_altura
dados_altura = np.random.normal(loc = mu_altura, scale = sigma_altura, size=(1000,10))
print('Altura média:', round(np.mean(dados_altura),1), 'cm')
print('Desvio Padrão da altura:', round(np.var(dados_altura)**0.5,1), 'cm')
#caso você ainda tenha dúvidas sobre a saída dados_altura, substitua o valor 10000
# por 20 e veja explicitamente a matriz de saída tirando o comentáriod a linha abaixo
#print(dados_altura)

# Histograma que mostra a distribuição para a média de todas as pesquisas
fig, ax = plt.subplots(figsize=(12,8))
sns.histplot(np.mean(dados_altura,axis=1), kde=False, color = 'darkgreen', label='Altura')
ax.set_xlabel("Alturas em cm",fontsize=16)
ax.set_ylabel("Frequencia",fontsize=16)
plt.axvline(target, color='olivedrab', label='Média esperada')
plt.legend()
plt.tight_layout()
#
plt.axvline(round(np.mean(dados_altura),1), color='darkolivegreen', label='Média')
plt.legend()
plt.tight_layout()


### <font color='green'> Este é o seu exercício de Distribuição Normal</font>
<p style="font-family: Arial; font-size:1.4em">
<font color='green'>


Supondo que temos dois jogadores, Mário e Ana, e a habilidade de jogo de cada um deles é definida, respectivamente, por `MarSkill = 12.5` e `AnaSkill = 15`. Esses números parecem ser completamente arbitrários, e a escala na qual medimos a habilidade é de fato arbitrária. O que importa, no entanto, é como os valores das habilidades se comparam entre os jogadores. Atribuímos a Ana um maior valor de habilidade para indicar que ela é a jogadora mais forte. Mas agora nos deparamos com o primeiro de nossos desafios: o jogador mais forte em um jogo de videogame nem sempre é o vencedor. Se Ana e Fred jogassem muitos jogos um contra o outro, esperaríamos que Ana vencesse mais da metade deles, mas não necessariamente vencesse todos eles. Podemos capturar a variabilidade no resultado de um jogo, introduzindo a noção de *performance* para cada jogador, que expressa o quão bem eles jogaram um jogo específico. O jogador com maior performance para um jogo específico será o vencedor desse jogo. Um jogador com um alto nível de habilidade tenderá a ter uma alta performance, mas sua performance real variará de um jogo para outro. Considere a performance de Ana como `AnaPerf` e a performance de Mario por `MarPerf`, com variância constante e igual para os dois jogadores, $\sigma^2=5^2$
\begin{equation}
p(AnaPerf;15,5^2)=\frac{1}{5\sqrt(2\pi)}e^{-\frac{1}{2}\left(\frac{x-15}{5}\right)^2} \\
p(MarPerf;12.5,5^2)=\frac{1}{5\sqrt(2\pi)}e^{-\frac{1}{2}\left(\frac{x-12.5}{5}\right)^2}
\end{equation}
Agora temos que definir o vencedor do jogo. Para isso, usaremos uma variável binária `AnaVence`, que vale `True` se Ana for a vencedora e `False` se Mário for o vencedor. O valor dessa variável é determinado por qual das duas variáveis `AnaPerf` e `MarPerf` é maior - será `True` se `AnaPerf` for maior ou `False` caso contrário,
$$
P(AnaVence=T|AnaPerf,MarPerf)=\left\{
\begin{align} 1 &  & AnaPerf > MarPerf \\
0 & & \text{caso contrário}
\end{align}\right.
$$

<font color='green'> Dada a história acima, construa os seguintes gráficos:
1.   Construa as curvas de distribuição do desempenho de Ana e de Mário;
2.   Faça um gráfico desempenho de Ana versus desempenho de Mário e plote os valores obtidos em 1000 jogos. Coloque também uma linha dividindo a área em que a Ana da Área que o Mário vence (veja imagem abaixo);
3.   Se repetirmos o processo de amostragem muitas vezes, como fizemos no item anterior (1000 vezes), a fração de vezes que `AnaVence` for `True` fornece, aproximadamente, a probabilidade de Ana ganhar um jogo. Calcule essa probabilidade aproximada.
4.   O que acontece com a probabilidade do item anterior se o desempenho da Ana ou do Mário ficarem instáveis? Obs. mude a variância de cada um separadamente e analise a resposta.






</font> </p>
<font color='green'>
Essa atividade é uma simplificação do texto que você encontra [aqui](http://mbmlbook.com/TrueSkill_Modelling_the_outcome_of_games.html).




## Distribuição gaussiana multivariada

No centro de toda teoria está a distribuição gaussiana multivariada. É uma generalização multidimensional da distribuição normal unidimensional que acabamos de ver.

O método usa o fato de que quaisquer $n$-observações, $(x_1,…, x_n)$, em um conjunto de dados, são pontos amostrados de uma distribuição Gaussiana de $n$-variáveis.

Representa a distribuição de uma variável aleatória multivariada composta de várias variáveis aleatórias que podem ser correlacionadas entre si. A distribuição normal multivariável é dada por

\begin{equation}
p\left(\boldsymbol{x}; \boldsymbol{\mu}, \boldsymbol{\Sigma} \right)=\frac{1}{\left(2\pi \right)^{n/2} \left|\boldsymbol{\Sigma}\right|^{1/2}}  e^{-\frac{1}{2} \left(\boldsymbol{x} - \boldsymbol{\mu}\right)\boldsymbol{\Sigma}^{-1} \left(\boldsymbol{x} - \boldsymbol{\mu}\right)^T}
\end{equation}

 $\boldsymbol{x}$ é um vetor de dimensão $n$

 $\boldsymbol{\mu}$ vetor com as médias, $n\times 1$

 $\boldsymbol{\Sigma}$ é a matriz de covariância, $n \times  n$

 $\left|\boldsymbol{\Sigma}\right|$ é o determinante de $\boldsymbol{\Sigma}$

Dessa forma, tem-se que $N \approx \left( \boldsymbol{\mu}, \boldsymbol{\Sigma}\right)$.

In [None]:
from __future__ import division
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d.axes3d import Axes3D
from matplotlib import cm

A função

```
multivariate_normal.pdf(x, mean, cov)
```

retorna a função $p\left( \mathbf{x};\mathbf{\mu},\mathbf{\sum}\right)$. As entradas são: vetor de médias `mean` $\mathbf{\mu}$ e matriz de covariância `cov` $\mathbf{\sum}$.

Pode-se também *congelar* a função, com média e variância fixa com a função

```
rv = multivariate_normal(mean, cov)
```
e o objeto pode ser chamado como função com os mesmos métodos, por exemplo,

```
rv.pdf(x)
```

A seguir, um exemplo. As informações foram resumidas do link [Scipy Multivariate Normal](https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.multivariate_normal.html)




In [None]:
from scipy.stats import multivariate_normal
from matplotlib import cm
from mpl_toolkits.mplot3d import Axes3D

In [None]:
# Parâmetros da distribuição normal multivariada
mu = np.array([1.5, -1.0])
Sigma = np.array([[1.0, 0], [0, 1.0]])

# Intervalo e resolução da malha
lim_inf, lim_sup = -4, 4
N = 120
x1 = np.linspace(lim_inf, lim_sup, N)
x2 = np.linspace(lim_inf, lim_sup, N)
x1, x2 = np.meshgrid(x1, x2)

# Array de posições (x1, x2)
pos = np.empty(x1.shape + (2,))
pos[:, :, 0] = x1
pos[:, :, 1] = x2

# Distribuição e amostragem
rv = multivariate_normal(mu, Sigma)
samples_x1, samples_x2 = np.random.multivariate_normal(mu, Sigma, 3000).T

# Criando figura com 3 subplots lado a lado
fig = plt.figure(figsize=(18, 5))

# Contorno
ax1 = fig.add_subplot(1, 3, 1)
cp = ax1.contourf(x1, x2, rv.pdf(pos), cmap=cm.viridis)
fig.colorbar(cp, ax=ax1, shrink=0.8)
ax1.set_xlabel(r'$x_1$')
ax1.set_ylabel(r'$x_2$')
ax1.set_title("Contorno da Densidade")
ax1.axis('equal')

# Superfície 3D
ax2 = fig.add_subplot(1, 3, 2, projection='3d')
surf = ax2.plot_surface(x1, x2, rv.pdf(pos), rstride=3, cstride=3, linewidth=0.5,
                        antialiased=True, cmap=cm.viridis)
ax2.contourf(x1, x2, rv.pdf(pos), zdir='z', offset=-0.2, cmap=cm.viridis)
ax2.set_zlim(-0.2, 0.2)
ax2.set_zticks(np.linspace(0, 0.2, 5))
ax2.view_init(elev=27, azim=-115)
ax2.set_xlabel(r'$x_1$')
ax2.set_ylabel(r'$x_2$')
ax2.set_title("Superfície da Densidade")

# Dispersão
ax3 = fig.add_subplot(1, 3, 3)
ax3.plot(samples_x1, samples_x2, 'o', markersize=3, alpha=0.2, color='darkblue')
ax3.set_xlim(lim_inf, lim_sup)
ax3.set_ylim(lim_inf, lim_sup)
ax3.set_xlabel(r'$x_1$')
ax3.set_ylabel(r'$x_2$')
ax3.set_title("Dispersão dos Pontos Amostrados")
ax3.grid(True)

plt.tight_layout()
plt.show()


## Distribuição Exponencial

A distribuição exponencial descreve o tempo entre os eventos em um processo de ponto de Poisson, isto é, um processo no qual os eventos ocorrem de forma contínua e independente a uma taxa média constante. Possui um parâmetro $\lambda$ chamado parâmetro de taxa e sua equação é descrita como:
\begin{equation}
p \left( x;\lambda \right)=\begin{cases}  
\begin{split}
&\lambda e^{-\lambda x} \qquad & \text{se } x \geq 0 \\
&0   \qquad                    & \text{se } x<0
\end{split}
\end{cases}
\end{equation}

A distribuição pode ser gerada através da função
```
expon.pdf(x,scale=beta,loc=0)
```
do módulo `scipy.stats`, que usa o parâmetro $\beta$ `scale`, que é $1/\lambda$ (ou a média) como argumento. Para deslocar a distribuição, use o argumento `loc`, `size` define o número de variáveis aleatórias na distribuição.

Lembre-se que as distribuições contínuas,
*   PDF: Probability Density Function, retorna a função de probabilidade de um determinado resultado contínuo.
*   CDF: Cumulative Distribution Function, retorna a probabilidade de um valor menor ou igual a um determinado resultado.
*   PPF: Percent-Point Function, retorna um valor que é menor ou igual à probabilidade fornecida.

In [None]:
from scipy.stats import expon
from scipy.stats import poisson

Veja, abaixo, a função densidade de probabilidade foi calculada de duas maneiras: usando explicitamente a sua definição,
```
data1 = lambd*np.exp(-lambd*x)
```
e usando a função expon.pdf,
```
data2 = expon.pdf(x,scale=beta)
```
Veja que na definição original usamos a taxa $\lambda$, enquanto que, para a função, o valor dado para scale foi $\beta = \frac{1}{\lambda}$.
Atenção, errar na definição correta do parâmetro da distribuição exponencial é bastante comum, e muitos exemplos na internet estão errados, por causa desta confusão.

In [None]:
# Parâmetros
lambd = 0.5
beta = 1 / lambd  # Parâmetro 'scale' da scipy.stats.expon
x = np.arange(0, 15, 0.1)

# Densidade pela definição
data1 = lambd * np.exp(-lambd * x)

# Densidade usando scipy
data2 = expon.pdf(x, scale=beta)

#
plt.plot(x, data1, 'o', label='Definição', color = 'darkolivegreen', alpha=0.6)
plt.plot(x, data2, label='biblioteca scipy', color = 'darkgreen', linewidth=2)
plt.xlabel('x')
plt.ylabel('f(x)')
plt.title('Distribuição Exponencial (λ = 0.5)')
plt.legend()
plt.grid(True)
plt.show()

In [None]:
# Valores de lambda e cores correspondentes
lambdas = [0.5, 1.0, 2.0, 4.0]
colors = ['red', 'green', 'blue', 'orange']

# Plotagem de cada curva exponencial
x = np.linspace(0, 5, 200)
lambdas = [0.5, 1.0, 2.0, 4.0]
colors = ['red', 'green', 'blue', 'orange']

# Plotagem de cada curva exponencial
for lambd, color in zip(lambdas, colors):
    y = lambd * np.exp(-lambd * x)  # f(x) = lamb e^(-λx)
    plt.plot(x, y, color=color, linewidth=2, label=r'$\lambda$ = '+str(lambd))


plt.xlabel('$x$')
plt.ylabel('$f(x) = \lambda e^{-\lambda x}$')
plt.title('Distribuição exponencial para diferentes valores de $\lambda$')
plt.legend(loc='upper right')
plt.grid(True)
plt.xlim(0, 5)
plt.ylim(0, max(lambdas))

plt.show()

### Exemplo: peça de computador
Em média, uma determinada peça do computador dura dez anos. O período de duração da peça do computador é distribuído exponencialmente.

1.   Desenhe a curva exponencial que modela o problema.
2.   Qual é a probabilidade de uma peça de computador durar mais de 7 anos?
3.   Quanto durará 80% das peças do computador?
4.   Qual é a probabilidade de uma peça de computador durar entre nove e 11 anos?

In [None]:
# Parâmetros
intervalo = np.linspace(0, 50, 100)
mu = 10
beta = mu  # Parâmetro de escala


fig, ax = plt.subplots(figsize=(10, 6))

# Item 01: Curva exponencial
plt.plot(intervalo, expon.pdf(intervalo, scale=beta, loc=0),
         color='darkgreen', linewidth=3, alpha=0.7,
         label=f'Distribuição Exponencial (μ={mu}, λ={1/beta:.1f})')

# Cálculos estatísticos
# Item 02: P(x > 7)
prob_maior_7 = 1. - expon.cdf(7, scale=beta, loc=0)
print(f'\nA probabilidade de durar mais de 7 anos é: {prob_maior_7:.2%}')

# Item 03: P(x < n) = 80%
tempo_80_percentil = expon.ppf(0.80, scale=beta, loc=0)
print(f'80% dos componentes durarão no máximo: {tempo_80_percentil:.2f} anos')

# Item 04: P(9 < x < 11)
prob_entre_9_11 = expon.cdf(11, scale=beta, loc=0) - expon.cdf(9, scale=beta, loc=0)
print(f'A probabilidade de durar entre 9 e 11 anos é: {prob_entre_9_11:.2%}\n')

# Áreas
plt.fill_between(intervalo[intervalo > 7], expon.pdf(intervalo[intervalo > 7], scale=beta),
                 color='olive', alpha=0.2, label='P(x > 7)')
plt.fill_between(intervalo[(intervalo >= 9) & (intervalo <= 11)],
                 expon.pdf(intervalo[(intervalo >= 9) & (intervalo <= 11)], scale=beta),
                 color='darkgreen', alpha=0.3, label='P(9 < x < 11)')

# Linha do percentil 80
plt.axvline(tempo_80_percentil, color='teal', linestyle='--', alpha=0.5)
plt.text(tempo_80_percentil+1, 0.02, f'80° percentil\n({tempo_80_percentil:.1f} anos)',
         color='teal')



ax.set_xlabel('Tempo (anos)', fontsize=12)
ax.set_ylabel('Densidade de probabilidade', fontsize=12)
ax.set_title('Distribuição Exponencial - Tempo de Vida de Componentes', fontsize=14)
ax.legend(fontsize=10)
ax.grid(True, alpha=0.3)
plt.xlim(0, 30)  # Ajuste do limite para melhor visualização

plt.tight_layout()
plt.show()

### Exercício call center

Em um call center, as chamadas chegam a uma taxa média de quatro chamadas por minuto. Suponha que o tempo decorrido de uma chamada para a próxima tenha a distribuição exponencial.

1.   Encontre o tempo médio entre duas chamadas sucessivas.
2.   Encontre a probabilidade de que, após uma chamada ser recebida, a próxima chamada ocorra em menos de dez segundos.
1.  Encontre a probabilidade de que exatamente cinco chamadas ocorram em um minuto.
2.   Encontre a probabilidade de ocorrer menos de cinco chamadas em um minuto.
2.   Encontre a probabilidade de ocorrer mais de 40 chamadas em um período de oito minutos.


OBS.: Estamos preocupados apenas com a taxa em que as chamadas são recebidas e estamos ignorando o tempo gasto no telefone.

Também devemos assumir que o tempo gasto entre as chamadas é independente. Isso significa que um atraso particularmente longo entre duas chamadas não significa que haverá um período de espera mais curto para a próxima chamada. Podemos então deduzir que o número total de chamadas recebidas durante um período de tempo tenha a distribuição Poisson.

In [None]:
#Resposta
intervalo=np.linspace(0,50,100)
mu = 4. #chamadas por minuto
beta = 1./mu
#Item 01
print('O tempo médio entre duas chamadas sucessivas (em minutos): ','{:03.2f}'.format(beta))
# Item 02 P(x<10)
prob = expon.cdf(10/60,scale=beta,loc=0)
print('A probabilidade da próxima chamada ocorrer em menos de 10s é: ','{:.2%}'.format(prob))
# Item 03 P(x=5) - lembre-se que, para usar a distribuição de Poisson, você deve multiplicar lambda pelo número de períodos da análise
prob = poisson.pmf(5,mu*1.0)
print('A probabilidade de exatamente cinco chamadas ocorram em um minuto é: ','{:.2%}'.format(prob))
# Item 04 P(x<5)
prob = poisson.cdf(4,mu*1.0)
print('A probabilidade de que menos de cinco chamadas ocorram em um minuto é: ','{:.2%}'.format(prob))
# Item 05 P(x<5)
prob = 1. - poisson.cdf(40,mu*8.0)
print('A probabilidade de que mais de 40 chamadas ocorram em um minuto é: ','{:.2%}'.format(prob))

### Exemplo diferenciando Exponencial e Poisson

Se você recebe, em média, 90 acessos por hora em seu site, responda:

1.   Qual é a probabilidade de se passarem 4 minutos sem nenhum acesso?
1.   Qual é a probabilidade de se esperar entre 1 e 2 minutos para o próximo acesso?
1.   Qual é a probabilidade de não se esperar mais que 2,5 minutos para o próximo acesso?
1.   Qual é a probabilidade de se esperar mais de 2 minutos por um acesso, dado que já passou 1 minuto sem acesso?
2.   Qual é a probabilidade de haver exatamente 3 acessos ao site no período de um minuto? (Variável discreta, Poisson)
2.   Qual é a probabilidade de haver no máximo 3 acessos no site no período de um minuto? (Variável discreta, Poisson)
2.   Qual é a probabilidade de haver exatamente 1 acesso no site em um período de 1 minuto e, no máximo, 3 acessos no próximo minuto? (Variável discreta, Poisson)


</font> </p>




In [None]:
intervalo=np.linspace(0,50,100)
lambd = 90./60 #acessos por minuto
beta = 1./lambd
#Item 01
prob = 1. - expon.cdf(4,scale=beta,loc=0)
print('1. A probabilidade de se passarem 4 minutos sem nenhum acesso: ','{:.2%}'.format(prob))
#Item 02
prob = expon.cdf(2,scale=beta,loc=0) - expon.cdf(1,scale=beta,loc=0)
print('2. A probabilidade de se esperar entre 1 e 2 minutos para o próximo acesso: ','{:.2%}'.format(prob))
# Item 03
prob = expon.cdf(2.5,scale=beta,loc=0)
print('3. A probabilidade de não se esperar mais que 2,5 minutos para o próximo acesso: ','{:.2%}'.format(prob))
# Item 04 #memoryless
#Por não ter memória, precisamos avaliar apenas o segundo minuto e não o primeiro.
prob = 1. - expon.cdf(1.,scale=beta,loc=0)
print('4. A probabilidade de se esperar mais de 2 minutos por um acesso, dado que já passou 1 minuto sem acesso: ','{:.2%}'.format(prob))
# Item 05 #Poisson
prob = poisson.pmf(3,lambd*1.0)
print('5. A probabilidade de haver exatamente 3 acessos ao site no período de um minuto: ','{:.2%}'.format(prob))
# Item 06
prob6 = poisson.pmf(0,lambd*1.0)+poisson.pmf(1,lambd*1.0)+poisson.pmf(2,lambd*1.0)+poisson.pmf(3,lambd*1.0)
print('6. A probabilidade de haver no máximo 3 acessos no site no período de um minuto: ','{:.2%}'.format(prob6))
# Item 07 #eventos independentes
prob = poisson.pmf(1,lambd*1.0)*prob6
print('7. A probabilidade de haver exatamente 1 acesso no site em um período de 1 minuto e, no máximo, 3 acessos no próximo minuto: ','{:.2%}'.format(prob))



Você pode gerar uma variável aleatória distribuída exponencialmente usando o método
```
expon.rvs()
```
do módulo `scipy.stats`, que usa o parâmetro $\beta$ `scale`, que é $1/\lambda$ (ou a média) como argumento. Para deslocar a distribuição, use o argumento `loc`, `size` define o número de variáveis aleatórias na distribuição.


In [None]:
# Gerando dados para a distribuição exponencial
data_expon = expon.rvs(scale=1, loc=0, size=1000)

sns.histplot(data_expon, kde=False, bins=100, color='darkgreen', linewidth=0.5, alpha=0.8)
plt.xlabel('Distribuição Exponencial')
plt.ylabel('Frequência')
plt.show()

<font color='green'>
### Este é o seu exercício de Distribuição de Exponencial</font>
<p style="font-family: Arial; font-size:1.4em">
<font color='green'>

<font color='green'> Neste exercício,você irá modelar o **valor do trocado em reais** que as pessoas têm no bolso, assumindo que esse valor segue uma **distribuição exponencial** com média de **R\$ 8,00**.

<font color='green'>O objetivo é:

1. <font color='green'>Simular uma amostra de 1000 valores de trocado;
2. <font color='green'>Calcular estatísticas descritivas (média, mediana, desvio padrão);
3. <font color='green'> Visualizar os dados simulados e a distribuição teórica Exponencial;
4. <font color='green'>Estimar quantas pessoas teriam menos de R\$ 5,00.
5. <font color='green'>Estimar quantas pessoas teriam trocado para uma pequena doação de R\$ 10,00.

In [None]:
# Exemplo: Distribuição do valor do trocado em reais na população

# Parâmetros (supondo uma média de R$ 8,00 de trocado por pessoa)
lambda_troco = 1/8  # Taxa = 1/média
media_troco = 8      # R$ 8,00

# 1. Geração de uma amostra de 1000 valores
np.random.seed(42)  # Para reproduzibilidade
dados_troco = expon.rvs(scale=media_troco, size=1000)

# 2. Análise descritiva
print(f"Média observada: R$ {np.mean(dados_troco):.2f}")
print(f"Mediana observada: R$ {np.median(dados_troco):.2f}")
print(f"Desvio padrão: R$ {np.std(dados_troco):.2f}")

# 3. Visualização
# Gráfico dos dados
plt.figure(figsize=(10, 6))
plt.hist(dados_troco, bins=30, density=True, alpha=0.7, color='yellowgreen',
         label='Dados simulados')

# Gráfico da distribuição Exponencial
x = np.linspace(0, 40, 400)
plt.plot(x, expon.pdf(x, scale=media_troco), color='darkgreen', lw=2,
         label=f'Distribuição Exponencial (λ={lambda_troco:.2f})')

# 4,5. Estimativa de P<5 e P>10:
troco_menos = 5
prob5 = expon.cdf(troco_menos, scale=media_troco, loc=0)
troco_mais = 10
prob10 = 1. - expon.cdf(troco_mais, scale=media_troco, loc=0)
print(f'4. A probabilidade das pessoas terem menos de {troco_menos:4d}: {prob5:.2%}')
print(f'5. A probabilidade das pessoas terem mais de {troco_mais:4d}: {prob10:.2%}')

plt.axvline(troco_menos, color='steelblue', linestyle='--', alpha=0.7, label = f'Trocado < {troco_menos:.2f}')
plt.axvline(troco_mais, color='cadetblue', linestyle='--', alpha=0.7, label = f'Trocado > {troco_mais:.2f}')

plt.fill_between(x[x<=troco_menos], expon.pdf(x[x<=troco_menos], scale=media_troco),
                 color='steelblue', alpha=0.4)
plt.fill_between(x[x>=troco_mais], expon.pdf(x[x>=troco_mais], scale=media_troco),
                 color='cadetblue', alpha=0.4)

plt.xlabel('Valor do Troco (R$)', fontsize=10)
plt.ylabel('Densidade de Probabilidade', fontsize=10)
plt.legend()
plt.grid(True, alpha=0.3)
plt.xlim(0, 40)
plt.show()

Veja que este modelo reflete uma realidade onde muitas pessoas têm poucas moedas (valores próximos de zero) e poucas pessoas acumulam trocoados maiores no bolso. A probabilidade de ter um determinado valor diminui exponencialmente conforme este aumenta.

## Distribuição Gama

A distribuição Gama é uma generalização da distribuição Exponencial e também é contínua. Ela é usada para modelar o tempo/espaço até que ocorram $k$ eventos em um processo de Poisson, sendo

$$
X = X_1 + X_2 + \cdots + X_k
$$

onde $X_i$ são variáveis aleatórias exponenciais independentes e identicamente distribuídas. A soma não resulta em uma distribuição Exponencial, mas sim em uma distribuição Gama:

$$
X \sim \text{Gama}(\alpha,\beta)
$$

Dessa forma, a variável aleatória $X$ segue uma distribuição Gama com parâmetros $\alpha > 0$ (conhecido como parâmetro de forma e, na prática, é o próprio $k$) e $\beta = \lambda > 0$ (parâmetro de escala). Sua função densidade de probabilidade é dada por:

$$
f(t;\alpha,\beta) = \left\{
\begin{matrix}
\frac{\beta^\alpha}{\Gamma(\alpha)} t^{\alpha - 1} e^{-\beta t} & t > 0\\
0 & \text{caso contrário}
\end{matrix}
\right.
$$

onde $ \Gamma(\alpha) $ é a função gama, definida como:

$$
\Gamma(\alpha) = \int_0^\infty t^{\alpha - 1} e^{-t} \, dt, \quad \text{para } \alpha > 0
$$

Se $ \alpha \in \mathbb{N} $, então a função gama satisfaz:

$$
\Gamma(\alpha) = (\alpha - 1)!
$$

O valor esperado da distribuição é $ \mathbb{E}[X] = \frac{\alpha}{\beta} $ e a variância é $ \mathbb{V}ar(X) = \frac{\alpha}{\beta^2} $.

Além disso, a função de distribuição acumulada é dada por:

$$
F(t^*;\alpha,\beta) = \frac{\gamma(\alpha, \beta t^*)}{\Gamma(\alpha)}
$$

onde $ \gamma(\alpha, \beta t^*) $ é a função gama incompleta inferior, definida como:

$$
\gamma(\alpha, \beta t^*) = \int_0^{\beta t^*} t^{\alpha-1} e^{-t} \, dt
$$

O valor esperado é $\frac{\alpha}{\beta}$ e a variância é $\frac{\alpha}{\beta^2}$.

Para usar `scipy.stats.gamma.pdf(x, a, loc, scale)` deve-se definir a variável $\alpha$ como `a` e `scale = 1/beta`.

A função `gamma` importada de `scipy.special` (com nome `gamma_func` pra evitar confusão) calcula a função Gama matemática, que é uma generalização do fatorial para números reais e complexos. É essencial para trabalhar com distribuições Gama.
$$ \Gamma(\alpha) = \int_0^\infty t^{\alpha-1} e^{-t} dt$$
que, na prática é $(\alpha-1)!$ para $\alpha \in \mathbb{N}$.

A função Gama incompleta inferior usando o SciPy é obtida através da função `gammainc` do módulo `scipy.special`. Veja que ela vem normalizada,
$$
\gamma(\alpha, x) = \frac{1}{\Gamma(\alpha)}\int_0^x t^{\alpha-1} e^{-t} \, dt
$$

Para calcular somente a gama incompleta não normalizada,


```
from scipy.integrate import quad
def gama_incompleta_nao_normalizada(a, x):
    # Define a função integranda: t^(a-1) * e^(-t)
    integranda = lambda t: t**(a-1) * np.exp(-t)
    
    # Calcula a integral de 0 até x
    resultado, erro = quad(integranda, 0, x)
    
    return resultado
```

In [None]:
from scipy.stats import gamma
from scipy.special import gammainc
from scipy.special import gamma as gamma_func
from scipy.integrate import quad
def gama_incompleta_nao_normalizada(a, x):
    # Define a função integranda: t^(a-1) * e^(-t)
    integrando = lambda t: t**(a-1) * np.exp(-t)

    # Calcula a integral de 0 até x
    resultado, erro = quad(integrando, 0, x)

    return resultado

In [None]:
# Gráfico variando alpha (beta fixo)
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 6))  # Gráficos lado a lado

x = np.linspace(0, 5, 1000)
beta = 2.0
alphas = [1.0, 2.0, 3.0, 5.0]

for alpha in alphas:
    ax1.plot(x, gamma.pdf(x, a=alpha, scale=1/beta), label=f'α = {alpha}, β = {beta}')

ax1.set_xlabel(r'$t$', fontsize=12)
ax1.set_ylabel('Densidade de Probabilidade', fontsize=12)
ax1.legend()
ax1.set_title('Distribuição Gama: Variação de α (β fixo)', fontsize=14)

# Gráfico variando beta (alpha fixo)
alpha = 2.0
betas = [1.0, 1.5, 5.0, 10.0]

for beta in betas:
    ax2.plot(x, gamma.pdf(x, a=alpha, scale=1/beta), label=f'α = {alpha}, β = {beta}')

ax2.set_xlabel(r'$t$', fontsize=12)
ax2.set_ylabel('Densidade de Probabilidade', fontsize=12)
ax2.legend()
ax2.set_title('Distribuição Gama: Variação de β (α fixo)', fontsize=14)

plt.tight_layout()
plt.show()

In [None]:
x = np.linspace(0, 20, 200)
y1 = gamma.pdf(x, a=3, loc=0, scale=1)  # a é alpha, scale é beta
plt.plot(x, y1, "-", color='cadetblue', label=(r'$\alpha=3, \beta=1$'))
y1 = gamma.pdf(x, a=3, loc=0, scale=4)
plt.plot(x, y1, "-", color='indigo', label=(r'$\alpha=3, \beta=4$'))
plt.legend()
plt.show()

### Exemplo:

Carros chegam a um cruzamento a uma taxa, em média, de um a cada dois minutos. Seja $X$ o tempo de espera até que cinco carros passem.

1. Modele o problema com a função Gama e calcule a probabilidade de esperar até 8 minutos usando a fórmula: $$
F(t^*;\alpha,\beta) = \frac{\gamma(\alpha, \beta t^*)}{\Gamma(\alpha)}
$$
2. Qual é a probabilidade de espera de até 8, 10, 15 minutos para passagem de 5 carros?
3. Qual é a probabilidade de espera de mais de 7 minutos para o evento?
4. Plote a distribuição Gama do problema.

In [None]:
# Parâmetros do problema
taxa_chegada = 0.5  # 1 carro a cada 2 minutos (lambda = 0.5 carros/minuto)
alpha = 5           # Número de carros desejados (alpha = k)
beta = 1/taxa_chegada  # Parâmetro de escala (beta = 1/lambda)


print(f"Parâmetros da Gama: alpha (shape) = {alpha}, beta (scale) = {beta:.1f} minutos")

In [None]:
# Item 1, usando a fórmula
t = 8

# função densidade de probabilidade da Gama
scale =  beta

# cria um vetor de tempos
t_vals = np.linspace(0, 20, 500)
pdf_vals = gamma.pdf(t_vals, a=alpha, scale=beta)


# calcula a probabilidade de esperar menos de t minutos
# cuidado: no scipy.special.gammainc, o usa-se 1/beta
probabilidade = gammainc(alpha, t/beta)
probabilidade2 = gama_incompleta_nao_normalizada(alpha, t/beta)/gamma_func(alpha)

print(f"A probabilidade de esperar menos de {t} minutos é: {probabilidade:.4f}")
print(f"A probabilidade de esperar menos de {t} minutos é: {probabilidade2:.4f}")

# Gráfico
plt.figure(figsize=(8,5))
plt.plot(t_vals, pdf_vals, label='Distribuição Gama (α=5, β=0.5)', color='darkolivegreen')
plt.fill_between(t_vals, 0, pdf_vals, where=(t_vals <= t), color='yellowgreen', alpha=0.5, label=f'Área até t = {t} min ({probabilidade:.2%})')
plt.axvline(t, color='darkgreen', linestyle='--', label=f't = {t} min')
plt.title('Distribuição Gama para o tempo até 5 carros chegarem')
plt.xlabel('Tempo (minutos)')
plt.ylabel('Densidade de Probabilidade')
plt.legend()
plt.grid(True)
plt.show()

In [None]:
# Item 2:Probabilidades de interesse
tempos = [8, 10, 15]  # Valores em minutos
for t in tempos:
    prob = gamma.cdf(t, a=alpha, scale=beta)
    print(f"P(X ≤ {t} min) = {prob:.2%}")

# Item especial: P(8 < X < 12)
prob_intervalo = gamma.cdf(12, a=alpha, scale=beta) - gamma.cdf(8, a=alpha, scale=beta)
print(f"\nP(8 < X < 12 min) = {prob_intervalo:.2%}")

# Visualização
fig, ax = plt.subplots(figsize=(10, 6))
x = np.linspace(0, 25, 500)
y = gamma.pdf(x, a=alpha, scale=beta)

plt.plot(x, y, color = 'darkolivegreen', lw=3, alpha=0.7, label=f'Gama(α={alpha}, β={beta:.1f})')


plt.fill_between(x[x<=tempos[0]], y[x<=tempos[0]], color='darkgreen', alpha=0.3, label=f'P(X ≤ {tempos[0]:.1f})')
plt.fill_between(x[(x>=8)&(x<=12)], y[(x>=8)&(x<=12)],
                color='green', alpha=0.5, label='P(8 < X < 12)')

plt.title('Tempo de Espera até 5 Carros Chegarem', fontsize=14)
plt.xlabel('Tempo (minutos)', fontsize=12)
plt.ylabel('Densidade de Probabilidade', fontsize=12)
plt.legend(fontsize=10)
plt.grid(True, alpha=0.3)
plt.show()

### Exemplo: Falha de componente eletrônico com distribuição Gama

Um capacitor cerâmico operando em condições severas tem sua **vida útil (em horas)** modelada pela distribuição **Gama** com os seguintes parâmetros:

- **Parâmetro de forma**: $ k = 3 $
- **Parâmetro de escala**: $ \beta = 1000 $

Ou seja, o tempo até a falha do capacitor $ T \sim \text{Gamma}(k=3, \beta=1000) $, cuja função densidade de probabilidade é dada por:
$$
f(t) = \frac{t^{k-1} e^{-t/\beta}}{\beta^k \Gamma(k)}, \quad t \geq 0
$$

Calcular a **probabilidade do capacitor falhar antes de 1500 horas**:

$$
P(T \leq 1500)
$$

### Solução

Para $ k = 3 $ e $ \beta = 1000 $:

$$
f(t) = \frac{t^2 e^{-t/1000}}{1000^3 \cdot 2!} = \frac{t^2 e^{-t/1000}}{2 \cdot 10^9}
$$

Queremos:

$$
P(T \leq 1500) = \int_0^{1500} \frac{t^2 e^{-t/1000}}{2 \cdot 10^9} dt
$$

**Substituição**: $ u = \frac{t}{1000} \Rightarrow dt = 1000 \, du $, $ t = 1000u $

$$
P(T \leq 1500) = \int_0^{1.5} \frac{(1000u)^2 e^{-u} \cdot 1000}{2 \cdot 10^9} du = \frac{1}{2} \int_0^{1.5} u^2 e^{-u} du
$$

Esta é a forma da **função gama incompleta inferior**:

$$
P(T \leq 1500) = \frac{1}{2} \cdot \gamma(3, 1.5)
$$

Sabemos que:

$$
\gamma(3, 1.5) = \int_0^{1.5} u^2 e^{-u} \, du
$$

Essa é a **função gama incompleta inferior**, que não possui solução fechada com funções elementares. No entanto, podemos usar valores aproximados conhecidos ou integração numérica.

$$
\gamma(3, 1.5) \approx 0.3828
$$

Logo:

$$
P(T \leq 1500) = \frac{1}{2} \cdot 0.3828 = 0.1914
$$

Ou seja, existe aproximadamente **19,14%** de chance de o capacitor falhar antes de 1500 horas de operação.

In [None]:
alpha = 3
beta = 1000

# Cálculo da CDF até 1500 horas
p = gamma.cdf(1500, a=alpha, scale=beta)
print(f"P(T <= 1500) = {p:.4f}")

In [None]:
# Parâmetros da distribuição Gama
alpha = 3
beta = 1000

# Eixo t para plot
t = np.linspace(0, 6000, 500)
pdf = gamma.pdf(t, a=alpha, scale=beta)

# Valor limite
t_lim = 1500
x_fill = np.linspace(0, t_lim, 300)
y_fill = gamma.pdf(x_fill, a=alpha, scale=beta)

# Plot
plt.figure(figsize=(10, 6))
plt.plot(t, pdf, color = 'darkolivegreen', label=f'Gamma PDF (α={alpha}, β={beta})')
plt.fill_between(x_fill, y_fill, color='yellowgreen', alpha=0.6, label=f'Área até t = {t_lim}')
plt.axvline(x=t_lim, color='k', linestyle='--', linewidth=1)
plt.text(t_lim + 100, max(pdf)/3, f't = {t_lim}', fontsize=10)
plt.xlabel('Tempo (horas)')
plt.ylabel('Densidade de probabilidade')
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()

### Exponencial vs Gama
O tempo de chegada de carros na ponte Rio Niterói pode ser modelado pelo processo de Poisson com uma taxa de 30 carros por hora.

1.   Encontre a probabilidade de esperar mais de 10 minutos por 8 carros;
2.   Encontre a probabilidade de esperar até 10 minutos pelo primeiro carro.

In [None]:
# Cálculo dos parâmetros
lambd = 30/60  # 0.5 carros por minuto (30 carros por hora)
beta = 1/lambd  # parâmetro de escala = 2

# Item 1: Cálculo da probabilidade
alpha = 8  # parâmetro de forma (8 carros)
prob = 1. - gamma.cdf(10, a=alpha, loc=0, scale=beta)
print('1. A probabilidade de esperar mais de 10 minutos por 8 carros é: {:.2%}'.format(prob))


x = np.linspace(0, 30, 200)
x1 = np.linspace(10, 30, 200)
y1 = gamma.pdf(x, a=alpha, loc=0, scale=beta)

plt.plot(x, y1, color='darkolivegreen')
plt.fill_between(x1, gamma.pdf(x1, a=alpha, loc=0, scale=beta), 0,
                 alpha=0.3, color='yellowgreen')


plt.xlabel('Tempo [minutos]')
plt.ylabel('Densidade de probabilidade p(x)')
plt.show()

In [None]:
# Cálculo dos parâmetros
lambd = 30/60  # Taxa de 0.5 carros por minuto (30 carros por hora)
beta = 1/lambd  # Parâmetro de escala = 2 minutos

# Item 2 - Cálculo da probabilidade de esperar até 10 minutos pelo primeiro carro

# Opção 01: Usando a distribuição Exponencial
prob_exp = expon.cdf(10, loc=0, scale=beta)
print('2. A probabilidade de esperar até 10 minutos pelo primeiro carro (Exponencial) é: {:.2%}'.format(prob_exp))

# Opção 02: Usando a distribuição Gama com alpha = 1 (que equivale à Exponencial)
alpha = 1  # Para o primeiro carro, shape = 1
prob_gama = gamma.cdf(10, a=alpha, loc=0, scale=beta)
print('2. A probabilidade de esperar até 10 minutos pelo primeiro carro (Gama com α=1) é: {:.2%}'.format(prob_gama))


x = np.linspace(0, 30, 200)
x1 = np.linspace(0, 10, 200)
y1 = gamma.pdf(x, a=alpha, loc=0, scale=beta)


plt.plot(x, y1, color='darkolivegreen', linestyle='-')
plt.fill_between(x1, expon.pdf(x1, scale=beta), 0, alpha=0.3, color='yellowgreen')


plt.xlabel('Tempo [minutos]')
plt.ylabel('Densidade de probabilidade p(x)')
plt.show()

Pode-se gerar valores aleatórios que seguem uma distribuição gama, como fizemos com todos os outros modelos.

In [None]:
data_gamma = gamma.rvs(a=2, scale=2, size=10000)

plt.figure(figsize=(8, 5))
sns.histplot(data_gamma,
             kde=True,
             bins=100,
             color='darkgreen',
             linewidth=0.5,
             alpha=0.7)

plt.xlabel('Gamma Distribution')
plt.ylabel('Frequency')
plt.grid(True)
plt.tight_layout()
plt.show()

### Exemplo: Chegada de Clientes em uma Loja
Uma loja recebe clientes seguindo um Processo de Poisson com taxa média de \textbf{2 clientes por hora} ($\lambda = 2$). Com base nisso, responda:

* __Distribuição de Poisson__ (Contagem de eventos em intervalo fixo):
   * Qual a probabilidade de chegar exatamente 3 clientes em uma hora?
* __Distribuição Exponencial__ (Tempo entre eventos consecutivos):
   *Qual a probabilidade do tempo entre chegadas de clientes ser menor que 30 minutos?
* __Distribuição Gama__ (Tempo para múltiplos eventos):
   *Qual a probabilidade do vendedor esperar mais de 3 horas para atender \underline{4 clientes}?

As soluções utilizam as seguintes propriedades:
* Poisson: $P(X=k) = \frac{e^{-\lambda} \lambda^k}{k!}$
* Exponencial: $P(T \leq t) = 1 - e^{-\lambda t}$
* Gama: $P(T > t) = 1 - \int_0^t \frac{\beta^\alpha x^{\alpha-1} e^{-\beta x}}{\Gamma(\alpha)} dx$, onde $\alpha = k$, $\beta = \lambda$
\end{itemize}

In [None]:
# Poisson: Probabilidade de 3 clientes em 1 hora
from scipy.stats import poisson

lambda_poisson = 2  # 2 clientes/hora
prob_3_clientes = poisson.pmf(3, mu=lambda_poisson)
print(f"Probabilidade de exatamente 3 clientes: {prob_3_clientes:.2%}")

In [None]:
# Exponencial: Tempo entre clientes < 30 minutos
from scipy.stats import expon

lambda_expon = 2  # λ = 2 clientes/hora
scale_expon = 1 / lambda_expon  # Média = 0.5 horas (30 minutos)
prob_menor_30min = expon.cdf(0.5, scale=scale_expon)  # P(X < 0.5 horas)
print(f"Probabilidade de tempo < 30 minutos: {prob_menor_30min:.2%}")

In [None]:
# Gama: Tempo > 3 horas para 4 clientes
from scipy.stats import gamma

lambda_gamma = 2  # Mesma taxa
k = 4  # 4 clientes
scale_gamma = 1 / lambda_gamma  # Escala = 0.5 horas
prob_mais_3horas = 1 - gamma.cdf(3, a=k, scale=scale_gamma)  # P(X > 3)
print(f"Probabilidade de esperar > 3 horas para 4 clientes: {prob_mais_3horas:.2%}")

In [None]:
x_poisson = np.arange(0, 6)  # Valores discretos
x_cont = np.linspace(0, 5, 1000)  # Valores contínuos

# Distribuições
poisson_dist = poisson.pmf(x_poisson, mu=lambda_poisson)
expon_dist = expon.pdf(x_cont, scale=scale_expon)
gamma_dist = gamma.pdf(x_cont, a=k, scale=scale_gamma)

# Plot
plt.figure(figsize=(10, 6))
plt.plot(x_poisson, poisson_dist, 'o', color='darkgreen', alpha=0.6, label=f"Poisson (λ=2)")
plt.plot(x_cont, expon_dist, '-', color = 'teal', label=f"Exponencial (scale=0.5)")
plt.plot(x_cont, gamma_dist, '--', color = 'darkolivegreen', label=f"Gama (k=4, scale=0.5)")
plt.title("Distribuições para Chegada de Clientes (λ=2/hora)")
plt.xlabel("Eventos (Poisson) / Tempo (horas) (Exponencial/Gama)")
plt.ylabel("Probabilidade/Densidade")
plt.legend()
plt.show()

### <font color='green'> Este é o seu exercício de Distribuição de Gama vs Exponencial vs Poisson </font>
<p style="font-family: Arial; font-size:1.4em">
<font color='green'>As falhas em CPU’s de computadores usualmente são modeladas por processos de Poisson. Isso porque, tipicamente, as falhas não são causadas por desgaste, mas por eventos externos ao sistema. Assuma que as unidades que falham sejam imediatamente reparadas e que a taxa média seja 0,0001 falhas por hora . Determine as probabilidades de que:

1. o tempo entre falhas sucessivas exceda 10.000 horas;
2. o tempo até a quarta falha exceda 40.000 horas;
3. ocorram mais que 3 falhas em 20.000 horas.

<center><img src='https://drive.google.com/uc?export=view&id=1hQsIVMqUNcM2FfSkUAUqW2vuZ1ydEjRu' width="500"></center>


Veja abaixo uma comparação ilustrativa das três distrivuições.

In [None]:
from scipy.stats import poisson, expon, gamma

In [None]:
# Parâmetros (média ≈ 3)
lambda_poisson = 3
scale_exponencial = 3  # Exponencial: média = scale
shape_gamma = 2        # Gama: média = shape * scale
scale_gamma = 1.5

# Valores inteiros para Poisson (eixo x discreto)
x_poisson = np.arange(0, 15)  # Valores inteiros de 0 a 14
x_cont = np.linspace(0, 15, 1000)  # Eixo contínuo para Exponencial e Gama

# Gerar distribuições
poisson_dist = poisson.pmf(x_poisson, mu=lambda_poisson)
exponential_dist = expon.pdf(x_cont, scale=scale_exponencial)
gamma_dist = gamma.pdf(x_cont, a=shape_gamma, scale=scale_gamma)

# Plotar
plt.figure(figsize=(10, 6))
plt.plot(x_poisson, poisson_dist, 'o', label=f"Poisson (λ={lambda_poisson})",
         markersize=8, color='steelblue', alpha=0.7)  # Pontos azuis isolados
plt.plot(x_cont, exponential_dist, label=f"Exponencial (scale={scale_exponencial})",
         linestyle='-', color='darkcyan')
plt.plot(x_cont, gamma_dist, label=f"Gama (shape={shape_gamma}, scale={scale_gamma})",
         linestyle=':', color='darkgreen')

plt.title("Comparação de Distribuições com Média ≈ 3")
plt.xlabel("Valor")
plt.ylabel("Densidade de Probabilidade")
plt.legend()
plt.grid(True)
plt.show()

### Importância da Distribuição Gama

* __Capacidade de modelar dados com valores positivos:__ A Distribuição Gama é adequada para representar variáveis que não podem ser negativas, tornando-a útil para modelar grandezas como tempos de resposta ou contagens em tarefas de aprendizado de máquina.  
* __Lidando com variabilidade e assimetria:__ Com seus parâmetros de forma e escala, a Distribuição Gama pode capturar efetivamente níveis variados de assimetria e forma em distribuições de dados, permitindo a modelagem precisa de diversos conjuntos de dados.
* __Importância na inferência bayesiana:__ Servindo como um prior conjugado para certas funções de verossimilhança, a Distribuição Gama simplifica a estimativa de parâmetros bayesianos e a modelagem probabilística, aumentando a eficiência e a precisão dos algoritmos bayesianos de aprendizado de máquina.

Dessa forma, o principal uso da distribuição gama geral é na *modelagem*. Você pode escolher parâmetros para selecionar uma ampla faixa de distribuições em forma de sino ou exponencial aproximadamente assimétricas em $[0,+\infty)$ que se aproximam de alguns dados ou fenômenos. E que, portanto, podem ser modelados via gama.

Por exemplo, uma utilização comum é, caso a distribuição não tenha que ser bastante precisa e se for razoável assumir uma forma de sino assimétrica suave, poderá modelar seus dados na família gama combinando a média e a moda dos dados.


## Função Beta

A distribuição Beta $X \sim \mathrm{Bet}(\alpha, \beta)$ é dada pela expressão,
\begin{equation}
 p(x;\alpha,\beta) = \frac{1}{B(\alpha,\beta)}x^{\alpha - 1}(1 - x)^{\beta - 1}
\end{equation}
onde,
\begin{equation}
 B(\alpha,\beta) = \frac{\Gamma(\alpha +
\beta)}{\Gamma(\alpha)\Gamma(\beta)}
\end{equation}
para números reais,
\begin{equation}
\Gamma(n)= \left(n-1 \right)!
\end{equation}

O valor esperado e variância são dados por, respectivamente,
$$
\mu = \frac{\alpha}{\alpha+\beta}
$$
e
$$
\sigma^2=\frac{\alpha\beta}{\left(\alpha+\beta\right)^2\left(\alpha+\beta-1\right)}
$$

In [None]:
from scipy.stats import beta
from scipy.integrate import quad
from scipy.special import beta as beta_func
def beta_incompleta_nao_normalizada(a, b, x):
    # Define a função integranda: t^(a-1) * e^(-t)
    integrando = lambda t: t**(a-1) * (1-t)**(b-1)

    # Calcula a integral de 0 até x
    resultado, erro = quad(integrando, 0, x)

    return resultado

In [None]:
plt.rcParams['figure.figsize'] = [5, 4]

# Bell shape
x = np.linspace(0, 1, 10000)
y1 = beta.pdf(x, 2, 8)
y2 = beta.pdf(x, 5, 5)
y3 = beta.pdf(x, 8, 2)

plt.title("PDF Beta (Forma de sino)", fontsize=14)
plt.xlabel(r'$x$', fontsize=12)
plt.ylabel(r'$p(x;\alpha,\beta)$', fontsize=12)
plt.plot(x, y1, linewidth=3, color='darkolivegreen')
plt.annotate("Beta(2,8)", xy=(0.15, 3.7), size = 10, ha='center', va='center', color='darkolivegreen')
plt.plot(x, y2, linewidth=3, color='darkgreen')
plt.annotate("Beta(5,5)", xy=(0.5, 2.6), size = 10, ha='center', va='center', color='darkgreen')
plt.plot(x, y3, linewidth=3, color='olive')
plt.annotate("Beta(8,2)", xy=(0.85, 3.7), size = 10, ha='center', va='center', color='olive')
plt.ylim([0, 4])
plt.xlim([0, 1])
plt.show()

# Straight lines
x = np.linspace(0, 1, 10000)
y1 = beta.pdf(x, 1, 2)
y2 = beta.pdf(x, 1, 1)
y3 = beta.pdf(x, 2, 1)

plt.title("PDF Beta (Forma Linear)", fontsize=14)
plt.xlabel(r'$x$', fontsize=12)
plt.ylabel(r'$p(x;\alpha,\beta)$', fontsize=12)
plt.plot(x, y1, linewidth=3, color='purple')
plt.annotate("Beta(1,2)", xy=(0.88, 0.45), size = 10, ha='center', va='center', color='purple')
plt.plot(x, y2, linewidth=3, color='mediumorchid')
plt.annotate("Beta(1,1)", xy=(0.88, 1.15), size = 10, ha='center', va='center', color='mediumorchid')
plt.plot(x, y3, linewidth=3, color='magenta')
plt.annotate("Beta(2,1)", xy=(0.88, 2.0), size = 10, ha='center', va='center', color='magenta')
plt.ylim([0, 4])
plt.xlim([0, 1])
plt.show()

# U-shape
x = np.linspace(0, 1, 10000)
y1 = beta.pdf(x, 0.2, 0.8)
y2 = beta.pdf(x, 0.5, 0.5)
y3 = beta.pdf(x, 0.8, 0.2)

plt.title("PDF Beta (Forma de U)", fontsize=14)
plt.xlabel(r'$x$', fontsize=12)
plt.ylabel(r'$p(x;\alpha,\beta)$' , fontsize=12)
plt.plot(x, y1, linewidth=3, color='navy')
plt.annotate("Beta(0.2,0.8)", xy=(0.85, 0.45), size = 10, ha='center', va='center', color='navy')
plt.plot(x, y2, linewidth=3, color='blue')
plt.annotate("Beta(0.5,0.5)", xy=(0.5, 0.88), size = 10, ha='center', va='center', color='blue')
plt.plot(x, y3, linewidth=3, color='dodgerblue')
plt.annotate("Beta(0.8,0.2)", xy=(0.15, 0.45), size = 10, ha='center', va='center', color='dodgerblue')
plt.ylim([0, 4])
plt.xlim([0, 1])
plt.show()

### Exemplo: compras na loja

Digamos que a probabilidade de alguém comprar quando entra na sua loja segue uma distribuição Beta.
1. Qual é a probabilidade de sua taxa de sucesso ser maior que 50%, se $\alpha=3$ e $\beta = 8$? Resolva usando a fórmula e depois a biblioteca Scipy.
2.  Qual é a probabilidade de sua taxa de sucesso ser maior que 50%, se $\alpha=8$ e $\beta = 3$?

In [None]:
# Dados
a, b = 3, 8
x = np.linspace(0, 1, 10000)
y1 = beta.pdf(x, a=a, b=b)

# Calculando a probabilidade
B = beta_func(a,b)
B2 = gamma_func(a) * gamma_func(b) / gamma_func(a + b)

xp = 0.5
prob = 1-beta_incompleta_nao_normalizada(a, b, xp)/B

prob1= 1 - beta.cdf(0.5, a=a, b=b)
print('1. A probabilidade de taxa de sucesso maior que 50% via fórmula é: {:.2%}'.format(prob))
print('1. A probabilidade de taxa de sucesso maior que 50% via biblioteca é: {:.2%}'.format(prob1))

plt.figure(figsize=(8, 5))
plt.plot(x, y1, linewidth=3, color='darkolivegreen', label='Distribuição Beta')

x_fill = np.linspace(0.5, 1, 5000)
y_fill = beta.pdf(x_fill, a=a, b=b)
plt.fill_between(x_fill, 0, y_fill, color='darkolivegreen', alpha=0.4, label=f'Área = {prob:.2%}')

plt.title('Distribuição Beta (a=3, b=8) e Probabilidade x > 0.5')
plt.xlabel('x')
plt.ylabel('Densidade de Probabilidade')
plt.legend()
plt.grid(True)

plt.show()

In [None]:
# Dados para item 2 (resolvido somente via biblioteca)
a, b = 8,3
x = np.linspace(0, 1, 10000)
y1 = beta.pdf(x, a=a, b=b)

# Calculando a probabilidade
prob = 1 - beta.cdf(0.5, a=a, b=b)
print('2. Invertendo os parâmetros, a probabilidade de taxa de sucesso maior que 50% via fórmula é: {:.2%}'.format(prob))

plt.figure(figsize=(8, 5))
plt.plot(x, y1, linewidth=3, color='darkolivegreen', label='Distribuição Beta')

x_fill = np.linspace(0.5, 1, 5000)
y_fill = beta.pdf(x_fill, a=a, b=b)
plt.fill_between(x_fill, 0, y_fill, color='darkolivegreen', alpha=0.4, label=f'Área = {prob:.2%}')

plt.title('Distribuição Beta (a=8, b=3) e Probabilidade x > 0.5')
plt.xlabel('x')
plt.ylabel('Densidade de Probabilidade')
plt.legend()
plt.grid(True)

plt.show()

### Exemplo: classificação de filme

Seu filme favorito pode ter classificação entre 0 e 1, seguindo uma distribuição Beta com certa variação definida pela entrada/saída ou mudança no ibope de outro filme. Digamos que ele tenha classificação 0.8±0.1. Isso quer dizer que,
$$
\mu = \frac{\alpha}{\alpha+\beta}=0.8
$$
e
$$
\sigma^2=\frac{\alpha\beta}{\left(\alpha+\beta\right)^2\left(\alpha+\beta-1\right)}=0.1^2
$$

$\alpha = 12$ e $\beta = 3$.

Qual a probabilidade de menos de 50% das pessoas gostarem do filme?


In [None]:
# Parâmetros
a, b = 12, 3
x = np.linspace(0, 1, 10000)
y1 = beta.pdf(x, a=a, b=b)

# Calculando a probabilidade
prob = beta.cdf(0.5, a=a, b=b)
print('A probabilidade de menos de 50% das pessoas gostarem do filme é: {:.2%}'.format(prob))


plt.figure(figsize=(8, 5))
plt.plot(x, y1, linewidth=3, color='darkolivegreen', label='Distribuição Beta')


x_fill = np.linspace(0, 0.5, 5000)
y_fill = beta.pdf(x_fill, a=a, b=b)
plt.fill_between(x_fill, 0, y_fill, color='darkolivegreen', alpha=0.4, label=f'Área = {prob:.2%}')


plt.title('Distribuição Beta (a=12, b=3) e Probabilidade x < 0.5')
plt.xlabel('x')
plt.ylabel('Densidade de Probabilidade')
plt.legend()
plt.grid(True)

plt.show()

### Exemplo: empresa de publicidade

__Qual a probabilidade de um anúncio (com CTR real de 34,3%) ter uma CTR entre 30% e 40%?__

Supondo que você trabalhe em uma empresa de publicidade, e a CTR (taxa de cliques, do inglês click-through rate) do anúncio de uma campanha sua no mês anterior foi de 34,3%. Como o mês atual ainda não terminou, precisamos atualizar nossa probabilidade inicial (prior) à medida que novos dados vão chegando.

Usando CTR = 34,3% como a CTR real, vamos rodar uma simulação. Como estamos lidando com CTR, podemos representar isso com uma distribuição binomial:1 para clique, 0 para não clique.
Sempre que ocorre um clique, aumentamos alpha em 1; se não ocorre, aumentamos beta em 1. Isso permite atualizar continuamente a probabilidade *a priori* à medida que novos dados são coletados.


In [None]:
class Ad:
    """
    Instancia um objeto de anúncio, com o CTR definido
    """
    def __init__(self, ctr, name):
        self.ctr = ctr
        self.name = name
        self.alpha = 0
        self.beta = 0

    def display_ad(self):
        """
        Simula a exibição do anúncio e o comportamento do cliente em potencial
        é sorteado de uma distribuição binomial com probabilidade p.
        "0" adiciona 1 ao contador de beta e "1" adiciona 1 ao contador de alpha
        """
        click = np.random.binomial(n=1, p=self.ctr)
        self.alpha += click
        self.beta += 1 - click

    def update_ctr(self):
        """
        Atualiza o valor esperado de CTR para refletir a tendência mais recente
        """
        self.ctr = self.alpha / (self.alpha+self.beta)

In [None]:
# Instanciar o anúncio com CTR verdadeiro de 0.343
Ad1 = Ad(ctr=0.343, name="Ad1")

# Simular 100 exibições do anúncio
for _ in range(100):
    Ad1.display_ad()

print(f"alpha = {Ad1.alpha}, beta = {Ad1.beta}")
Ad1.update_ctr()
print("new ctr = ", Ad1.ctr)

# Geração dos dados
x = np.arange(0.01, 1, 0.01)
y = beta.pdf(x, Ad1.alpha, Ad1.beta)

# Probabilidade de CTR estar entre 0.3 e 0.4
probabilidade = beta.cdf(0.4, Ad1.alpha, Ad1.beta) - beta.cdf(0.3, Ad1.alpha, Ad1.beta)
print(f"Probabilidade de CTR estar entre 0.3 e 0.4: {probabilidade:.4f}")

# Criação do gráfico
plt.figure(figsize=(8, 5))
plt.plot(x, y, label=f'Beta({Ad1.alpha}, {Ad1.beta})', color='darkgreen')

# Preencher a área entre 0.3 e 0.4
x_fill = np.linspace(0.3, 0.4, 100)
y_fill = beta.pdf(x_fill, Ad1.alpha, Ad1.beta)
plt.fill_between(x_fill, y_fill, color='yellowgreen', alpha=0.4, label='Área entre 0.3 e 0.4')

plt.xlabel('CTR')
plt.grid(True)
plt.legend()
plt.tight_layout()
plt.show()

Quando nosso `Ad1` é *clicado* 100 vezes, obtemos $\alpha$ e $\beta$  acima, modificando o CTR. À medida que mais vezes o `Ad1` é clicado, o CTR deve se aproximar do CTR real, que é 0,343. Teste...


Para simplificar, estamos assumindo que o CTR é estacionário, mas é importante lembrar que, no mundo real, o CTR é não-estacionário. Por isso, seria necessário incluir algum tipo de fator de peso em relação ao tempo, para dar mais importância aos dados mais recentes.

### Beta e Binomial são conjugados

#### Verossimilhança Binomial
A função de verossimilhança binomial descreve a probabilidade de observar $ k $ sucessos em $ n $ tentativas independentes, onde cada tentativa tem uma probabilidade de sucesso $ p $. A função de massa de probabilidade (PMF) de uma distribuição Binomial é dada por:

$$
P(k | p) = \binom{n}{k} p^k (1-p)^{n-k}
$$

Aqui, $ P(k | p) $ é a probabilidade de observar $ k $ sucessos, dado que a probabilidade de sucesso em cada tentativa é $ p $.

#### Prior Beta
A distribuição Beta é uma distribuição de probabilidade contínua definida no intervalo $ [0, 1] $. A função de densidade de probabilidade (PDF) de uma distribuição Beta é dada por:

$$
f(p | \alpha, \beta) = \frac{p^{\alpha-1} (1-p)^{\beta-1}}{B(\alpha, \beta)}
$$

onde $ \alpha $ e $ \beta $ são os parâmetros de forma, e $ B(\alpha, \beta) $ é a função Beta, que serve como uma constante de normalização.

#### Distribuição Posterior
De acordo com o Teorema de Bayes, a distribuição posterior é proporcional à verossimilhança multiplicada pelo prior:

$$
P(p | k) \propto P(k | p) f(p | \alpha, \beta)
$$

Substituindo a função de verossimilhança $ P(k | p) $ e o prior $ f(p | \alpha, \beta) $ nesta equação:

$$
P(p | k) \propto \binom{n}{k} p^k (1-p)^{n-k} \cdot p^{\alpha-1} (1-p)^{\beta-1}
$$

Simplificando a expressão (note que $ \binom{n}{k} $ é uma constante em relação a $ p $):

$$
P(p | k) \propto p^{\alpha + k - 1} (1-p)^{\beta + n - k - 1}
$$

Esta é a forma não normalizada da distribuição posterior.

#### Constante de Normalização
Agora, reconhecemos que a expressão acima tem a forma de uma distribuição Beta, especificamente uma distribuição Beta com parâmetros $ \alpha + k $ e $ \beta + n - k $:

$$
P(p | k) \propto p^{(\alpha + k - 1)} (1-p)^{(\beta + n - k - 1)}
$$

Para normalizar a distribuição, precisamos dividir pela função Beta $ B(\alpha + k, \beta + n - k) $, então a distribuição posterior final é:

$$
P(p | k) = \frac{p^{\alpha + k - 1} (1-p)^{\beta + n - k - 1}}{B(\alpha + k, \beta + n - k)}
$$

Esta é uma distribuição Beta com parâmetros $ \alpha + k $ e $ \beta + n - k $.


A distribuição posterior $ P(p | k) $ é uma distribuição Beta com parâmetros atualizados $ \alpha + k $ e $ \beta + n - k $. Portanto, a distribuição Beta é conjugada à distribuição Binomial, ou seja, quando começamos com um prior Beta e uma verossimilhança Binomial, a distribuição posterior também será uma Beta.


### Análise de CRTs

Suponha que planejamos realizar uma pesquisa com 50 internautas selecionados aleatoriamente e contar quantos desses 50 clicarão em nosso anúncio.

Dado um valor $p$, o número de internautas que clicam no anúncio (isto é, $ Y | p$) é uma variável aleatória binomial $\text{Binomial}(50, p)$, com a função massa de probabilidade (pmf):

$$
f(y|p) = P(Y = y|p) = \binom{50}{y} p^y (1 - p)^{50 - y}
$$

__Essa pmf nos diz que:__ Se a probabilidade de sucesso é $p$, qual é a probabilidade de que o número total de eleitores favoráveis $ Y $ seja igual a algum valor $ y $?

Como o parâmetro $p$ está restrito a valores entre 0 e 1, devemos escolher uma distribuição prior com suporte em $[0, 1]$.

Seja $f(p)$ a função de densidade de probabilidade (pdf) prior para $\pi$, que será uma distribuição Beta, ou seja,
$$
  f(p;\alpha, \beta) = \frac{p^{\alpha - 1} (1 - p)^{\beta - 1}}{B(\alpha, \beta)}
$$
onde $\alpha$ e $\beta$ são os parâmetros da distribuição Beta, e $ B(\alpha, \beta)$ é a função beta, dada por:
$$
   B(\alpha, \beta) = \int_0^1 t^{\alpha - 1} (1 - t)^{\beta - 1} \, dt.
$$

#### Coletando dados e atualizando a posteriori

Suponha que mostramos o botão a 50 usuários e 30 clicaram. A função de verossimilhança é:
\begin{equation}
L(p | y=30) = \binom{50}{30} p^{30}(1-p)^{20}
\end{equation}

Exemplos:
\begin{equation}
L(0.6|30) \approx \binom{50}{30} \cdot 0.6^{30} \cdot 0.4^{20} \approx 0.115
\end{equation}
\begin{equation}
L(0.5|30) \approx \binom{50}{30} \cdot 0.5^{50} \approx 0.042
\end{equation}

Como a priori é Beta e a verossimilhança é Binomial, o posterior também é Beta:
\begin{equation}
\text{Beta}(a + 30, b + 20)
\end{equation}

In [None]:
from scipy.stats import beta
from scipy.stats import binom

In [None]:
class beta_dist:
    def __init__(self, a = 1, b = 1):
        self.a = a
        self.b = b

    #Get the beta pdf
    def get_pdf(self):
        x = np.linspace(0, 1, 1000)
        fx = beta.pdf(x, self.a, self.b)
        dens_dict = {'x': x, 'fx': fx}
        return(dens_dict)

    #Update parameters:
    def update_beta_params(self, n, num_successes):
        self.old_a = self.a
        self.old_b = self.b
        self.a = self.a + num_successes
        self.b = self.b + n - num_successes

In [None]:
a = 1
b = 1
cliques = beta_dist(a = a, b = b)
prior = cliques.get_pdf()

# Dados do experimento
total_participants = 50
how_many_clicked = 30

In [None]:
cliques.update_beta_params(n = total_participants, num_successes = how_many_clicked)
posterior = cliques.get_pdf()
print("Hiperparâmetros atualizados:")
print(cliques.a, cliques.b)
post_mean = cliques.a/(cliques.a + cliques.b)
print("O valor médio posterior é {:06.5f}".format(post_mean))

In [None]:
#Plot prior and posterior
plt.plot(prior['x'], prior['fx'], color = 'olive')
plt.plot(posterior['x'], posterior['fx'], color = 'darkolivegreen')
plt.axvline(x=how_many_clicked/total_participants, color = 'darkgreen')
plt.legend(['Prior Distribution', 'Posterior Distribution', 'Posterior mean'], loc='upper right')

plt.show()

### <font color='green'> Este é o seu exercício de Distribuição Beta e Binomial </font>
<p style="font-family: Arial; font-size:1.4em">
<font color='green'> Repita o exercício anterior, construindo uma distribuição *Beta* a priori com base em crenças informadas.

Vamos imaginar que você foi pesquisar bastante sobre o comportamento de cliques em  campanhas publicitárias e montou uma crença inicial.  A partir disso, você achou que seria razoável assumir que cerca de $55\%$ das pessoas clicariam. Nesse caso, seria razoável sugerir que:
$$
\mathbb{E}(p) = 0.55 = \frac{\alpha}{\alpha + \beta}.
$$

<font color='green'>Agora, temos apenas um único parâmetro a definir (por exemplo, $b$), já que $a$ está definido em função de $b$.

<font color='green'>Outro aspecto da distribuição que podemos considerar é a probabilidade de $p$ estar abaixo de um determinado valor. Para fins ilustrativos, imagine que você percebeu que seria improvável que a taxa real de cliques fosse inferior a $40\%$. Mais precisamente, essa chance seria de $20\%$. Isto é:
$$
P(p < 0.4) = 0.2.
$$

<font color='green'>Como a função de distribuição acumulada (CDF) da distribuição Beta é parametrizada por $\alpha$ e $\beta$, você pode usar as informações acima e achar os hiperparâmetros de sua distribuição priori.

</font> </p>


In [None]:
from scipy.special import betainc
from scipy.optimize import root_scalar

In [None]:
#Relação entre alfa e beta (alfa/beta):
r = 0.55 / (1-0.55)
print(r)

In [None]:
def equacao(beta):
    alpha = r * beta
    return betainc(alpha, beta, 0.4) - 0.2

solucao = root_scalar(equacao, bracket=[1, 20])  # Intervalo [1, 20] para beta
beta_estimado = solucao.root
alpha_estimado = r * beta_estimado

print(f"alfa aproximado: {alpha_estimado:.2f}, beta aproximado: {beta_estimado:.2f}")

In [None]:
# conferência
print(f'Relação alfa/beta: {alpha_estimado/(alpha_estimado + beta_estimado)}') # Deve ser aprox 0.55
from scipy.stats import beta
print(f' P(p<0.4) = {beta.cdf(0.4, 4.29, 3.51)}')  # Deve ser ≈ 0.2