Exercícios sobre distribuições
==============================



## Exercício 1 (25 pontos)



Considere que a variável aleatória $X$ apresenta a seguinte pdf:

$$
f(x)=\begin{cases}
c(1-x^2) & -1 < x < 1\\
0 & \textrm{caso contrário}
\end{cases}
$$

Utilizando de seus conhecimentos adquiridos sobre distribuições de probabilidades, resolva as questões abaixo.

1.  Encontre o valor de $c$. Se calcular de forma numérica, mostre os códigos. Se calcular de forma analítica, mostre todos os passos.

2.  Encontre a forma analítica da cdf de $X$. Mostre todos os passos.

3.  Calcule $P(|X| > 0,5)$. Mostre com clareza os passo do seu raciocínio.

4.  Calcule $E[X]$.

5.  Calcule $\mathrm{Var}(X)$.

**Nota**: pode resolver em papel a parte matemática e incluir a imagem no notebook e na entrega do teams. Mas lembrando que em LaTeX fica muito mais bonito e elegante :)



## Resolução do exercício 1



### Item 1

<p style='text-align:justify'> Como consequência do axioma de Kolmogorov $[1]$ $[2]$, a integral da pdf $f(x)$ no intervalo de integração de $-\infty$ até $+\infty$ é igual a 1. Assim:
    $$\int_{-\infty}^{\infty}f(x) \space \text{d}x = 1 $$
Como $x$ possui probabilidade apenas entre $-1$ e $1$, podemo reescrever os intervalos de integração:
    $$ \int_{-1}^{1} c(1-x^2) \space \text{d}x = 1 $$
Assim, podemos encontrar $c$ de maneira analítica. Como $c$ é uma constante, sabemos que ele "sai" da integral, por não estar diferenciado em $x$.
    \begin{align*}
    c\int_{-1}^{1} (1-x^2) \space \text{d}x &= 1 \\
    \\
    c \left[ x - \frac{x^3}{3}\right]_{-1}^{1} &= 1 \\
    \\
    c\left[1 - \frac{1}{3} - \left(-1 + \frac{1}{3} \right) \right] &= 1 \\
    \\
    c \left[ \frac{2}{3} + \frac{2}{3} \right] &= 1 \\
    \\
    c \cdot \frac{4}{3} &= 1 \\
    \\
    c &=  \frac{3}{4}
    \end{align*}
    
<p style='text-align:justify'> Além disso, podemos calcular $c$ de maneira númerica usando código. Para isso, podemos escrever a constante $c$ como
$$c = \frac{1}{{\int_{-1}^{1} (1 - x^2) \, dx}} $$
Então, implementamos um código usando a função <code>quad</code> da biblioteca <code>scipy.integrate</code>. Assim, utilizamos uma função para definir a pdf e resolvemos a integral de forma numérica usando <code>quad</code>. 

In [7]:
from scipy.integrate import quad


def pdf_item1(x):
    ''' 
    
    Essa função recebe uma variável e retorna uma probabilidade de acordo com 
    a própria pdf.
    
    Args:
        x: valor de entrada para retorno da probabilidade.
    
    '''
    if 1 > x > -1:
        return (1-x**2) 
    else:
        return 0 

integral = quad(pdf_item1,-1,1)[0]
resultado = round(1/integral,2)


print(f"O valor de c é {resultado}")

O valor de c é 0.75


### Item 2

<p style='text-align:justify'>Sabemos que a Cumulative Density Function (CDF) é a integral da pdf. Vamos chamá-la de F(x). Assim, vamos integrar
$$F(x) = \int_{-\infty}^{x} f(x)$$
Sabemos que para $x < -1$, $f(x) = 0$. Assim, podemos mudar o intervalo de integração:
$$F(x) = \int_{-1}^{x} f(x)$$
Agora, podemos incluir a constante  $c$ que obtivemos o valor na questão passada, além de incluir a própria função:
$$F(x) =\frac{3}{4}  \int_{-1}^{x} (1-x^2)$$
Como resultado, temos:
\begin{align}
F(x) &=\frac{3}{4}  \int_{-1}^{x} (1-x^2)
\\
&= \frac{3}{4} \left[ x - \frac{x^3}{3}\right]_{-1}^{x}
\\
&= \frac{3}{4} \left[x - \frac{x^3}{3} + \frac{2}{3} \right]
\end{align}
Assim, a fórmula acima nos permite descobrir a probabilidade de $X$ ter um valor inferior ou igual a $x$ 

### Item 3

<p style='text-align:justify'> Para descobrir $P(|X| > 0,5)$ usaremos a cdf para descobrir a probabilidade de X ter um valor inferior ou igual a 0,5. E essa probabilidade é complementar a $P(|X| > 0,5)$. Ou seja: calcularemos $1 - P(|X| \leq 0,5)$:

\begin{align}
P(|X| < 0.5) &= \frac{3}{4} \left[0.5 - \frac{0.5^3}{3} + \frac{2}{3} \right] \\
\\
&= \frac{3}{4} \left[0.5 - \frac{0.125}{3} + \frac{2}{3} \right] \\
\\
&= \frac{3}{4} \left[0.5 + \frac{1,875}{3} \right] \\
\\
&= \frac{3}{4} \cdot \frac{3.375}{3} \\
\\
&= 0.84375 \\
\\
\therefore P(|X| > 0,5) &= 1 - P(|X| \leq 0,5) \\
&= 1 - 0,84375 \\
&= 0,15625
\end{align}

<p style='text-align:justify'> Podemos resolver esse problema por meio de um código. Nele definimos uma função para a cdf e calculamos seu complementar.

In [5]:
def cdf(x):
    '''
    Essa função recebe uma variável e retornar a probabilidade acumulada até x
    da cdf em questão.
    
    Args:
        x: valor de entrada para retorno da probabilidade acumulada
    '''
    p = 3/4 * (x - (x**3/3) + 2/3)
    return p

     
complementar = cdf(0.5)


print(f"A probabilidade é {1-complementar}")

A probabilidade é 0.15625


### Item 4

O valor esperado $E[X]$ de um pdf é dado como:
$$
\boxed{E[X] = \int_{-\infty}^{\infty} x \cdot f(x)}
$$

 

usando a fórmula acima na nossa pdf:
$$ E[X] =   \int_{-\infty}^{\infty} x \cdot  \frac{3}{4} (1-x^2)$$

 

Porém, como já foi visto, há probabilidade é não-nula apenas para $-1 < x < 1$. Assim, trocaremos os intervalos de integração:

 

$$ E[X] =   \int_{-1}^{1} x \cdot  \frac{3}{4} (1-x^2)$$

 

Podemos passar a constante $\frac{3}{4}$ para fora da integral:

 

$$ E[X] =   \frac{3}{4} \int_{-1}^{1} x \cdot   (1-x^2)$$

 

Como os intervalos são simétricos e a função é ímpar, teremos:

\begin{align}
\frac{3}{4} \int_{-1}^{1} x \cdot   (1-x^2) &= 0 \\
\therefore E[X] &= 0  
\end{align}

Podemos também resolver de forma numérica por meio de uma implementação já vista em notebooks passados $[3]$.

In [29]:
def pdf_item4(x):
    if 1 > x > -1:
        return 0.75*(1-x**2) 
    else:
        return 0

def valor_esperado(pdf_item4, h=lambda x: x):
    """Computa o valor esperado para uma distribuição contínua."""
    return quad(lambda x: h(x) * pdf_item4(x), -np.inf, np.inf)[0]


v_esperado = valor_esperado(pdf_item4)

 
print(v_esperado)

0.0


### Item 5

<p style='text-align:justify'> Por definição, a variância pode ser dada por:
    $$ \boxed{\text{Var}(X) = E\left[\left(X-\mu_X\right)^2\right]}$$
    
Podemos calcular a variância por meio da implementação de um código visto em notebooks passados $[]$. Nele, armazenamos o valor esperado da pdf calculado pela função <code>valor_esperado</code>. Assim, definimos uma função <code>h(x)</code> para calcular $\left(X-\mu_X\right)^2$ e calculamos o valor esperado da pdf e de <code>h(x)</code>.

In [32]:
v_esperado = valor_esperado(pdf_item4)

def h(x):
    return (x - v_esperado) ** 2

variancia = valor_esperado(pdf_item4, h)

print(round(variancia, 2))

0.2


## Exercício 2 (25 pontos)



As reuniões do colegiado acontecem de terça-feira, tendo início às 12:30.

O professor $A$ chega nesta reunião entre 12:30 e 12:35 seguindo uma distribuição uniforme de probabilidade.

O professor $B$ chega nesta reunião seguindo uma distribuição normal de probabilidade com média 12:33 e desvio padrão de 0,5 minuto.

A chegada dos professores $A$ e $B$ são eventos independentes.

Qual é a probabilidade de que os professores $A$ e $B$ irão perder os 2 primeiros minutos da reunião do colegiado na próxima terça-feira?

<u>Resolva este problema de forma numérica usando código</u>. O `scipy` [tem](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.uniform.html#scipy.stats.uniform) a distribuição uniforme caso queira.

**Dica**: Quem sabe representar os horários de outra maneira possa ajudar! Deixe claro para o leitor qualquer conversão feita.



## Resolução do exercício 2



<p style='text-align:justify'>Sabemos que a chegada dos professores $A$ e $B$ são eventos independentes. Assim, calcularemos as probabilidades individuais de cada professor perder os 2 primeiros minutos da reunião, e multiplicaremos essas probabilidades.

<p style='text-align:justify'>Dado que o professor $A$ chega entre 12:30 e 12:35 (ou seja, em um intervalo de 5 minutos)* com uma distribuição uniforme, a probabilidade de ele chegar nos primeiros 2 minutos (0 a 2 minutos após 12:30) é 2 minutos dividido por 5 minutos, ou seja, $2/5$. E a probabilidade dele perder esses 2 minutos, portanto, é $1 - 2/5 = 3/5$.

Para o professor $B$, usaremos a distribuição normal do `scipy`.
    
<p style='text-align:justify'>Assim, no código, usamos a integral da pdf em intervalos para $2 < x < 5$.
    
(*): Consideraremos 12:30 como tempo "zero" e continuaremos a contar por minutos.

In [33]:
import numpy as np
from scipy.integrate import quad
from scipy import stats


def prof_A(x):
    if 0 <= x <= 5:
        return 1/5
    else:
        return 0


def prof_B(x):
    dist_normal = stats.norm(loc=3, scale=0.5)
    return dist_normal.pdf(x)

a = 2
b = 5


probA = quad(prof_A, a,b)[0]  
probB = quad(prof_B, a, b)[0]  

 
print(f"A probabilidade do professor A atrasar, ou seja, chegar entre os minutos  {a} e {b} é de {probA * 100:.1f}%")
print(f"A probabilidade do professor B atrasar, ou seja, chegar entre os minutos  {a} e {b} é de {probB * 100:.1f}%")
print(f"Logo a probabilidade dos professores A e B perderem os 2 primeiros minutos da reunião do colegiado na próxima terça-feira é {probA*probB* 100:.1f}%")

A probabilidade do professor A atrasar, ou seja, chegar entre os minutos  2 e 5 é de 60.0%
A probabilidade do professor B atrasar, ou seja, chegar entre os minutos  2 e 5 é de 97.7%
Logo a probabilidade dos professores A e B perderem os 2 primeiros minutos da reunião do colegiado na próxima terça-feira é 58.6%


## Referências



Escreva nesta seção as referências consultadas.

1.  Exercícios foram baseados no curso Data 140 de UC Berkeley [http://prob140.org/textbook/content/README.html](http://prob140.org/textbook/content/README.html)

$[1]$ Notebook 4 - "Probabilidade"

$[2]$ Notebook 8 - "Outras distribuições de probabilidade"

$[3]$ Notebook 7 - "Distribuição de probabilidade"




## Playground



Use este espaço para fazer o que quiser. Não será considerado na correção.

