# Lista de Exercícios I - Estatística I

In [92]:
import math

import pandas as pd
import numpy as np

from scipy import stats

In [43]:
RANDOM_SEED = 2

### 1

__Enunciado__

A probabilidade de dado honesto é conhecido e igual a $1/6$, mas quando vamos testar isso com um dado físico, não necessariamente vai cair uma vez cada face do dado (se eu lançar ele 6 vezes). A ideia é que conforme fazermos vários testes a tendência é que a probabilidade de cada face irá convergir pro valor esperado. 

Vamos testar este conceito utilizando da programação seguintes os itens abaixo:

__A)__ Desenvolva uma função que receba um valor n, onde n é a quantidade de elementos e o objetivo da função é retorna uma _Series_ com n elementos sendo esses elementos números variando de 1 e 6;

In [48]:
def get_series(n: int, seed: int = RANDOM_SEED) -> pd.Series:
    np.random.seed(RANDOM_SEED)
    numbers = np.random.randint(low=1, high=7, size=n)
    return pd.Series(numbers)

__B__ Teste a função para n igual a 10, 100, 1.000, 10.000 e 100.000 casos e para cada um deles calcule a proporção de vezes que aparece cada número;

_Dica.:_ utilize a função do _Pandas_ `.value_counts`

In [67]:
n_values = [10, 100, 10_000, 100_000]

for n in n_values:
    series = get_series(n=n)
    val_counts = series.value_counts(normalize=True).to_list()
    print(f'For n = {n}\t, proportions are: {val_counts}')


For n = 10	, proportions are: [0.3, 0.3, 0.2, 0.1, 0.1]
For n = 100	, proportions are: [0.22, 0.18, 0.16, 0.15, 0.15, 0.14]
For n = 10000	, proportions are: [0.1755, 0.1683, 0.1668, 0.1665, 0.1623, 0.1606]
For n = 100000	, proportions are: [0.16906, 0.16891, 0.16697, 0.16696, 0.16441, 0.16369]


__C)__ O que podermos dizer sobre a afirmação do enunciado, a tendência é que as probabilidades irâo convergir para $1/6$?

_Resposta:_

Quanto maior a quantidade de amostras mais as proporções de ocorrência de cada valor possível se aproxima do valor esperado. Sendo o valor esperado equivalente a uma média dos valores possíveis ponderada pelas probabilidades de ocorrência de cada um deles.

### 2

__Enunciado__

Um programa de computador gera uma pontuação aleatória para cada usuário, sendo que:

- Em 1/2 dos casos, gera 0.5;
- Em 1/4 dos casos, gera 0.25;
- Em 1/8 dos casos, gera 0.125.

E essa lógica segue assim por diante. Resolva os itens a seguir:

__A)__ Calcule o __valor esperado__ utilizando apenas os 3 primeiros casos;

In [62]:
expected_value = .5 * .5 + .25**2 + (1/8)*.125
print(f'Expected Value: {expected_value}')

Expected Value: 0.328125


__B)__ Faça um _loop_ para calcular o __valor esperado__ para 100 casos e avalie se só com os 3 primeiros casos temos uma boa aproximação ou não.

In [63]:
def get_expected_value(n_cases: int) -> float:

    expected_value = 0

    prob = 1
    for i in range(n_cases):
        prob /= 2
        value = prob
        
        expected_value += value * prob
    
    return expected_value


In [64]:
get_expected_value(n_cases=100)

0.3333333333333333

Com apenas 3 valores já é possível obter uma boa aproximação do valor esperado.

### 3

__Enunciado__

Suponha que o limite de uma estrada é de 80km/h e, a partir da medição por radar, sabe-se que nessa rodovia a velocidade dos veículo $X$ segue uma distribuição normal com média de 72km/h e desvio padrão de 8 km/h.

 - Qual a probabilidade de um veículo ser multado?
 - Além da multa, se um veículo ultrapassar o limite em 30km/h, o motorista perde a carteira. Considerando apenas os infratores de velocidade, qual a probabilidade dele perder a carteira?
    

In [85]:
prob_ok = stats.norm.cdf(x=80, loc=72, scale=8)
prob_traffic_ticket = 1 - prob_ok

prob_not_lose_license = stats.norm.cdf(x=110, loc=72, scale=8)
prob_lose_license = 1 - prob_not_lose_license

print(f'Probabilidade de multa ~= {np.round(100 * prob_traffic_ticket, 2)} %')
print(f'Probabilidade de perder a carteira ~= {np.round(100 * prob_lose_license, 2)} %')

Probabilidade de multa ~= 15.87 %
Probabilidade de perder a carteira ~= 0.0 %


### 5

__Enunciado__

Se a probabilidade de atingir um alvo com um único disparo é de 0.3. Qual é a probabilidade de, em 4 disparos, atingirmos o alvo ao menos 3 vezes?


__Resposta__


Possibilidades:

- errar, acertar, acertar, acertar
- acertar, errar, acertar, acertar
- acertar, errar, acertar, acertar
- acertar, acertar, errar, acertar
- acertar, acertar, acertar, errar
- etc.


Em todos os casos a probabilidade final é o produto das probabilidades de ocorrência de um erro e 3 acertos em sequência (como no primeiro caso).

In [90]:
prob_hit = .3
prob_miss = 1 - prob_hit
prob = prob_miss * 3*prob_hit

print(f'Probabilidade final ~= {np.round(100 * prob, 3)}%')

Probabilidade final ~= 63.0%


### 6

__Enunciado__

Suponha que o número de meteoros registrados por um sistema de radares num intervalo qualquer de 30 segundos é de 1.81 em média. Assumindo que os meteoros aparecem aleatoriamente e de forma independente. Usando a distribuição de Poisson determine:

Distribuição de Poisson:

$$ P(X = k) = \frac{e^{-\lambda}\lambda^{k}}{k!} $$

In [97]:
def poisson(lambd: float, k: int) -> float:
    return (np.exp(-lambd) * (lambd**k)) / math.factorial(k)

In [119]:
meteors_per_sec = 1.81 / 30

- A probabilidade de que nenhum meteoro seja encontrado num intervalo de 1 minuto.

In [120]:

n_secs = 1 * 60 # 1 minute
lambd = meteors_per_sec * n_secs
n_meteors = 0

prob = poisson(lambd=lambd, k=n_meteors)
prob

0.026782676492638175

 - A probabilidade encontrarmos de 5 a 8 meteoros em 2 minutos.

In [118]:
n_secs = 2 * 60 # 2 minutes
lambd = meteors_per_sec * n_secs

prob = 0
for k in range(5, 8):
    prob += poisson(lambd=lambd, k=k)

prob

# Testing...
# stats.poisson.cdf(k=8, mu=lambd) - stats.poisson.cdf(k=5, mu=lambd)

0.41080003750060745

### 7

__Enunciado__

O número médio de jornais vendidos numa banca é 5 jornais por minuto. Qual é a probabilidade de vender ao menos 1 jornal em um minuto?

In [121]:
paper_per_min = 5

In [126]:
n_minutes = 1
lambd = paper_per_min * n_minutes

prob_zero = poisson(lambd=lambd, k=0)

prob = 1 - prob_zero
prob

0.9932620530009145

### 8

__Enunciado__ (Monty-Hall)

- Em um programa de auditório, havia 3 portas (A, B, C), dentro da qual uma continha um prêmio.
- O participante escolheu a porta A;
- Antes de abrir a porta escolhida o apresentador abriu a porta C;
- Na qual não havia nada
- O participante aumentará a probabilidade de acertar a porta caso mude a escolha dele da porta A para a B?
- Demonstre a sua resposta utilizando o Teorema de Bayes? 

__Reposta__

- Probabilidade de estar em A dado que não está em C: 50%;
- Que é igual a probabilidade de estar em B, dado que não está em C;
- Logo, trocar a escolha de A para B não faz diferença;

Teorema de Bayes

$$ P(A|B) = \frac{P(B|A) \ P(A)}{P(B|A) \ P(A)  + P(B|\tilde{A}) \ P(\tilde{A})}    $$

In [132]:
p_not = lambda p: 1 - p

def bayes(pa: float, pb_a: float, pb_not_a: float) -> float:
    num = pb_a * pa
    den = (pb_a * pa) + (pb_not_a * p_not(pa))
    pa_b = num / den
    return pa_b

Demonstrando: Probabilidade de estar em A dado que está em C (zero!)

In [134]:
pa = 1/3
pc_a = 0

pc_not_a = 1/2
pa_c = bayes(pa=pa, pb_a=pc_a, pb_not_a=pc_not_a)
pa_c

0.0

Demonstrando: Probabilidade de estar em A dado que __não__ está em C (50%)

In [135]:
pa = 1/3
p_not_c_a = 1
p_not_c_not_a = 1 / 2

pa_not_c = bayes(pa=pa, pb_a=p_not_c_a, pb_not_a=p_not_c_not_a)
pa_not_c

0.49999999999999994