# EXERCÍCIOS - DISTRIBUIÇÃO DE PROBABILIDADES

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import pandas as pd
from scipy import stats
import seaborn as sns

## (1) Função de Probabilidade - Distribuição Binomial

### Seja X uma variável aleatória que contém o número de caras saídas em 12 lançamentos de uma moeda honesta. Qual a probabilidade de sair 5 caras em 12 lançamentos, P(X=5)

\begin{equation*}
f(x)=  \binom {n}{x} (p)^x (1-p)^{(n-x)}
\end{equation*}

In [None]:
import math

x = 5  # número de sucassos
n = 12  # número de lançamentos
p = 0.5  # probabilidade

P1 = math.factorial(n) / ( math.factorial(x) * math.factorial(n-x) ) * (p**5) * (1-p)**(n-x)
P1

## (2) Função de Probabilidade - Distribuição de Poisson

### Um departamento de polícia recebe em média 5 solicitações por hora.  Qual  a  probabilidade  de  receber  2 solicitações numa hora selecionada aleatoriamente? 

\begin{equation*}
f(x)= e^{-\lambda} \dfrac{\lambda^x}{x!}
\end{equation*}

In [None]:
from math import e

In [None]:
X = 2  # número designado de sucessos
l = 5  # número médio de sucessos num intervalo específico (uma hora)

P2 = ( l ** X ) * ( e ** -l ) / math.factorial(X)
P2

## (3) Função de Probabilidade

### (Meyer,2000) Suponha que Xt, o nº de partículas emitidas em t horas por uma fonte radioativa, tenha uma distribuição de Poisson com parâmetro 20t. Qual será a probabilidade de que exatamente 5 partículas sejam emitidas durante um período de 15 min?

In [None]:
X = 5  # número designado de sucessos
l = 20 * 1/4  # número médio de sucessos num intervalo específico (t=quinze minutos) lambda = 20*t

P3 = ( l ** X ) * ( e ** -l ) / math.factorial(X)
P3

## (4) Plotando uma Distribuição Normal

### Gere uma distribuição normal com o peso da população, utilize média=70, desvio=25 e 100 observações e Plot a Função Densidade de Probabilidade (fdp em português mas vocês acharam mais frequentemente pdf, probability density functions).

In [None]:
mean = 70
std = 25
n = 100

df4 = pd.DataFrame(np.random.normal(loc=mean,scale=std,size=n))

df4.plot.hist(bins=20)

## (5) Normalização

### Normalize a distribuição anterior com z-score

$Z \sim \dfrac{x - \mu} {\sigma^{2}\,} $


#### Método raiz

In [None]:
df4.columns = ['peso']
df4['peso'] = ( df4['peso'] - df4['peso'].mean() ) / df4['peso'].std()
df4.head()

#### Utilizando uma função

In [None]:
def standardize(df):
    avg = df.mean()
    stdv = df.std()
    df_standardized = (df - avg)/ stdv
    return (df_standardized)

In [None]:
standardize(df4).head()

#### Utilizando função Lambda

In [None]:
standarize = lambda x: (x-x.mean()) / x.std()
standarize(df4).head()

#### Utilizando Sklearn.Preprocessing

In [None]:
from sklearn import preprocessing

# Get column names first
names = df4.columns

# Create the Scaler object
scaler = preprocessing.StandardScaler()

# Fit your data on the scaler object
scaled_df = scaler.fit_transform(df4)
scaled_df = pd.DataFrame(scaled_df, columns=names)

In [None]:
scaled_df.head()

![z-score e suas probabilidades](http://www.portalaction.com.br/sites/default/files/EstatisticaBasica/figuras/distribuicaoNormal/normal3.PNG)


# Avançado

## (6) Cálculo de probabilidade 

Sugira um procedimento para descobrirmos qual a probabilidade de um individuo ter peso menor que 20kg (não é necessário calcular, apenas descrever).

- Vamos supor que a probabilidade encontrada é p%, seria possível descobrir a probabilidade de encontrar um individuo com mais de 120kg através de p%?
- E se quisermos saber apenas a probabilidade de um individuo ter peso entre 70 e 120?

In [None]:
# probabilidade cumulativa até o peso de 20 Kg

peso_20 = 20

prob_20 = scipy.stats.norm(mean, std).cdf(peso_20)
prob_20

In [None]:
# Subtraimos de 1 a probabilidade cumulativa até o peso de 120 Kg

peso_120 = 120

prob_120 = 1 - scipy.stats.norm(mean, std).cdf(peso_120)
prob_120

In [None]:
# Para o intervalo de 70 Kg a 120 Kg

peso_70 = 70

prob_70 = 1 - scipy.stats.norm(mean, std).cdf(peso_70)
prob_70

prob_70 - prob_120

## Desafio - Homework

O número de vezes que um indivíduo tem gripe em determinado ano é uma
variável aleatória de Poisson com λ = 5. Suponha que um novo medicamento reduza
o parâmetro λ para 3 em 75% da população. Para os 25% restantes a droga não tem
um efeito significativo. Se um indivíduo toma o medicamento durante um ano e tem
duas gripes, qual a probabilidade de que o medicamento seja benéfico para ele
(ela)? Com base nesse resultado, se o indivíduo soubesse essa probabilidade a
priori, você acha que ele deveria continuar tomando o medicamento?

In [None]:
# Segundo POISSON, a probabilidade P_gripe de gripes em um indivíduo é:

X = 2  # número de gripes tomando medicamento 
l = 5  # número médio de gripes num intervalo específico (um ano)

P_gripe = ( l ** X ) * ( e ** -l ) / math.factorial(X)
P_gripe

In [None]:
# Segundo POISSON, a probabilidade P_med de gripes em um indivíduo tomando o novo medicamento é:

X = 2  # número de gripes tomando medicamento 
l = 3  # número médio de gripes num intervalo específico (um ano)

P_med = ( l ** X ) * ( e ** -l ) / math.factorial(X)
P_med

In [None]:
# Segundo o enunciado, P_med para lambda=3 temos 75%, e P_gripe para lambda=5 temos 25%
# Este será o nosso espaço amostral Ω

espaço_amostral = ( P_med*0.75 ) + ( P_gripe*0.25 )
espaço_amostral

In [None]:
# Portanto a nossa probabilidade é 75% de P3 para lambda=3 (toma o novo medicamento) dividido pelo espaço amostral total

prob_total = P_med*0.75 / espaço_amostral
prob_total