 ___
# Atividade: Modelos probabilísticos discretos
___

## Aula 12

**Referência de Leitura:**
1. Magalhães e Lima (7ª. Edição): Seções 3.2 e 3.3

**Hoje:**
1.	Descrever modelos discretos quanto aos resultados teóricos.
2.	Explicar a utilização de modelos probabilísticos no contexto da literatura estatística.
3.	Contrastar resultados teóricos e empíricos.
4.	Fechamento do conteúdo.

**Próxima aula:**
1. Leitura prévia necessária: Magalhães e Lima (7ª. Edição): Capítulo 6 - Seção 6.1.

___

In [9]:
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt

from scipy import stats #importa apenas as funções de estatísticas da biblioteca SciPy.
import itertools #importante para gerar todos os resultados possíveis!!


___
## <font color='blue'>Exercício 1</font>

### <font color='red'>**Publicar no github até dia 10/04 INDIVIDUAL **</font>


#### Este exercício irá explorar  construção de árvore de probabilidades com eventos e construção da distribuição de probabilidades de uma variável aleatória discreta. Ainda, irá explorar o modelo de distribuição probabilística Binomial

Um resistor de 100K Ohms comprado na Santa Efigênia tem probabilidade de falha de 5%, segundo um fabricante ruim.

Ainda, por suposição, admita que os resistores falhem de forma independente entre si.

Um aluno de engenharia compra um pacote contendo $n$ resistores.

1. Assuma $n=3$ e faça os itens a seguir.
  1. Monte o espaço amostral que combine todos os resultados possíveis de Falha e não Falha desses $n$ resistores. Ainda, calcule a probabilidade de cada resultado do espaço amostral acontecer.
  2. Se $Y$ representa o número de resistores que falham em um pacotinho com $n$ resistores, então construa a distribuição de probabilidades de $Y$.
  3. Calcule a média e o desvio padrão de $Y$. Interprete os resultados.
  4. Utilizando o modelo probabilístico da distribuição Binomial, encontre a distribuição de probabilidades de cada possível valor de $Y$. Calcule também $E(Y)$ e $Var(Y)$. Compare com as distribuições de probabilidades obtidas nos itens anteriores e discuta porque esses valores são iguais ou diferentes!
   
2. Assuma $n=7$ e repita os itens A) a D) anteriores. No caso de $n=7$ ou maiores quantidades de resistores em um pacotinho, qual a viabilidade de construir a distribuição de probabilidades do número de resistores com defeitos quando $n$ não é pequeno seguindo os itens de A) a C)?
 
3. Com $n=100$, por exemplo, é extremamente inviável a construção de árvore de probabilidades até mesmo utilizando a poderosa ferramenta Python. 
  1. No caso assuma $n=100$ e repita o item 1.D) anterior. 
  2. Ainda, calcule a probabilidade de, em um pacote com 100 resistores, pelo menos a metade deles apresentarem falha?


A seguir, um resumo sobre o modelo teórico Binomial!    
> 

> **DISTRIBUIÇÃO BINOMIAL - TEORIA:**

> É responsável por modelar uma variável $Y$ definida pelo Número de sucessos em $n$ tentativas, cuja probabilidade de sucesso é dada por $p$. Assim, dizemos que $Y$~$Bin(n,p)$ e lê-se: $Y$ segue uma distribuição binomial com $n$ tentativas e $p$ como probabilidade de sucesso. 

> A função de probabilidade nesse caso é dada por:
$P(Y=y)=\left(
\begin{array}{c}
    n \\
    y
\end{array}\right) p^y (1-p)^{(n-y)}$

> Para um experimento ter as probabilidade dos números de sucessos modeladas por uma distribuição Binomial, o mesmo precisa ter as seguintes propriedades:
* é uma contagem de $n$ repetições (ou tentativas ou ensaios) idênticas;
* cada repetição tem apenas 2 resultados possíveis: um é denominado sucesso e o outro, fracasso;
* a probabilidade de sucesso para cada ensaio é denominada $p$ e será constante em cada repetição. Então, a probabilidade de fracasso $(1-p)$ também não varia de tentativa para tentativa;
* As tentativas são independentes.


> **DISTRIBUIÇÃO BINOMIAL - PYTHON:** <sup> [https://en.wikipedia.org/wiki/SciPy]

> Algumas funções úteis para desenvolver seu código: <sup> [http://docs.scipy.org/doc/scipy-0.16.1/reference/generated/scipy.stats.binom.html]
* $P(Y=y)$: `stats.binom.pmf(y, n, p)`
* $P(Y\leq y)$: `stats.binom.cdf(y, n, p)`
* $E(Y)$ e $Var(Y)$: `stats.binom.stats(n, p, moments='mv')`



In [10]:
#item 1
n=3
#item 2
n=7

In [11]:
#A- espaço amostral

acontecimentos = ["S", "F"]

prob = {"S": 0.95, "F":0.05}

n=3

arranjos = itertools.product(acontecimentos, repeat=n)
EA = list(arranjos)

EA

[('S', 'S', 'S'),
 ('S', 'S', 'F'),
 ('S', 'F', 'S'),
 ('S', 'F', 'F'),
 ('F', 'S', 'S'),
 ('F', 'S', 'F'),
 ('F', 'F', 'S'),
 ('F', 'F', 'F')]

In [12]:
prob_EA = []

for i in EA:
    p = 1.0
    for e in i:
        p*=prob[e]
    prob_EA.append(p)
    print("Probabilidade de ",i," é igual a ","%3.5f"%p)

Probabilidade de  ('S', 'S', 'S')  é igual a  0.85737
Probabilidade de  ('S', 'S', 'F')  é igual a  0.04512
Probabilidade de  ('S', 'F', 'S')  é igual a  0.04512
Probabilidade de  ('S', 'F', 'F')  é igual a  0.00238
Probabilidade de  ('F', 'S', 'S')  é igual a  0.04512
Probabilidade de  ('F', 'S', 'F')  é igual a  0.00238
Probabilidade de  ('F', 'F', 'S')  é igual a  0.00238
Probabilidade de  ('F', 'F', 'F')  é igual a  0.00013


In [13]:
#distribuição probs

# Dicionário para acumular a variável aleatória. 
val_Y = {}

for i in range(len(EA)):
    y = EA[i].count("F")
    # Checar antes se a chave está no dicionário
    if y in val_Y:
        val_Y[y] += prob_EA[i]
    else:
        val_Y[y] = prob_EA[i]
        
print("Distribuição de probabilidades dos resistores que falharam")
print('')
for y in val_Y:
    print("Falhas: ", y, " Probabilidade", "%6.5f "%val_Y[y])

Distribuição de probabilidades dos resistores que falharam

Falhas:  0  Probabilidade 0.85737 
Falhas:  1  Probabilidade 0.13537 
Falhas:  2  Probabilidade 0.00713 
Falhas:  3  Probabilidade 0.00013 


In [15]:
#C- media e desvio

media = 0.85737*0 +  0.13537*1 + 0.00713 *2 + 0.00013* 3

Var = 0
for i in val_Y:
    Var = Var+(i-media)**2*val_Y[i]
desvio = (Var)**(1/2)

print('Média:',media,'Desvio Padrão:',desvio)

Média: 0.15002 Desvio Padrão: 0.37749172229335043


In [16]:
#D-distribuiçao de falhas para n=3

n=3
for i in range(4):
    prob2 = stats.binom.pmf(i, n, p)
    print(prob2)

0.9996250468730469
0.00037490625585937475
4.6869140625000114e-08
1.9531249999999965e-12


In [17]:
#esperança

E,Var = stats.binom.stats(n, p, moments='mv')
print(E) #E(Y)
print(Var) #Var(Y)

0.0003750000000000001
0.0003749531250000001


In [18]:
#exercio2

acontecimentos = ["S", "F"]

prob = {"S": 0.95, "F":0.05}

n=7

arranjos = itertools.product(acontecimentos, repeat=n)
EA = list(arranjos)

EA

[('S', 'S', 'S', 'S', 'S', 'S', 'S'),
 ('S', 'S', 'S', 'S', 'S', 'S', 'F'),
 ('S', 'S', 'S', 'S', 'S', 'F', 'S'),
 ('S', 'S', 'S', 'S', 'S', 'F', 'F'),
 ('S', 'S', 'S', 'S', 'F', 'S', 'S'),
 ('S', 'S', 'S', 'S', 'F', 'S', 'F'),
 ('S', 'S', 'S', 'S', 'F', 'F', 'S'),
 ('S', 'S', 'S', 'S', 'F', 'F', 'F'),
 ('S', 'S', 'S', 'F', 'S', 'S', 'S'),
 ('S', 'S', 'S', 'F', 'S', 'S', 'F'),
 ('S', 'S', 'S', 'F', 'S', 'F', 'S'),
 ('S', 'S', 'S', 'F', 'S', 'F', 'F'),
 ('S', 'S', 'S', 'F', 'F', 'S', 'S'),
 ('S', 'S', 'S', 'F', 'F', 'S', 'F'),
 ('S', 'S', 'S', 'F', 'F', 'F', 'S'),
 ('S', 'S', 'S', 'F', 'F', 'F', 'F'),
 ('S', 'S', 'F', 'S', 'S', 'S', 'S'),
 ('S', 'S', 'F', 'S', 'S', 'S', 'F'),
 ('S', 'S', 'F', 'S', 'S', 'F', 'S'),
 ('S', 'S', 'F', 'S', 'S', 'F', 'F'),
 ('S', 'S', 'F', 'S', 'F', 'S', 'S'),
 ('S', 'S', 'F', 'S', 'F', 'S', 'F'),
 ('S', 'S', 'F', 'S', 'F', 'F', 'S'),
 ('S', 'S', 'F', 'S', 'F', 'F', 'F'),
 ('S', 'S', 'F', 'F', 'S', 'S', 'S'),
 ('S', 'S', 'F', 'F', 'S', 'S', 'F'),
 ('S', 'S', 

In [20]:
prob_EA = []

for i in EA:
    p = 1.0
    for e in i:
        p*=prob[e]
    prob_EA.append(p)
    print("Probabilidade de ",i," é igual a ","%3.5f"%p)

Probabilidade de  ('S', 'S', 'S', 'S', 'S', 'S', 'S')  é igual a  0.69834
Probabilidade de  ('S', 'S', 'S', 'S', 'S', 'S', 'F')  é igual a  0.03675
Probabilidade de  ('S', 'S', 'S', 'S', 'S', 'F', 'S')  é igual a  0.03675
Probabilidade de  ('S', 'S', 'S', 'S', 'S', 'F', 'F')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'S', 'F', 'S', 'S')  é igual a  0.03675
Probabilidade de  ('S', 'S', 'S', 'S', 'F', 'S', 'F')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'S', 'F', 'F', 'S')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'S', 'F', 'F', 'F')  é igual a  0.00010
Probabilidade de  ('S', 'S', 'S', 'F', 'S', 'S', 'S')  é igual a  0.03675
Probabilidade de  ('S', 'S', 'S', 'F', 'S', 'S', 'F')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'F', 'S', 'F', 'S')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'F', 'S', 'F', 'F')  é igual a  0.00010
Probabilidade de  ('S', 'S', 'S', 'F', 'F', 'S', 'S')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'F',

In [21]:
#B-distribuição probs

# Dicionário para acumular a variável aleatória. 
val_Y = {}

for i in range(len(EA)):
    y = EA[i].count("F")
    # Checar antes se a chave está no dicionário
    if y in val_Y:
        val_Y[y] += prob_EA[i]
    else:
        val_Y[y] = prob_EA[i]
        
print("Distribuição de probabilidades dos resistores que falharam")
print('')
for y in val_Y:
    print("Falhas: ", y, " Probabilidade", "%6.5f "%val_Y[y])

Distribuição de probabilidades dos resistores que falharam

Falhas:  0  Probabilidade 0.69834 
Falhas:  1  Probabilidade 0.25728 
Falhas:  2  Probabilidade 0.04062 
Falhas:  3  Probabilidade 0.00356 
Falhas:  4  Probabilidade 0.00019 
Falhas:  5  Probabilidade 0.00001 
Falhas:  6  Probabilidade 0.00000 
Falhas:  7  Probabilidade 0.00000 


In [22]:
#C- media e desvio

media = 0.69834*0 +  0.25728*1 + 0.04062 *2 + 0.00356* 3 + 0.00019*4 + 0.00001*5 + 0.00000*6 + 0.00000*7

Var = 0
for i in val_Y:
    Var = Var+(i-media)**2*val_Y[i]
desvio = (Var)**(1/2)

print('Média:',media,'Desvio Padrão:',desvio)

Média: 0.35001000000000004 Desvio Padrão: 0.5766281298202507


In [23]:
#D-distribuiçao de falhas para n=7

n=7
for i in range(4):
    prob3 = stats.binom.pmf(i, n, p)
    print(prob3)

0.99999999453125
5.4687499743652275e-09
1.281738276243209e-17
1.6689300484955317e-26


In [24]:
n = 7
p = 0.05
E,Var = stats.binom.stats(n, p, moments='mv')
print(E) #E(Y)
print(Var) #Var(Y)

0.35000000000000003
0.3325


In [25]:
#3-A-distribuiçao de falhas para n=100


n=100
for i in range(101):
    prob4 = stats.binom.pmf(i, n, p)
    print(prob4)

0.005920529220334023
0.031160680107020593
0.08118177185776551
0.1395756779308903
0.17814264156968956
0.18001782727043672
0.15001485605869255
0.10602553736478391
0.06487088799292766
0.034901296464031804
0.016715884095931225
0.007198227601119233
0.0028098344583314945
0.001001074624830605
0.00032741914421153287
9.880016281470898e-05
2.762504552384916e-05
7.184222365335237e-06
1.7435393459730753e-06
3.960394082265668e-07
8.441892649039948e-08
1.6926100549455788e-08
3.1989520177198604e-09
5.709799940094749e-10
9.641548144458742e-11
1.5426477031134177e-11
2.342076472338194e-12
3.378433897719589e-13
4.635820949878521e-14
6.057697066992019e-15
7.545552486954989e-16
8.967549644937655e-17
1.0176988906261349e-17
1.103724474682234e-18
1.1447297183237642e-19
1.136122727960414e-20
1.0796487911904692e-21
9.828950588362538e-23
8.57650813111966e-24
7.176025696753232e-25
5.759704835551648e-26
4.4362296551107064e-27
3.2799191685654777e-28
2.3284615884552994e-29
1.5875874466740437e-30
1.0398233568858872e-

In [26]:
n=100
p = 0.05
E,Var = stats.binom.stats(n, p, moments='mv')
print(E) #E(Y)
print(Var) #Var(Y)

5.0
4.75


In [27]:
#B-Probabilidade de metade dos resistores apresentarem falha

n = 100
p = 0.05
prob in range (49)
print('A probabilidade de metade falhar é de: {0}'.format(stats.binom.cdf(y, n, p)))

A probabilidade de metade falhar é de: 0.8720395213796206


___
## <font color='blue'>Exercício 2</font>

Esse exercício irá explorar modelos de distribuição de Poisson.

Uma fábrica produz determinado veículo. O gerente de vendas fechou um negócio que implica na produção de pelo menos 110 unidades nos próximos dois meses. Para isso, será construída uma nova linha de montagem com capacidade para produzir em média 50 veículos por mês (considere meses de 30 dias). A linha funcionará ininterruptamente. Além disso, apenas um veículo é produzido por vez. Considere que um modelo Poisson seja adequado para a quantidade de veículos produzidos.
   1. Qual a probabilidade  da produção ser igual a 100 veículos nos próximos dois meses?
   2. Qual a probabilidade  da produção ser de pelo menos 100 veículos nos próximos dois meses?
   3. Qual a probabilidade da produção ser entre 100 e 110 veículos nos próximos dois meses?
   4. Se forem produzidos de pelo menos 100 veículos no próximo mês, qual a probabilidade do gerente cumprir a meta negociada?
   5. Caso o prazo seja cumprido, o lucro será da ordem de $250$ mil, caso não seja, o lucro cai para $200$ mil. Qual é o lucro esperado e seu desvio-padrão?

**Observação:** Explore os comandos de `stats.poisson`. <sup>[http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.poisson.html]
