 ___
# Atividade: Modelos probabilísticos discretos
___

## Aula 12

**Referência de Leitura:**
1. Magalhães e Lima (7ª. Edição): Seções 3.2 e 3.3

**Hoje:**
1.	Descrever modelos discretos quanto aos resultados teóricos.
2.	Explicar a utilização de modelos probabilísticos no contexto da literatura estatística.
3.	Contrastar resultados teóricos e empíricos.
4.	Fechamento do conteúdo.

**Próxima aula:**
1. Leitura prévia necessária: Magalhães e Lima (7ª. Edição): Capítulo 6 - Seção 6.1.

___

In [1]:
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
import math

from scipy import stats #importa apenas as funções de estatísticas da biblioteca SciPy.
import itertools #importante para gerar todos os resultados possíveis!!


___
## <font color='blue'>Exercício 1</font>

### <font color='red'>**Publicar no github até dia 10/04 INDIVIDUAL **</font>


#### Este exercício irá explorar  construção de árvore de probabilidades com eventos e construção da distribuição de probabilidades de uma variável aleatória discreta. Ainda, irá explorar o modelo de distribuição probabilística Binomial

Um resistor de 100K Ohms comprado na Santa Efigênia tem probabilidade de falha de 5%, segundo um fabricante ruim.

Ainda, por suposição, admita que os resistores falhem de forma independente entre si.

Um aluno de engenharia compra um pacote contendo $n$ resistores.

1. Assuma $n=3$ e faça os itens a seguir.
  1. Monte o espaço amostral que combine todos os resultados possíveis de Falha e não Falha desses $n$ resistores. Ainda, calcule a probabilidade de cada resultado do espaço amostral acontecer.
  2. Se $Y$ representa o número de resistores que falham em um pacotinho com $n$ resistores, então construa a distribuição de probabilidades de $Y$.
  3. Calcule a média e o desvio padrão de $Y$. Interprete os resultados.
  4. Utilizando o modelo probabilístico da distribuição Binomial, encontre a distribuição de probabilidades de cada possível valor de $Y$. Calcule também $E(Y)$ e $Var(Y)$. Compare com as distribuições de probabilidades obtidas nos itens anteriores e discuta porque esses valores são iguais ou diferentes!
   
2. Assuma $n=7$ e repita os itens A) a D) anteriores. No caso de $n=7$ ou maiores quantidades de resistores em um pacotinho, qual a viabilidade de construir a distribuição de probabilidades do número de resistores com defeitos quando $n$ não é pequeno seguindo os itens de A) a C)?
 
3. Com $n=100$, por exemplo, é extremamente inviável a construção de árvore de probabilidades até mesmo utilizando a poderosa ferramenta Python. 
  1. No caso assuma $n=100$ e repita o item 1.D) anterior. 
  2. Ainda, calcule a probabilidade de, em um pacote com 100 resistores, pelo menos a metade deles apresentarem falha?


A seguir, um resumo sobre o modelo teórico Binomial!    
> 

> **DISTRIBUIÇÃO BINOMIAL - TEORIA:**

> É responsável por modelar uma variável $Y$ definida pelo Número de sucessos em $n$ tentativas, cuja probabilidade de sucesso é dada por $p$. Assim, dizemos que $Y$~$Bin(n,p)$ e lê-se: $Y$ segue uma distribuição binomial com $n$ tentativas e $p$ como probabilidade de sucesso. 

> A função de probabilidade nesse caso é dada por:
$P(Y=y)=\left(
\begin{array}{c}
    n \\
    y
\end{array}\right) p^y (1-p)^{(n-y)}$

> Para um experimento ter as probabilidade dos números de sucessos modeladas por uma distribuição Binomial, o mesmo precisa ter as seguintes propriedades:
* é uma contagem de $n$ repetições (ou tentativas ou ensaios) idênticas;
* cada repetição tem apenas 2 resultados possíveis: um é denominado sucesso e o outro, fracasso;
* a probabilidade de sucesso para cada ensaio é denominada $p$ e será constante em cada repetição. Então, a probabilidade de fracasso $(1-p)$ também não varia de tentativa para tentativa;
* As tentativas são independentes.


> **DISTRIBUIÇÃO BINOMIAL - PYTHON:** <sup> [https://en.wikipedia.org/wiki/SciPy]

> Algumas funções úteis para desenvolver seu código: <sup> [http://docs.scipy.org/doc/scipy-0.16.1/reference/generated/scipy.stats.binom.html]
* $P(Y=y)$: `stats.binom.pmf(y, n, p)`
* $P(Y\leq y)$: `stats.binom.cdf(y, n, p)`
* $E(Y)$ e $Var(Y)$: `stats.binom.stats(n, p, moments='mv')`



## A)

In [2]:
possibilidades = ["S", "F"]
prob = {"S": 0.95, "F":0.05}
n=3
arranjos = itertools.product(possibilidades, repeat=n)
espaco_amostral = list(arranjos)
espaco_amostral

[('S', 'S', 'S'),
 ('S', 'S', 'F'),
 ('S', 'F', 'S'),
 ('S', 'F', 'F'),
 ('F', 'S', 'S'),
 ('F', 'S', 'F'),
 ('F', 'F', 'S'),
 ('F', 'F', 'F')]

In [3]:
prob_linhas = []

for res in espaco_amostral:
    p = 1.0
    for e in res:
        p*=prob[e]
    prob_linhas.append(p)
    print("Probabilidade de ",res," é igual a ","%3.5f"%p)

Probabilidade de  ('S', 'S', 'S')  é igual a  0.85737
Probabilidade de  ('S', 'S', 'F')  é igual a  0.04512
Probabilidade de  ('S', 'F', 'S')  é igual a  0.04512
Probabilidade de  ('S', 'F', 'F')  é igual a  0.00238
Probabilidade de  ('F', 'S', 'S')  é igual a  0.04512
Probabilidade de  ('F', 'S', 'F')  é igual a  0.00238
Probabilidade de  ('F', 'F', 'S')  é igual a  0.00238
Probabilidade de  ('F', 'F', 'F')  é igual a  0.00013


## B)

In [4]:
valores_Y = {}
for i in range(len(espaco_amostral)):
    y = espaco_amostral[i].count("F")
    # Checar antes se a chave está no dicionário
    if y in valores_Y:
        valores_Y[y] += prob_linhas[i]
    else:
        valores_Y[y] = prob_linhas[i]
print('')
for y in valores_Y:
    print("Resistores Falhos: ", y, " Probabilidade", "%6.5f "%valores_Y[y])


Resistores Falhos:  0  Probabilidade 0.85737 
Resistores Falhos:  1  Probabilidade 0.13537 
Resistores Falhos:  2  Probabilidade 0.00713 
Resistores Falhos:  3  Probabilidade 0.00013 


## C)

In [5]:
media=0
var=0
for y in valores_Y:
    media+=(y*valores_Y[y])
for y in valores_Y:
    var+=((y-media)**2)*valores_Y[y]
dp=math.sqrt(var)
print("média: ",media)
print("desvio padrão: ",dp)

média:  0.15
desvio padrão:  0.37749172176353746


## D)

In [6]:
print("Probabilidades:")
for i in range(4):
    print(stats.binom.pmf(i, 3, 0.05))
print("")
print("Média e variância")
stats.binom.stats(3, 0.05, moments='mv')

Probabilidades:
0.857375
0.135375
0.007125000000000007
0.000125

Média e variância


(array(0.15), array(0.1425))

## 2)

In [7]:
possibilidades = ["S", "F"]
prob = {"S": 0.95, "F":0.05}
n=7
arranjos = itertools.product(possibilidades, repeat=n)
espaco_amostral = list(arranjos)
espaco_amostral

[('S', 'S', 'S', 'S', 'S', 'S', 'S'),
 ('S', 'S', 'S', 'S', 'S', 'S', 'F'),
 ('S', 'S', 'S', 'S', 'S', 'F', 'S'),
 ('S', 'S', 'S', 'S', 'S', 'F', 'F'),
 ('S', 'S', 'S', 'S', 'F', 'S', 'S'),
 ('S', 'S', 'S', 'S', 'F', 'S', 'F'),
 ('S', 'S', 'S', 'S', 'F', 'F', 'S'),
 ('S', 'S', 'S', 'S', 'F', 'F', 'F'),
 ('S', 'S', 'S', 'F', 'S', 'S', 'S'),
 ('S', 'S', 'S', 'F', 'S', 'S', 'F'),
 ('S', 'S', 'S', 'F', 'S', 'F', 'S'),
 ('S', 'S', 'S', 'F', 'S', 'F', 'F'),
 ('S', 'S', 'S', 'F', 'F', 'S', 'S'),
 ('S', 'S', 'S', 'F', 'F', 'S', 'F'),
 ('S', 'S', 'S', 'F', 'F', 'F', 'S'),
 ('S', 'S', 'S', 'F', 'F', 'F', 'F'),
 ('S', 'S', 'F', 'S', 'S', 'S', 'S'),
 ('S', 'S', 'F', 'S', 'S', 'S', 'F'),
 ('S', 'S', 'F', 'S', 'S', 'F', 'S'),
 ('S', 'S', 'F', 'S', 'S', 'F', 'F'),
 ('S', 'S', 'F', 'S', 'F', 'S', 'S'),
 ('S', 'S', 'F', 'S', 'F', 'S', 'F'),
 ('S', 'S', 'F', 'S', 'F', 'F', 'S'),
 ('S', 'S', 'F', 'S', 'F', 'F', 'F'),
 ('S', 'S', 'F', 'F', 'S', 'S', 'S'),
 ('S', 'S', 'F', 'F', 'S', 'S', 'F'),
 ('S', 'S', 

In [8]:
prob_linhas = []

for res in espaco_amostral:
    p = 1.0
    for e in res:
        p*=prob[e]
    prob_linhas.append(p)
    print("Probabilidade de ",res," é igual a ","%3.5f"%p)

Probabilidade de  ('S', 'S', 'S', 'S', 'S', 'S', 'S')  é igual a  0.69834
Probabilidade de  ('S', 'S', 'S', 'S', 'S', 'S', 'F')  é igual a  0.03675
Probabilidade de  ('S', 'S', 'S', 'S', 'S', 'F', 'S')  é igual a  0.03675
Probabilidade de  ('S', 'S', 'S', 'S', 'S', 'F', 'F')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'S', 'F', 'S', 'S')  é igual a  0.03675
Probabilidade de  ('S', 'S', 'S', 'S', 'F', 'S', 'F')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'S', 'F', 'F', 'S')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'S', 'F', 'F', 'F')  é igual a  0.00010
Probabilidade de  ('S', 'S', 'S', 'F', 'S', 'S', 'S')  é igual a  0.03675
Probabilidade de  ('S', 'S', 'S', 'F', 'S', 'S', 'F')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'F', 'S', 'F', 'S')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'F', 'S', 'F', 'F')  é igual a  0.00010
Probabilidade de  ('S', 'S', 'S', 'F', 'F', 'S', 'S')  é igual a  0.00193
Probabilidade de  ('S', 'S', 'S', 'F',

In [9]:
valores_Y = {}
for i in range(len(espaco_amostral)):
    y = espaco_amostral[i].count("F")
    # Checar antes se a chave está no dicionário
    if y in valores_Y:
        valores_Y[y] += prob_linhas[i]
    else:
        valores_Y[y] = prob_linhas[i]
print('')
for y in valores_Y:
    print("Resistores Falhos: ", y, " Probabilidade", "%6.5f "%valores_Y[y])


Resistores Falhos:  0  Probabilidade 0.69834 
Resistores Falhos:  1  Probabilidade 0.25728 
Resistores Falhos:  2  Probabilidade 0.04062 
Resistores Falhos:  3  Probabilidade 0.00356 
Resistores Falhos:  4  Probabilidade 0.00019 
Resistores Falhos:  5  Probabilidade 0.00001 
Resistores Falhos:  6  Probabilidade 0.00000 
Resistores Falhos:  7  Probabilidade 0.00000 


In [10]:
media=0
var=0
for y in valores_Y:
    media+=(y*valores_Y[y])
for y in valores_Y:
    var+=((y-media)**2)*valores_Y[y]
dp=math.sqrt(var)
print("média: ",media)
print("desvio padrão: ",dp)

média:  0.35
desvio padrão:  0.5766281297335397


In [14]:
print("Probabilidades:")
for i in range(8):
    print(stats.binom.pmf(i, 7, 0.05))
print("")
print("Média e variância")
stats.binom.stats(7, 0.05, moments='mv')

Probabilidades:
0.69833729609375
0.2572821617187501
0.04062349921875004
0.00356346484375
0.00018755078124999986
5.922656250000019e-06
1.0390624999999968e-07
7.812500000000004e-10

Média e variância


(array(0.35), array(0.3325))

## 3)

In [15]:
print("Probabilidades:")
for i in range(101):
    print(stats.binom.pmf(i, 100, 0.05))

Probabilidades:
0.005920529220334023
0.031160680107020593
0.08118177185776551
0.1395756779308903
0.17814264156968956
0.18001782727043672
0.15001485605869255
0.10602553736478391
0.06487088799292766
0.034901296464031804
0.016715884095931225
0.007198227601119233
0.0028098344583314945
0.001001074624830605
0.00032741914421153287
9.880016281470898e-05
2.762504552384916e-05
7.184222365335237e-06
1.7435393459730753e-06
3.960394082265668e-07
8.441892649039948e-08
1.6926100549455788e-08
3.1989520177198604e-09
5.709799940094749e-10
9.641548144458742e-11
1.5426477031134177e-11
2.342076472338194e-12
3.378433897719589e-13
4.635820949878521e-14
6.057697066992019e-15
7.545552486954989e-16
8.967549644937655e-17
1.0176988906261349e-17
1.103724474682234e-18
1.1447297183237642e-19
1.136122727960414e-20
1.0796487911904692e-21
9.828950588362538e-23
8.57650813111966e-24
7.176025696753232e-25
5.759704835551648e-26
4.4362296551107064e-27
3.2799191685654777e-28
2.3284615884552994e-29
1.5875874466740437e-30
1.03

In [16]:
print("Média e variância")
stats.binom.stats(100, 0.05, moments='mv')

Média e variância


(array(5.), array(4.75))

In [18]:
soma=0
for i in range(101):
    if i > 49:
        soma+=stats.binom.pmf(i, 100, 0.05)
print("Probabilidade de pelo menos 50 resistores falharem")
print(soma)

Probabilidade de pelo menos 50 resistores falharem
7.269307456113816e-38
