 ___
# Atividade: Modelos probabilísticos discretos
___

## Aula 12

**Referência de Leitura:**
1. Magalhães e Lima (7ª. Edição): Seções 3.2 e 3.3

**Hoje:**
1.	Descrever modelos discretos quanto aos resultados teóricos.
2.	Explicar a utilização de modelos probabilísticos no contexto da literatura estatística.
3.	Contrastar resultados teóricos e empíricos.
4.	Fechamento do conteúdo.

**Próxima aula:**
1. Leitura prévia necessária: Magalhães e Lima (7ª. Edição): Capítulo 6 - Seção 6.1.

___

In [15]:
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt

from scipy import stats #importa apenas as funções de estatísticas da biblioteca SciPy.
import itertools #importante para gerar todos os resultados possíveis!!


___
## <font color='blue'>Exercício 1</font>

### <font color='red'>**Publicar no github até dia 10/04 INDIVIDUAL **</font>


#### Este exercício irá explorar  construção de árvore de probabilidades com eventos e construção da distribuição de probabilidades de uma variável aleatória discreta. Ainda, irá explorar o modelo de distribuição probabilística Binomial

Um resistor de 100K Ohms comprado na Santa Efigênia tem probabilidade de falha de 5%, segundo um fabricante ruim.

Ainda, por suposição, admita que os resistores falhem de forma independente entre si.

Um aluno de engenharia compra um pacote contendo $n$ resistores.

1. Assuma $n=3$ e faça os itens a seguir.
  1. Monte o espaço amostral que combine todos os resultados possíveis de Falha e não Falha desses $n$ resistores. Ainda, calcule a probabilidade de cada resultado do espaço amostral acontecer.
  2. Se $Y$ representa o número de resistores que falham em um pacotinho com $n$ resistores, então construa a distribuição de probabilidades de $Y$.
  3. Calcule a média e o desvio padrão de $Y$. Interprete os resultados.
  4. Utilizando o modelo probabilístico da distribuição Binomial, encontre a distribuição de probabilidades de cada possível valor de $Y$. Calcule também $E(Y)$ e $Var(Y)$. Compare com as distribuições de probabilidades obtidas nos itens anteriores e discuta porque esses valores são iguais ou diferentes!
   
2. Assuma $n=7$ e repita os itens A) a D) anteriores. No caso de $n=7$ ou maiores quantidades de resistores em um pacotinho, qual a viabilidade de construir a distribuição de probabilidades do número de resistores com defeitos quando $n$ não é pequeno seguindo os itens de A) a C)?
 
3. Com $n=100$, por exemplo, é extremamente inviável a construção de árvore de probabilidades até mesmo utilizando a poderosa ferramenta Python. 
  1. No caso assuma $n=100$ e repita o item 1.D) anterior. 
  2. Ainda, calcule a probabilidade de, em um pacote com 100 resistores, pelo menos a metade deles apresentarem falha?


A seguir, um resumo sobre o modelo teórico Binomial!    
> 

> **DISTRIBUIÇÃO BINOMIAL - TEORIA:**

> É responsável por modelar uma variável $Y$ definida pelo Número de sucessos em $n$ tentativas, cuja probabilidade de sucesso é dada por $p$. Assim, dizemos que $Y$~$Bin(n,p)$ e lê-se: $Y$ segue uma distribuição binomial com $n$ tentativas e $p$ como probabilidade de sucesso. 

> A função de probabilidade nesse caso é dada por:
$P(Y=y)=\left(
\begin{array}{c}
    n \\
    y
\end{array}\right) p^y (1-p)^{(n-y)}$

> Para um experimento ter as probabilidade dos números de sucessos modeladas por uma distribuição Binomial, o mesmo precisa ter as seguintes propriedades:
* é uma contagem de $n$ repetições (ou tentativas ou ensaios) idênticas;
* cada repetição tem apenas 2 resultados possíveis: um é denominado sucesso e o outro, fracasso;
* a probabilidade de sucesso para cada ensaio é denominada $p$ e será constante em cada repetição. Então, a probabilidade de fracasso $(1-p)$ também não varia de tentativa para tentativa;
* As tentativas são independentes.


> **DISTRIBUIÇÃO BINOMIAL - PYTHON:** <sup> [https://en.wikipedia.org/wiki/SciPy]

> Algumas funções úteis para desenvolver seu código: <sup> [http://docs.scipy.org/doc/scipy-0.16.1/reference/generated/scipy.stats.binom.html]
* $P(Y=y)$: `stats.binom.pmf(y, n, p)`
* $P(Y\leq y)$: `stats.binom.cdf(y, n, p)`
* $E(Y)$ e $Var(Y)$: `stats.binom.stats(n, p, moments='mv')`



In [75]:
print("Item 1:\n")
print('a)')
n=3
prob = {"S": 0.95, "F":0.05}
possibilidades = ["S", "F"]
arranjos = itertools.product(possibilidades, repeat=n)
espaco_amostral = list(arranjos)
print("Espaço Amostral:{}\n".format(espaco_amostral))

print('b)')
#distribuição de probabilidades de  Y
prob_linhas = []

for i in espaco_amostral:
    p = 1.0
    for e in i:
        p*=prob[e]
    prob_linhas.append(p)
    print("Probabilidade de ",i," é igual a ","%3.5f"%p)

print('\nc)')
#média
média=prob_linhas[0]*0+prob_linhas[1]*3*1+prob_linhas[3]*3*2+prob_linhas[7]*3
print("Média: {}".format(média))

#dp
dp=(((0-média)**2)*prob_linhas[0]+((1-média)**2)*prob_linhas[1]*3+((2-média)**2)*prob_linhas[3]*3+((3-média)**2)*prob_linhas[7])**(1/2)
print("Desvio Padrão: {}\n".format(dp))

print('d)')
s3=stats.binom.pmf(3,3,0.95)
s2f1=stats.binom.pmf(2,3,0.95)
s1f2=stats.binom.pmf(1,3,0.95)
f3=stats.binom.pmf(0,3,0.95)

print("Modelo de distribuição binomial:\n Probabilidades:\n 3 sucessos:{}\n 2 sucessos:{}\n 1 sucesso:{}\n 3 fracassos:{}".format(s3,s2f1,s1f2,f3) )
resultado=stats.binom.stats(3,0.05,moments='mv')
print("\nE(Y):{}, Var(Y){}".format(resultado[0],resultado[1]) )

#-------------------------------------------------------------------------------------------------------------------------------

print("\n\nItem 2:\n")
n2=7

print('a)')
prob = {"S": 0.95, "F":0.05}
possibilidades = ["S", "F"]
arranjos2 = itertools.product(possibilidades, repeat=7)
espaco_amostral2 = list(arranjos2)
print("Espaço Amostral:{}\n".format(espaco_amostral2))

print('b)')
#distribuição de probabilidades de  Y
prob_linhas2 = []

for i in espaco_amostral2:
    p = 1.0
    for e in i:
        p*=prob[e]
    prob_linhas2.append(p)
    print("Probabilidade de ",i," é igual a ","%3.5f"%p)

print('\nc)')

prob_s7=0
prob_s6=0
prob_s5=0
prob_s4=0
prob_s3=0
prob_s2=0
prob_s1=0
prob_s0=0

for i in range (len(espaco_amostral2)):
    s=0
    f=0
    for letra in espaco_amostral2[i]:
        if letra=="S":
            s=s+1
        if letra=='F':
            f=f+1
    if s==7:
        prob_s7+=prob_linhas2[i]
    if s==6:
        prob_s6+=prob_linhas2[i]
    if s==5:
        prob_s5+=prob_linhas2[i]
    if s==4:
        prob_s4+=prob_linhas2[i]
    if s==3:
        prob_s3+=prob_linhas2[i]
    if s==2:
        prob_s2+=prob_linhas2[i]
    if s==1:
        prob_s1+=prob_linhas2[i]
    if s==0:
        prob_s0+=prob_linhas2[i]
            
#média
média2=prob_s7*0+prob_s6*1+prob_s5*2+prob_s4*3+prob_s3*4+prob_s2*5+prob_s1*6+prob_s0*7
print("Média: {}".format(média2))

#dp
dp2=(((0-média2)**2)*prob_s7+((1-média2)**2)*prob_s6+((2-média2)**2)*prob_s5+((3-média2)**2)*prob_s4+((4-média2)**2)*prob_s3+((5-média2)**2)*prob_s2+((6-média2)**2)*prob_s1+((7-média2)**2)*prob_s0)**(1/2)
print("Desvio Padrão: {}\n".format(dp2))

print('d)')
s7=stats.binom.pmf(7,7,0.95)
s6f1=stats.binom.pmf(6,7,0.95)
s5f2=stats.binom.pmf(5,7,0.95)
s4f3=stats.binom.pmf(4,7,0.95)
s3f4=stats.binom.pmf(3,7,0.95)
s2f5=stats.binom.pmf(2,7,0.95)
s1f6=stats.binom.pmf(1,7,0.95)
f7=stats.binom.pmf(0,37,0.95)

print("Modelo de distribuição binomial:\n Probabilidades:\n 7 sucessos:{}\n 6 sucessos:{}\n 5 sucessos:{}\n 4 sucessos:{}\n 3 sucessos:{}\n 2 sucessos:{}\n 1 sucesso:{}\n 7 fracassos:{}".format(s7,s6f1,s5f2,s4f3,s3f4,s2f5,s1f6,f7) )
resultado2=stats.binom.stats(7,0.05,moments='mv')
print("\nE(Y):{}, Var(Y){}".format(resultado2[0],resultado2[1]) )


print("\n\nItem 3:\n")
resultado100=stats.binom.stats(100,0.05,moments='mv')
print("E(Y):{}, Var(Y){}".format(resultado100[0],resultado100[1]) )

Item 1:

a)
Espaço Amostral:[('S', 'S', 'S'), ('S', 'S', 'F'), ('S', 'F', 'S'), ('S', 'F', 'F'), ('F', 'S', 'S'), ('F', 'S', 'F'), ('F', 'F', 'S'), ('F', 'F', 'F')]

b)
Probabilidade de  ('S', 'S', 'S')  é igual a  0.85737
Probabilidade de  ('S', 'S', 'F')  é igual a  0.04512
Probabilidade de  ('S', 'F', 'S')  é igual a  0.04512
Probabilidade de  ('S', 'F', 'F')  é igual a  0.00238
Probabilidade de  ('F', 'S', 'S')  é igual a  0.04512
Probabilidade de  ('F', 'S', 'F')  é igual a  0.00238
Probabilidade de  ('F', 'F', 'S')  é igual a  0.00238
Probabilidade de  ('F', 'F', 'F')  é igual a  0.00013

c)
Média: 0.15
Desvio Padrão: 0.37749172176353746

d)
Modelo de distribuição binomial:
 Probabilidades:
 3 sucessos:0.8573749999999999
 2 sucessos:0.1353750000000001
 1 sucesso:0.007125000000000013
 3 fracassos:0.00012500000000000044

E(Y):0.15000000000000002, Var(Y)0.14250000000000002


Item 2:

a)
Espaço Amostral:[('S', 'S', 'S', 'S', 'S', 'S', 'S'), ('S', 'S', 'S', 'S', 'S', 'S', 'F'), ('S', 