# Probabilidade
* **Espaço Amostral**: todos os resultados possíveis (moeda: K,C)
* **Probabilidade**: chance de um evento ocorrer
    * Escala de 0 a 1
        * 0 ==> certo de que **não vai acontecer**
        * 1 ==> certo que **vai acontecer**
        * 0.5 ==> **igualmente** possível de acontecer ou de não acontecer
        * Ex1: **0.05 provavelmente não** vai acontecer, mas pode acontecer
        * Ex2: **0.95 provavelmente vai** acontecer, mas pode não acontecer



<br><strong>Probabilidade Teórica</strong>: o que a gente espera que aconteça ou o que deveria acontecer
$$P(E) = {\frac {resultados} {espaço amostral}}$$

<center>Ex: Jogar uma moeda pro alto. Se quero cara.</center>
$$P(K) = {\frac {1} {2}}=0.5$$

<br><strong>Probabilidade Empírica</strong>: a chance de algo acontecer baseado no que aconteceu em algum experimento

<center>Ex: Jogar uma moeda pro alto 100 vezes. Obtenho 56 caras.</center>
$$P(K) = {\frac {56} {100}}=0.56$$

In [1]:
import numpy as np

In [2]:
# Theoretical Probability
# result target
# sample space
def theor_prob(results:float, sample_space:float)->float:
    return results/sample_space

In [3]:
def experiment(choices:list, target:str, n_experiment:int)->dict:
    dct_results = {choice:0 for choice in choices}
    
    for _ in range(n_experiment):
        dct_results[np.random.choice(choices)]+=1
        
    dct_results = {'Results':dct_results,
                  f'Probability':theor_prob(dct_results[target], n_experiment)}        
    return dct_results

In [4]:
theor_prob(1,2) # coin: h, t

0.5

In [5]:
# Empirical Probability
# results targets
# number of experiments
print(experiment(['H','T'], 'T', 100),
      experiment(['H','T'], 'H', 100),
      experiment(['H','T'], 'T', 10000),
      experiment(['H','T'], 'H', 10000),
     sep='\n')

{'Results': {'H': 54, 'T': 46}, 'Probability': 0.46}
{'Results': {'H': 57, 'T': 43}, 'Probability': 0.57}
{'Results': {'H': 5014, 'T': 4986}, 'Probability': 0.4986}
{'Results': {'H': 5063, 'T': 4937}, 'Probability': 0.5063}


In [6]:
# Empirical Probability
# results choice targets
# number of experiments
print(experiment([1,2,3,4], 1, 10000),
      experiment([1,2,3,4], 2, 10000),
      experiment([1,2,3,4], 3, 10000),
      experiment([1,2,3,4], 4, 10000),
     sep='\n')

{'Results': {1: 2598, 2: 2471, 3: 2423, 4: 2508}, 'Probability': 0.2598}
{'Results': {1: 2495, 2: 2520, 3: 2574, 4: 2411}, 'Probability': 0.252}
{'Results': {1: 2543, 2: 2470, 3: 2489, 4: 2498}, 'Probability': 0.2489}
{'Results': {1: 2521, 2: 2478, 3: 2468, 4: 2533}, 'Probability': 0.2533}


<strong>Lei dos grandes números (LGN)</strong>: quanto mais experimentos eu faço, mais perto a probabilidade empírica se aproxima da probabilidade teórica
<p>
    Ex: Se jogar uma moeda pro alto 10.000 vezes, estará mais perto de 50% de probabilidade de dar cara do que jogando apenas 100 vezes. Se jogar 1.000.000 vezes, mais perto de 50% estará do que 10.000 vezes...

<strong>Probabilidade condicional</strong>: P(B|A) >> probabilidade de B considerando que A já ocorreu<br>
$$P(B|A) = {\frac {P(A \cap B)} {P(A)}}$$

<center><strong>e: P(A e B)</strong>: probabilidade dos dois ocorrerem juntos</center><br>
$$P(A \cap B) = {P(A)}\cdot{P(B|A)}$$

<center><strong>ou: P(A ou B)</strong>: probabilidade de A ocorrer ou B ocorrer ou os dois ocorrerem</center><br>
$$P(A \cup B) = {P(A)}+{P(B)}-{P(A \cap B)}$$

<center><strong>Exercícios</strong>: oito cartas de UNO, sendo quatro azul e quatro vermelhas.</center>
<img src="imagens/redblue.png"
     alt="Uno"
     width=300px />
     
<br>1. Probabilidade de ser Azul <strong>e</strong> Par<br>
$$P(Azul \cap Par) = {\frac {4} {8}}\cdot{\frac {2} {4}} = {\frac {1} {2}}\cdot{\frac {1} {2}}={\frac {1} {4}}=0.25$$

<br>2. Probabilidade de ser Azul sabendo que a carta <strong>é Par</strong><br>
$$P(Azul|Par) = {\frac {P(Azul \cap Par)} {P(Par)}}={\frac {2/8} {4/8}}={\frac {2} {4}}={\frac {1} {2}}=0.5$$

<br>3. Probabilidade de ser Azul <strong>ou</strong> Par<br>
$$P(Azul \cup Par) = P(Azul)+P(Par)-P(Azul \cap Par)={\frac {4} {8}}+{\frac {4} {8}}-{\frac {2} {8}}={\frac {6} {8}}={\frac {3} {4}}=0.75$$

<br>4. Probabilidade de pegar aleatoriamente duas cartas Azul <strong>sem substituição</strong><br>
$$P(Azul_1 \cap Azul_2) = P(Azul_1)\cdot{P(Azul_2)} ={\frac {4} {8}}\cdot{\frac {3} {7}}={\frac {1} {2}}\cdot{\frac {3} {7}}={\frac {3} {14}}=0.2143$$

<br>**Eventos independentes**: quando um evento ocorre não modifica a chance de outro evento ocorrer. <br />
Ex: Cara ou Coroa. Podemos representá-los de três formas:
* $P(A|B) = P(A)$
* $P(B|A) = P(B)$
* $P(A \cap B) = P(A)\cdot{P(B)}$

**Mutuamente Exclusivo**: ambos não podem acontecer ao mesmo tempo.<br />
Ex: Ao jogar um cubo, sejam A = números ímpares menores do que 4, B = números maiores do que 3
* $A=[1,3]$ 
* $B=[4,5,6]$
* $P(A \cap B) = 0$

In [7]:
from model.Probability import Probability

In [8]:
prob = Probability()

In [9]:
prob.set_samples({'heads':1,'tails':1})

In [10]:
prob.set_targets(['heads'])
prob.cond_prob(replace=False)

0.5

In [11]:
prob.experiment(100)

{'Results': {'heads': 44, 'tails': 56}, 'Probability': 22.0}

In [12]:
prob.experiment(1000)

{'Results': {'heads': 503, 'tails': 497}, 'Probability': 251.5}

In [13]:
prob.set_samples({'Blue':{'even':2,'odd':2},'Red':{'even':2,'odd':2}})
prob.samples

{'Blue': {'even': 2, 'odd': 2}, 'Red': {'even': 2, 'odd': 2}}

In [14]:
prob.set_targets([{'Blue':{'and':'even'}}])
prob.targets

[{'Blue': {'and': 'even'}}]

In [15]:
prob.cond_prob('and')

0.25

In [16]:
prob.set_targets([{'Blue':{'or':'even'}}])
prob.targets

[{'Blue': {'or': 'even'}}]

In [17]:
prob.cond_prob('or')

0.75

In [18]:
prob.set_targets([{'Blue':{'known':'even'}}])
prob.targets

[{'Blue': {'known': 'even'}}]

In [19]:
prob.cond_prob('known')

0.5

<h1> Diagrama de Árvore</h1>
Uma maneira de solucionar problemas de Probabilidade Condicional
<img src="imagens/6cards.png" alt="Uno" width=200px />

Considerando a imagem acima, onde temos um total de 6 cartas, sendo 2 azuis e 4 vermelhas. Ao colocar essas cartas numa bolsa, retiraremos duas cartas em sequência, sem substituição. Responda qual a probabilidade em cada um dos seguintes cenários:
    1. Azul na primeira, Azul na segunda.
    2. Azul na primeira, Vermelha na segunda.
    3. Vermelha na primeira, Azul na segunda.
    4. Vermelha na primeira, Vermelha na segunda.
    
<img src="imagens/arvore.png"  width=900px/>

In [20]:
prob.set_samples({'Blue':2,'Red':4})
prob.samples

{'Blue': 2, 'Red': 4}

In [21]:
prob.set_targets(['Blue','Blue'])
print(*prob.targets,' = ', prob.cond_prob())

Blue Blue  =  0.0667


In [22]:
prob.set_targets(['Red','Blue'])
print(*prob.targets,' = ', prob.cond_prob())

Red Blue  =  0.2667


In [23]:
prob.set_targets(['Blue','Red'])
print(*prob.targets,' = ', prob.cond_prob())

Blue Red  =  0.2667


In [24]:
prob.set_targets(['Red','Red'])
print(*prob.targets,' = ', prob.cond_prob())

Red Red  =  0.4


<center><h1>Probabilidade Condicional x Teorema de Bayes</h1></center>

<br><center>
    <h3>Probabilidade Condicional</h3>  
      Probabilidade da carta ser <strong>vermelha</strong> sabendo que a carta <strong>é ímpar</strong>
</center>
<img src="imagens/6cards.png" alt="Uno" width=200px />
<br>
$$P(vermelha|ímpar) = {\frac {P(vermelha \cap ímpar)} {P(ímpar)}}={\frac {2/6} {4/6}}={\frac {1/3} {2/3}}={\frac {1} {2}}=0.5$$

In [25]:
prob.set_samples({'Blue':{'even':0,'odd':2},'Red':{'even':2,'odd':2}})
prob.samples

{'Blue': {'even': 0, 'odd': 2}, 'Red': {'even': 2, 'odd': 2}}

In [26]:
prob.count_sample(prob.samples)

6

In [27]:
prob.set_targets([{'Red':{'known':'odd'}}])
prob.targets

[{'Red': {'known': 'odd'}}]

In [28]:
prob.count_part(prob.targets, prob.samples, 'known')

4

In [29]:
prob.cond_prob('known')

0.5

<br><center><h1>Teorema de Bayes</h1>
Uma forma de calcular probabilidade condicional de uma hipótese dada uma nova evidência. $P(A|B)$
</center><br />

$$P(A|B) = {\frac {P(B|A)\cdot P(A)} {P(B)}}$$

<br>O Teorema de Bayes depende de três fatores:
1. A probabilidade de um evento ocorrer dada uma Hipótese $P(B|A)$
2. Probabilidade anterior da Hipótese $P(A)$
3. Probabilidade anterior da Evidência $P(B)$


<br>Probabilidade de ter escolhido uma carta vermelha, sabendo que a carta é ímpar.

* <strong>A</strong> = carta vermelha
* <strong>B</strong> = carta ímpar

 * $P(A|B) = P(vermelha|ímpar) = ?$ 
 * $P(B|A) = P(ímpar|vermelha) = 1/2$  
 * $P(A) = P(vermelha) = 4/6 = 2/3$
 * $P(B) = P(ímpar) = 4/6 = 2/3$

$$P(vermelha|ímpar) = {\frac {{1/2} \cdot {2/3}} {2/3}}={\frac {1}{2}}=0.5$$

In [30]:
sample = prob.count_sample(prob.samples)
red = prob.count_part(prob.targets, prob.samples, 'known')
red_odd = prob.samples['Red']['odd']
sample_odd = prob.count_known('odd')
p_red_odd = ((red_odd / red) * (red / sample)) / (sample_odd / sample)
p_red_odd

0.5

<br><h3>Teorema de Bayes</h3>
Considere duas moedas em uma bolsa: uma comum, outra viciada (possui cara nos dois lados).
Você retira uma moeda sem ver qual está pegando, joga para o alto, dá cara. Qual a probabilidade de você ter escolhido a moeda viciada sabendo que deu cara?

* <strong>A</strong> = moeda viciada
* <strong>B</strong> = cara

 * $P(A|B) = P(viciada|cara) = ?$ 
 * $P(B|A) = P(cara|viciada) = 1$ # 100% 
 * $P(A) = P(viciada) = 1/2$
 * $P(B) = P(cara) = 3/4$ 
 
$$P(viciada|cara) = {\frac {{1} \cdot {1/2}} {3/4}}={\frac {1} {2}} \cdot {\frac {4} {3}}={\frac {4} {6}}={\frac {2}{3}}=0.6666$$

<br><center>
    <h3>Probabilidade Condicional</h3>  
      probabilidade de você ter <strong>escolhido a moeda viciada</strong> sabendo que deu <strong>cara</strong>
</center><br>
$$P(viciada|cara) = {\frac {P(viciada \cdot cara)} {P(cara)}}={\frac {1/2 \cdot 1} {3/4}}={\frac {1} {2}} \cdot {\frac {4} {3}}={\frac {4} {6}}={\frac {2} {3}}=0.6666$$

In [31]:
prob.set_samples({'hooked':{'heads':2,'tails':0},'coin':{'heads':1,'tails':1}})
prob.set_targets([{'hooked':{'known':'heads'}}])

In [32]:
prob.samples

{'hooked': {'heads': 2, 'tails': 0}, 'coin': {'heads': 1, 'tails': 1}}

In [33]:
prob.targets

[{'hooked': {'known': 'heads'}}]

In [34]:
sample = prob.count_sample(prob.samples)
hooked = prob.count_part(prob.targets, prob.samples, 'known')
hooked_heads = prob.samples['hooked']['heads']
sample_heads = prob.count_known('heads')
p_hooked_heads = ((hooked_heads / hooked) * (hooked / sample)) / (sample_heads / sample)
p_hooked_heads

0.6666666666666666

In [35]:
prob.cond_prob('known')

0.6667

In [36]:
prob.set_samples({'f1':1,'f2':1,'f3':1,'f4':1,'f5':1,'f6':1})
prob.set_targets(['f3'])

In [37]:
results = prob.experiment(100)
results

{'Results': {'f1': 7, 'f2': 17, 'f3': 18, 'f4': 16, 'f5': 23, 'f6': 19},
 'Probability': 3.0}

In [38]:
results = results['Results']

In [39]:
results[prob.targets[0]]

18

In [40]:
1/6

0.16666666666666666

**Conclusão**: como observado, ambas as fórmulas produzem o mesmo resultado, porém a forma de interpretar é diferente.