# 2. Probabilidade

**Permutação simples**

Um arranjo de objetos sem repetição, onde **a ordem é importante**.

Se eu quero selecionar $p$ elementos de um conjunto de tamanho $n$?

Exemplo:
Em uma turma, dez alunos candidataram-se para ocupar os cargos de representante e vice-representante da turma. De quantas maneiras distintas a escolha poderá ser feita?
Temos dez alunos disputando duas vagas, portanto, dez elementos tomados dois a dois.

$$ P = \frac{n!}{(n-p)!}$$

n - Alunos candidatos, p - vagas

In [3]:
import math

n = 10  # número total de elementos
p = 2  # número de elementos para permutar

permutacoes = math.perm(n, p)
print("Quantidade de permutações:", permutacoes)


Quantidade de permutações: 90


**Combinação simples**

Na combinação simples, **a ordem dos elementos no agrupamento não interfere**. São arranjos que se diferenciam somente pela natureza de seus elementos. Portanto, se temos um conjunto A formado por n elementos tomados p a p, qualquer subconjunto de A formado por p elementos será uma combinação.

Exemplo

Quando temos 4 itens (1,2,3,4), quantos grupos de 2 conseguimos selecionar? Pense no caso que quando for selecionado (1,2) e (2,1) temos o mesmo grupo sendo contado 2 vezes.

$$ C = \frac{n!}{p!(n-p)!}$$

In [8]:
numeros = [1,2,3,4]
#Combinacoes dois a dois
from itertools import combinations

comb = combinations(numeros,2)

list(comb)

[(1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4)]

**Variável aleatória**: é uma variável cujo valor depende de fatores **não-deterministícos**, isto é, **probabilísticos**. 

**Exemplo**: resultado do lançamento de um ou mais dados.

**Espaço amostral**: conjunto de **todos** os resultados possíveis de um certo fenômeno aleatório (<font color = red> elementar e indivisível do experimento</font>), ou seja, **os valores possíveis que a variável aleatória de interesse pode assumir**. Representamos o espaço amostral pela letra grega $\Omega$. 

Os subconjuntos de $\Omega$ são denominados **eventos** e representados pelas letras latinas maiúsculas A, B, etc. 

**Exemplo**: o espaço amostral dos resultados do lançamento de um dado é:

$$ \Omega = \{1, 2, 3, 4, 5, 6\} $$

Alguns eventos possíveis são:

- Evento A = {3} : o resultado do lançamento do dado foi 3;
- Evento B = {2,4,6} : o resultado do lançamento do dado foi um número par.

### Probabilidade
Podemos definir a probabilidade de um evento aleatório A ocorrer como:

$$P(A) = \dfrac{\#A}{\#\Omega}$$

em que $\#A$ é a cardinalidade do evento $A$, ou seja, a quantidade de vezes que ele pode ocorrer dentro do espaço amostral; ou ainda, a quantidade de "casos favoráveis" em relação aos casos possíveis.

Dessa maneira temos que:
- $P(\Omega) = 1$
- $P(\emptyset) = 0$
- $0 \leq P(A) \leq 1$
- $P(A^c) = 1 - P(A)$ -> evento complementar

### Propriedades importantes

### União de eventos
Dados os eventos $A$ e $B$, o cálculo da união desses eventos é determianda da seguinte forma:
    
$$ P(A \cup B) = P(A) A P(B) - P(A \cap B) $$

### Probabilidade Condicional

$$ P(A|B) = \frac{P(A \cap B)}{P(B)}$$

Logo,

$$ P(A \cap B) = P(A,B) = P(A|B) \times P(B)$$

Se dois eventos são independentes: 

$$P(A,B) = P(A) \times P(B)$$

## Teorema de Bayes

O Teorema de Bayes é uma forma **calcular probabilidades condicionais de forma reversa**.

Vamos considerar o clássico exemplo para explicar o teorema. 

Temos uma determinada doença C, e um teste T utilizado para detectar esta doença. 

O teste não é 100% confiável, indicando pessoas que **não têm a doença como doentes (falsos positivos)** e **não detectando a doença em pessoas que a possuem (falsos negativos)**

> Consideremos que 1% das pessoas possui a doença: $P(C) = 0.01$

> Logo, 99% das pessoas não a possuem: $P(¬C) = 0.99$

O teste detecta a doença em pessoas efetivamente doentes 90% das vezes e, consequentemente, não detecta a doença em pessoas doentes em 10% dos casos. 

Em pessoas não doentes, o teste detecta a doença (erradamente) em 5% dos casos e não detecta em 95% dos casos.

#### Em equações, temos:

* P(C|+) = Probabilidade de ter a doença dado um teste positivo (esta é a probabilidade que desejamos saber)

* P(C) = Probabilidade da pessoa ter a doença = 1%

* P(¬C) = Probabilidade da pessoa não ter a doença = 99%

* P(+|C) = Probabilidade de um teste positivo dado que a pessoa tem a doença = 90% 

* P(-|C) = Probabilidade de um teste negativo dado que a pessoa tem a doença = 10% 

* P(+|¬C) = Probabilidade de um teste positivo dado que a pessoa não tem a doença = 5%

* P(-|¬C) = Probabilidade de um teste negativo dado que a pessoa não tem a doença = 95%

    **O Teorema de bayes diz que :**

$$ P(C|+) = \frac{P(+|C) \ P(C)}{P(+|C) \ P(C)  + P(+|¬ C) \ P(¬ C)} = \dfrac{P(C \cap +)}{P(C \cap +) + P(¬C \cap +)}  = \dfrac{P(+|C) \ P(C)}{P(+)} = \dfrac{P(C \cap +)}{P(+)}$$

Agora, a chance de você **ter a doença e o teste detectá-la - $P(C \cap +)$ - (verdadeiro positivo)** é igual **a chance de você ter a doença - $P(C)$ - multiplicado pela chance do teste ter dado positivo corretamente - $P(+|C)$**;

Analogamente, a chance de você **não ter a doença e o teste detecta-la mesmo assim - $P(¬C \cap +)$ - (falso positivo)** é igual **a chance de você não ter a doença -$P(¬ C)$- multiplicado pela chance do teste ter dado positivo incorretamente - $P(+|¬ C)$**;

E assim por diante, para todos os resultados. Assim:

|                | Pessoa Doente                            | Pessoa Não Doente                               | Soma
|----------------|------------------------------------------|-------------------------------------------------|-------|
| **Teste positivo** | Prob Doente e teste pos: 1% × 90% = 0,9% | Prob Não Doente e teste pos: 99% × 5% = 4,95%   | 5,85%
| **Teste Negativo** | Prob Doente e teste neg: 1% × 10% = 0,1% | Prob Não Doente e teste neg: 99% × 95% = 94,05% | 94,15%
| **Soma** | 1% | 99% | 100%

Estas então são nossas probabilidades para cada evento. Note que, se somadas, o resultado é 1, ou 100%. 

Agora, vamos supor que você fez o teste e o **resultado deu positivo**. 

Como devemos interpretar este resultado? Qual a chance de você de fato ter a doença? 

Considerando o cálculo básico de probabilidade, temos que a chance de ter a doença é igual à **chance do evento desejado dividido por todas as possibilidades**. 

O evento desejado é um positivo verdadeiro, ou seja, **teste positivo e a pessoa com doença**. Para este caso, a probabilidade é de 0,9% (olhe na tabela!) 

O **total de possibilidades com relação ao teste positivo** seria a **soma da probabilidade de “doente e teste pos”** (verdadeiro positivo) com **“não doente e teste pos” (falso positivo)**, que resultará em 0,9% + 4,95%, igual a 5,85%.

Fazendo toda a conta, nossa chance de ter a doença se temos um teste positivo é de **0,9%/5,85% = 0.1538**, ou **15,38%**. 

É uma chance bem mais baixa do que imaginamos apenas ao olhar para o problema e para a suposta precisão do teste!
