## Probabilidade

### Variável aleatória

É uma função que transforma o resultado de um experimento aleatório em um número.

O conjunto de todos os resultados possíveis é chamado de espaço amostral.

Podemos trabalhar com dois tipos de variáveis aleatórias: discretas e contínuas. Toda variável aleatória possui um valor esperado e uma variância.

Para variáveis discretas, podemos calcular a probabilidade para um valor ou para um intervalo. Para variáveis contínuas, nunca podemos calcular a probabilidade de um valor definido, mas somente de intervalos de valores.

### Teorema das probabilidades

A definição clássica de probabilidade é a proporção entre número de eventos positivos (ou desejáveis) e número total de resultados.

Das muitas propriedades e características da probabilidade, podemos lembrar que a soma da probabilidade de dois eventos é a soma de ambos menos a intersecção entre eles. Exemplo: em uma empresa, um sorteio entrega a chance de um bônus, um aumento ou ambos. Qual a probabilidade do trabalhador ganhar um OU outro?

In [1]:
p_ganhar_bonus_empresa = 0.4
p_ganhar_aumento = 0.25

p_ganhar_bonus_e_aumento = 0.1

p_ganhar_bonus_ou_aumento = p_ganhar_bonus_empresa + p_ganhar_aumento - p_ganhar_bonus_e_aumento

p_ganhar_bonus_ou_aumento

0.55

In [2]:
p_chover_hoje = 0.15
p_nao_chover_hoje = 1 - p_chover_hoje

p_nao_chover_hoje

0.85

### Probabilidade condicional

Usada quando a probabilidade de um evento é influenciada por outro evento.

![image.png](attachment:image.png)

Onde o primeiro termo é a probabilidade A dado que B já aconteceu, o segundo termo é a intersecção dos dois eventos e o terceiro é a probabilidade de B ocorrer.

No exemplo abaixo, A é a probabilidade de todos os clientes de uma empresa pagarem a conta e B é a probabilidade de um cliente ter cartão de crédito (ou a média do número de clientes que possuem cartão de crédito). Precisamos saber qual a probabilidade de um cliente possuir cartão de crédito dado que ele pagou a conta no último ano.

In [3]:
p_A = 0.15
p_B = 0.27
p_A_e_B = 0.09


p_B_dado_A = p_A_e_B / p_A
p_B_dado_A

0.6

### Teorema do produto

A probabilidade de interseção entre A e B é o produto da probabilidade de A pela probabilidade de B dado A ou o produto da probabilidade de B pela probabilidade de A dado B.

Caso os eventos sejam independentes entre si, a chance de A dado B (ou o inverso) é a própria chance de A (ou de B). Além disso, a chance de ambos ocorrerem é o produto das probabilidades.

In [4]:
p_A = 0.2
p_B = 0.2

p_A_intersecao_B = p_A * p_B

p_A_intersecao_B

0.04000000000000001

### Teorema de Bayes

Muito útil na estatística, uma vez que atualiza probabilidades a partir de novas informações. Ou seja, se temos a probabilidade de algo ocorrer que é dependendente de outro evento, o teorema de Bayes irá atualizar a probabilidade uma vez que recebemos novas informações do evento externo e que pode alterar nossa probabilidade atual.

![image.png](attachment:image.png)

Nessa fórmula gostaríamos de calcular a probabilidade de B dado que A já aconteceu. Pra isso temos a probabilidade de B vezes a probabilidade de A dado que B aconteceu dividido pelo teorema da probabilidade total. Nesse teorema temos que a probabilidade de A é a probabilidade de A ocorrer dado B vezes a probabilidade de B acontecer.

Uma importante distinção é que a probabilidade a priori é aquela que calculamos sem nenhuma informação anterior, enquanto a probabilidade a posteriori é aquela que calculamos usando informações novas.

**Um exemplo**:

Seja A a probabilidade de um exame dar positivo e B a probabilidade de uma pessoa ter câncer.

A primeira parte do cálculo é auto explicativa. A segunda parte podemos fragmentar da seguinte forma:

A probabilidade da pessoa ter câncer e o resultado dar positivo e a probabilidade da da pessoa não ter câncer e o resultado dar positivo.

Alguns dados que nos ajudarão a relizar esse cálculo:

- Probabilidade de ter câncer: 1%
- Probabilidade de uma pessoa ter câncer e o resultado dar positivo: 99%
- Probabilidade de uma pessoa que não tem câncer ter um resultado negativo: 99,5%

E em termos estatísticos:

- Probabilidade de não ter câncer: P(B)
- Probabilidade de uma pessoa com câncer ter o exame positivo: P(A|B)
- Probabilidade de uma pessoa que não tem câncer ter o exame negativo: P(A_c|B_c)

In [6]:
p_B = 0.01
p_Bc = 1 - p_B

p_A_dado_B = 0.99
p_Ac_dado_B = 1 - p_A_dado_B

p_Ac_dado_Bc = 0.995
p_A_dado_Bc = 1 - p_Ac_dado_Bc

p_A = p_B*p_A_dado_B + p_Bc*p_A_dado_Bc
p_A

0.014850000000000006

In [7]:
p_B_dado_A = p_A_dado_B*p_B / p_A

p_B_dado_A

0.6666666666666665

In [1]:
A = 0.1
B = 0.2
A_B = 0.05

resultado = A_B * A / B
resultado

0.025000000000000005