<img src = "https://www.estudopratico.com.br/wp-content/uploads/2014/06/probabilidade-calcular-e1586431045913-1200x675.jpg" width="50%">

## Variável aleatória

Uma **variável aleatória** é uma variável cujo valor depende de fatores **não-deterministícos**, isto é, **probabilísticos**. 

**Exemplo**: resultado do lançamento de um ou mais dados.

<img src = "https://bookdown.org/daniel_flores_agreda/Prob1-GSEM-UNIGE/img/fun/EC_Latin.png" width = "40%"></img>

## Espaço amostral

Chamamos de **espaço amostral** o conjunto de **todos os resultados possíveis de um certo fenômeno aleatório** (<font color = red> elementar e indivisível do experimento</font>), ou seja, **os valores possíveis que a variável aleatória de interesse pode assumir**. Representamos o espaço amostral pela letra grega $\Omega$. 

Os subconjuntos de $\Omega$ são denominados **eventos** e representados pelas letras latinas maiúsculas A, B, etc. 

**Exemplo**: o espaço amostral dos resultados do lançamento de um dado é:

$$ \Omega = \{1, 2, 3, 4, 5, 6\} $$

Alguns eventos possíveis são:

- Evento A = {3} : o resultado do lançamento do dado foi 3;
- Evento B = {5} : o resultado do lançamento do dado foi 5.

**Exemplo 2**: considere o lançamento de uma moeda:

<img src="https://www.vertica.com/wp-content/uploads/2019/07/Coin_Flip_183981489-2160.jpg" width=300>

- Se lançarmos uma única moeda:
    - A variável aleatória será **o resultado do lançamento da moeda**
    - Portanto, o espaço amostral é: $$ \Omega = \{ K, C \} $$
        
- Se retirarmos uma carta do baralho:
    - A variável aleatória será **o resultado do valor e naipe da carta**
    - Portanto, o espaço amostral é: $$ \Omega = \{ 2\clubsuit, 2\diamondsuit, 2\spadesuit, 2\heartsuit, 3\clubsuit, 3\diamondsuit, 3\spadesuit, 3\heartsuit, ... \}$$
   

- Se lançarmos uma moeda e cair cara, lançamos um dado apenas com números pares, caso coroa outro dado apenas com números ímpares:
    - A variável aleatória será **o resultado do par de lançamentos de moeda e dados**
    - Portanto, o espaço amostral é: 

Moeda e dado:  
    Cara - 2  
    Cara - 4  
    Cara - 6  
    Coroa - 1  
    Coroa - 3  
    Coroa - 5  
$$ \Omega = \{ (K, 1), (K, 3), (K, 5), (C, 2), (C, 4), (C, 6) \} $$

## Definição Clássica ou Frequentista de Probabilidade (Jerônimo Cardano; 1501 - 1576)
Podemos definir a probabilidade de um evento aleatório A ocorrer como:

$$P(A) = \dfrac{\#A}{\#\Omega}$$

em que $\#A$ é a cardinalidade do evento $A$, ou seja, a quantidade de vezes que ele pode ocorrer dentro do espaço amostral; ou ainda, a quantidade de "casos favoráveis" em relação aos casos possíveis.

Dessa maneira temos que:
- $P(\Omega) = 1$
- $P(\emptyset) = 0$
- $0 \leq P(A) \leq 1$
- $P(A^c) = 1 - P(A)$ -> evento complementar

In [2]:
import numpy as np

# dado tem 6 faces = {1, 2, 3, 4 ,5, 6}

face = np.random.randint(1,6)
print(face)

# variável aleatória é a face do dado

probabilidade = 1/6 # evento/espaço amostral

print('\nevento acontecer:',probabilidade)

evento_complementar = 1 - probabilidade
print('\nevento não acontecer (ou complementar):', evento_complementar)

prob_de_sair_7 = 0
print('\nO nº 7 não faz parte do espaço amostral, portanto sua probabilidade é:', prob_de_sair_7)

5

evento acontecer: 0.16666666666666666

evento não acontecer (ou complementar): 0.8333333333333334

O nº 7 não faz parte do espaço amostral, portanto sua probabilidade é: 0


## Propriedades importantes

### Diagrama de Venn e Espaço de Probabilidade

<img src = "https://d3rw207pwvlq3a.cloudfront.net/attachments/000/123/316/original/image.png?1596464245" width = "50%"></img>

<img src = "https://efofexnews.files.wordpress.com/2016/02/gfbdbfba.png" width = "25%"></img>


### Eventos Disjuntos ou Mutuamente Excludentes
Dois eventos são disjuntos se $A \cap B = \emptyset$ e portanto $P(A \cap B) = 0$

**Ex.:**

- Probabilidade de cair cara e cora simultaneamente (lançamento de uma moeda)
- Probabilidade de um cliente contratar um produto e dar Churn no mesmo momento
- Probabilidade de um jogador de fotebol jogar para dois times ao mesmo tempo



### União de eventos
Dados dois elementos $A$ e $B$, o cálculo da união desses eventos é determianda da seguinte forma:
    
$$ P(A \cup B) = P(A) + P(B) - P(A \cap B) $$

$$ P(A \cup B \cup C) = P(A) + P(B) + P(C) - P(A \cap B) - P(A \cap C) - P(B \cap C) + P(A \cap B \cap C) $$
Exemplo: Qual é a probabilidade de que em um lançamento de um dado saia um número par ou maior do que três?

espaço amostral do dado = {1,2,3,4,5,6}

- Evento A - sair par  
S(A) = {2, 4, 6}  
P(A) = 3/6 = 1/2


- Evento B -maior que três  
S(B) = {4, 5, 6}  
P(B) = 3/6 = 1/2


- Evento:  A ∩ B  
S(A ∩ B) = {4, 6}  
P(A ∩ B) = 2/6 = 1/3


- Probabilidade da união de A e B  
P(A ∪ B) = P(A) + P(B) - P(A ∩ B) = 1/2 + 1/2 - 1/3 = 2/3


_conferindo_
- Espaço amostral A ∪ B  
S(A ∪ B) = {2, 4, 5, 6}  
P(A ∪ B) = 4/6 = 2/3



### Exs Práticos
**Ex. Netflix:**
A Netflix vai recomendar dois filmes pra você e ela sabe que:

- A probabilidade de você gostar do primeiro filme é de 0.5
- A probabilidade de você gostar do segundo filme é de 0.4
- A probabilidade de você gostar de ambos os filmes é de 0.3

Agora, qual é a probabilidade de você gostar de ao menos um dos dois filmes?



Sejam os eventos

A: Gostar do primeiro filme
B: Gostar do segundo filme

$$P(A\cup B) = P(A) + P(B) - P(A \cap B) = 0.5 + 0.4 - 0.3 = 0.6$$

Portanto, qual é a probabilidade da netflix sugerir dois filmes e você não gostar de nenhum?

Seja

C: Não gostar de nenhum filme

$$P(C) = P((A \cup B)^c) = 1 - P(A\cup B) =1 - 0.6 = 0.4$$



### Eventos Independentes

Dois eventos são independentes se e somente se $P(A \cap B) = P(A)*P(B)$


Exemplo: Foi lançado um dado e uma moeda, qual é a probabilidade de ocorrer um número ímpar no dado e sair cara na moeda?

espaço amostral do dado = {1, 2, 3, 4, 5, 6}  
espaço amostral da moeda = {cara, coroa}

- evento A - dado - número ímpar
S(A) = {1, 3, 5}  
P(A) = 3/6 = 1/2

- evento B - moeda - cara  
S(B) = {cara}  
P(B) = 1/2

- Probabilidade de A ∩ B  
P(A ∩ B) = P(A)*P(B) = 1/2 * 1/2 = 1/4

- Espaço amostral dado e moeda
S total = {(1, cara), (2, cara), (3,cara), (4,cara), (5,cara), (6,cara), (1, coroa), (2, coroa), (3,coroa), (4, coroa), (5,coroa), (6,coroa)}

S(A ∩ B) = {(1, cara), (3,cara), (5,cara)}  
P(A ∩ B) = 3/12 = 1/4

## Probabilidade Condicional

<img src = "https://bookdown.org/daniel_flores_agreda/Prob1-GSEM-UNIGE/img/fun/probconditionnelle2.png" width = "40%"></img>

Probabilidade condicional é um dos conceitos mais importantes da teoria de probabilidades, pois frequentemente se quer calcular seu valor quando se tem alguma informação parcial a respeito do resultado de um experimento aleatório.

Além disso, mesmo quando não se tem essa informação parcial, as probabilidades condicionais muitas vezes são utilizadas para computar mais facilmente valores de probabilidades que se tem interesse.

Mais importante do que isso o conceito por trás de probabilidades condicionais é de que nós conseguimos atualizar a nossa medida de incerteza a partir do momento que conhecemos uma informação nova.

**Ex.:** Qual a probabilidade de ao se jogar dois dados simultaneamente, que a soma deles seja 5? E se jogamos o segundo só depois de termos o resultado do primeiro? Muda alguma coisa?

Seja

A: O valor do lançamento do primeiro dado (não viesado)

B: O valor do lançamento do segundo dado (não viesado)

Logo o nosso espaço amostral S é dado pela tabela abaixo:

<img src = "https://bookdown.org/daniel_flores_agreda/Prob1-GSEM-UNIGE/img/03_axioms/c2.png" width = "50%"></img>

$$P(A + B = 5) = \dfrac{\#\text{Casos favoráveis}}{\#\text{Casos possíveis}} = \dfrac{4}{36} = \dfrac{1}{9}$$

Agora suponha que jogamos um dado de cada vez e que no primeiro lançamento caiu 2. Então temos um novo espaço amostral reduzido.

<img src = "https://bookdown.org/daniel_flores_agreda/Prob1-GSEM-UNIGE/img/03_axioms/c4.png" width = "50%"></img>

$$P(A + B = 5| A = 2) = \dfrac{\#\text{Casos favoráveis}}{\#\text{Casos possíveis}} = \dfrac{1}{6}$$

### De maneira geral:

$$ P(A/B) = \frac{P(A \cap B)}{P(B)}$$

![image.png](attachment:image.png)

#####  Exemplos:

1- Duas cartas são selecionadas, sem reposição da primeira carta, de
um baralho normal de 52 cartas. Encontre a probabilidade de selecionar
um rei e depois uma rainha.

P(rei E rainha) = P(rei) * P(rainha / rei)

1 b- Duas cartas são selecionadas, com reposição da primeira carta, de
um baralho normal de 52 cartas. Encontre a probabilidade de selecionar
um rei e depois uma rainha.

2- Uma moeda é jogada e um dado é lançado. Encontre a probabilidade
de se obter cara e 6.


3- Considere os seguintes casos:

a) A probabilidade de que um voo parta no horário é
de 0,89.

b) A probabilidade de que um voo chegue na hora certa
é de 0,87.

c) A probabilidade de que um voo parta e chegue na
hora é de 0,83.

Encontre a probabilidade de que um voo tenha partido
no horário, dado que ele chegou na hora certa.

In [None]:
#PA, PB, PAeB, PA_dado_B 

4- Encontre a probabilidade de que um voo chegue na
hora, dado que ele partiu no horário correto.

In [None]:
#PA, PB, PAeB, PA_dado_B 

Em uma prova de múltipla escolha, cada questão tem 5 alternativas, sendo apenas uma delas correta.
Ao não saber a resposta, o aluno “chuta” aleatoriamente uma resposta qualquer entre as possíveis
escolhas. Levando-se em conta um aluno mediano, que saiba 60% do conteúdo, qual será a chance
de ele acertar uma das 5 questões escolhidas aleatoriamente? E qual a chance de ele acertar
exatamente 3 questões?

## O caso de Sally Clark

**Contexto:** Uma mãe solo, com trabalho e não fumante, que teve dois filhos recém nascidos, sofre com a perda de ambos os bebês para o que é chamado de SIDS (Síndrome de morte súbita infantil) e é julgada por homicídio culposo pela morte dos filhos. Por conta da ausência de provas contra e a favor do crime, chamaram um "especialista" para determinar o quão provável seria que duas crianças morressem de SIDS, e o especialista utilizou o seguinte racional:

Sejam os eventos

- A: O primeiro bebê morrer de SIDS
- B: O segundo bebê morrer de SIDS

Portanto

$$P(A \cap B) = P(A) * P(B) = \dfrac{1}{8500}\dfrac{1}{8500} \approx \dfrac{1}{73\text{milhões}}$$

Sendo esse um evento quase impossível, o que a levou a ser condenada e passar 3 anos presa até conseguir recorrer e ser libertada.

**3 Erros Principais e reflexões:**
<!---
- Os valores de $P(A)$ e $P(B)$ estavam inflados, o mais correto seria o valor de 1 em cada 3mil. 
- É fácil supor que os eventos não são independentes pois pode haver fatores ambientais e/ou genéticos e portanto, dado que o primeiro filho teve SIDS, ela deveria ser considerada grupo de risco, pois a probabilidade de um segundo filho ter SIDS seria alta. O que foi constatado entre 5 e 10 vezes mais provável em estudos futuros.
- Mesmo que o valor de 1 em cada 73 milhões fosse a probabilidade correta, deveria-se também ter se calculado a probabilidade de uma mãe solo, com emprego e não fumante, cometer 2 assassinatos de seus próprios filhos e facilmente se perceberia que, apesar de ser improvável que duas crianças tivessem óbito por SIDS, é ainda menos provavel que ela tenha cometido o duplo homicídio culposo. Na verdade entre 4.5 e 9 vezes menos provável. ([Prosecutor's fallacy](https://en.wikipedia.org/wiki/Prosecutor%27s_fallacy))
--->
TED Peter Donnelly: https://www.youtube.com/watch?v=kLmzxmRcUTo


#### Questão
Em uma prova de múltipla escolha, cada questão tem 5 alternativas, sendo apenas uma delas correta.
Ao não saber a resposta, o aluno “chuta” aleatoriamente uma resposta qualquer entre as possíveis
escolhas. Levando-se em conta um aluno mediano, que saiba 60% do conteúdo, qual será a chance
de ele acertar uma das 5 questões escolhida aleatoriamente? 

$P(A)$ --> probabilidade de acertar  
$P(B)$ --> probabilidade de saber o conteúdo  
$P(B^c)$ --> probabilidade de não saber o conteúdo  

$P(A) = P(A/B)P(B) + P(A/B^c)P(B^c)$ --> Teorema da probabilidade total

## Teorema de Bayes

O **Teorema de Bayes** é um conceito importantíssimo da probabilidade e uma das ferramentas mais importantes de serem aprendidas para um Cientista de Dados, pois é a base de uma área com muitas aplicações práticas chamada [inferência bayesiana](https://en.wikipedia.org/wiki/Bayesian_inference).

O Teorema de Bayes é uma forma **calcular probabilidades condicionais de forma reversa**.

Vamos considerar o clássico exemplo para explicar o teorema. 

Temos uma determinada doença C, e um teste T utilizado para detectar esta doença. 

O teste não é 100% confiável, indicando pessoas que **não têm a doença como doentes (falsos positivos)** e **não detectando a doença em pessoas que a possuem (falsos negativos)**

> Consideremos que 1% das pessoas possui a doença: $P(C) = 0.01$

> Logo, 99% das pessoas não a possuem: $P(¬C) = 0.99$

O teste detecta a doença em pessoas efetivamente doentes 90% das vezes e, consequentemente, não detecta a doença em pessoas doentes em 10% dos casos. 

Em pessoas não doentes, o teste detecta a doença (erradamente) em 5% dos casos e não detecta em 95% dos casos. Podemos resumir desta forma:

|                | Pessoa Doente | Pessoa Não Doente |
|----------------|---------------|-------------------|
| Teste positivo | 90 %          | 5 %               |
| Teste Negativo | 10 %          | 95 %              |

A tabela acima é chamada de **matriz de confusão**, indicando fora da diagonal os caos confusos (errados), e na diagonal os casos corretos

<img src="https://miro.medium.com/max/2102/1*fxiTNIgOyvAombPJx5KGeA.png" width=300>

Agora, a chance de você **ter a doença e o teste detectá-la (verdadeiro positivo)** é igual **a chance de você ter a doença multiplicado pela chance do teste ter dado positivo corretamente**;

Analogamente, a chance de você **não ter a doença e o teste detecta-la mesmo assim (falso positivo)** é igual **a chance de você não ter a doença multiplicado pela chance do teste ter dado positivo incorretamente**;

E assim por diante, para todos os resultados. Atualizamos então a tabela, que fica assim:

|                | Pessoa Doente                            | Pessoa Não Doente                               | Soma
|----------------|------------------------------------------|-------------------------------------------------|-------|
| **Teste positivo** | Prob Doente e teste pos: 1% × 90% = 0,9% | Prob Não Doente e teste pos: 99% × 5% = 4,95%   | 5,85%
| **Teste Negativo** | Prob Doente e teste neg: 1% × 10% = 0,1% | Prob Não Doente e teste neg: 99% × 95% = 94,05% | 94,15%
| **Soma** | 1% | 99% | 100%

Estas então são nossas probabilidades para cada evento. Note que, se somadas, o resultado é 1, ou 100%. 

Agora, vamos supor que você fez o teste e o **resultado deu positivo**. 

Como devemos interpretar este resultado? Qual a chance de você de fato ter a doença? 

Considerando o cálculo básico de probabilidade, temos que a chance de ter a doença é igual à **chance do evento desejado dividido por todas as possibilidades**. 

O evento desejado é um positivo verdadeiro, ou seja, **teste positivo e a pessoa com doença**. Para este caso, a probabilidade é de 0,9% (olhe na tabela!) 

O **total de possibilidades com relação ao teste positivo** seria a **soma da probabilidade de “doente e teste pos”** (verdadeiro positivo) com **“não doente e teste pos” (falso positivo)**, que resultará em 0,9% + 4,95%, igual a 5,85%.

Fazendo toda a conta, nossa chance de ter a doença se temos um teste positivo é de **0,9%/5,85% = 0.1538**, ou **15,38%**. 

É uma chance bem mais baixa do que imaginamos apenas ao olhar para o problema e para a suposta precisão do teste!

#### Em equações, temos:

* P(C|+) = Probabilidade de ter a doença dado um teste positivo (este é a probabilidade que desejamos saber)

* P(C) = Probabilidade da pessoa ter a doença = 1%  

* P(¬C) = Probabilidade da pessoa não ter a doença = 99% 

* P(+|C) = Probabilidade de um teste positivo se a pessoa tem a doença = 0,9% 

* P(+|¬C) = Probabilidade de um teste positivo se a pessoa não tem a doença = 4,95%

    **O Teorema de bayes diz que :**
    
    
$$ P(C|+) = \frac{P(+|C) \ P(C)}{P(+|C) \ P(C)  + P(+|¬ C) \ P(¬ C)}    $$

![image-2.png](attachment:image-2.png)

**De maneira mais geral, o Teorema de Bayes pode ser dado por :**
    
    
$$ P(A_j|B) = \frac{P(B|A_j) \ P(A_j)}{\sum_{i=1}^{n} P(B|A_i) \ P(A_i)}    $$

##### Exercício:
    
Um certo vírus infecta uma em
cada 200 pessoas. Um teste usado para detectar o vírus
em uma pessoa dá positivo 80% das vezes quando a pessoa
tem o vírus e 5% das vezes quando a pessoa não
tem o vírus. (Este resultado de 5% é chamado de falso
positivo.) Seja A o evento “a pessoa está infectada” e B
o evento “o teste dá positivo”.

(a) Usando o teorema de Bayes, se o teste dá positivo,
determine a probabilidade de a pessoa estar
infectada.

(b) Usando o teorema de Bayes, se o teste dá negativo,
determine a probabilidade de a pessoa não estar
infectada.

#### RESOLVER NO FIM DE SEMANA (resolver por matriz de confusão e pela fórmula do teorema de Bayes)

## O Problema de Monty Hall

![image.png](attachment:image.png)

https://youtu.be/DSbtIa8NM5E

![image.png](attachment:image.png)

# Dicas de Conteúdo
- Probabilidade: Um curso em nível intermediário - Barry R. James

<img src = "https://images-na.ssl-images-amazon.com/images/I/51KYhZOv0hL._SX346_BO1,204,203,200_.jpg" width = "25%"></img>

- Análise Combinatória e Probabilidade - Augusto C. Morgado et al

<img src = "https://images-na.ssl-images-amazon.com/images/I/41JyE5dynlL._SX343_BO1,204,203,200_.jpg" width = "25%"></img>

- O Andar do Bêbado

<img src = "https://m.media-amazon.com/images/I/51VDFxYjh3L.jpg" width = "25%"></img>
                                                                          
- O Poder da Matemática, como nunca estar errado

<img src = "https://images-americanas.b2w.io/produtos/imagens/127159158/127159166_1SZ.jpg" width = "25%"></img>

- Weapons of Math Destruction

<img src = "https://m.media-amazon.com/images/I/51V3piRZY4L.jpg" width = "25%"></img>

TED: https://www.ted.com/talks/cathy_o_neil_the_era_of_blind_faith_in_big_data_must_end/transcript

- Privacidade Hackeada

<img src = "https://br.web.img3.acsta.net/pictures/19/07/16/09/30/5358083.jpg" width = "25%"></img>

- Coded Bias

<img src = "https://assets.whatsnewonnetflix.com/external_assets/sggkh+%5B%5Blxx*9*8782*8781_8_muochl_mvg%5Bwmn%5Bzkr%5Be3%5BC805vQhtDYWV7zJyzMwnXCTFK*B%5BZZZZYy0uuVpDVpnsXmOXR7l%5Dao6Tda2xxF%5D7xo5d32DRfkHluRw8fgfBCdUFxRNg2cr*whggE%5DEuto23nFwO8f5fZBzFAoB.jpg" width = "30%"></img>

- Moneyball

<img src = "https://upload.wikimedia.org/wikipedia/pt/thumb/d/dd/MoneyballPôster.jpg/235px-MoneyballPôster.jpg" width = "25%"></img>

- 21: Quebrando a banca

<img src = "https://upload.wikimedia.org/wikipedia/pt/5/5b/Twenty_one_poster.jpg" width = "25%"></img>

- Rain Man

<img src = "https://br.web.img3.acsta.net/medias/nmedia/18/87/18/19/19872843.jpg" width = "25%"></img>


