# Probabilidade e Estatística

## Curso Superior de Tecnologia em Ciência de Dados

### Prof. Dr. Neylson Crepalde

Conteúdo abordado: probabilidade

---

# A probabilidade de um evento

As probabilidades são utilizadas para exprimir a chance de ocorrência de determinado evento. A *probabilidade* de ocorrência de um evento é dada por um número que pode variar de 0 a 1,00.

$$0,00 \leq P(A) \leq 1,00$$

## Espaço amostral e eventos

um *Conjunto* é uma coleção bem definida de objetos ou itens. Um *espaço amostral* é o conjunto de todos os resultados possíveis de um experimento. Os resultados de um experimento chamam-se *eventos*.

O *Complemento* de um evento consiste de todos os outros resultados no espaço amostral. Os eventos são *mutuamente excludentes* se não têm elemento comum, ou se não podem acontecer simultaneamente.

Os eventos são *coletivamente exaustivos* se nenhum outro resultado é possível para o experimento em causa.

A probabilidade representada pelo espaço amostral é de 100%.

A probabilidade não ocorrência de um evento é 1,00 menos a probabilidade de sua ocorrência:

$$1,00 - P(A) = P(A')$$  ou $$ P(A) + P(A') = 1,00$$

# Três origens da probabilidade

## O Método clássico

O método clássico aplica-se a situações que têm *resultados igualmente prováveis*. Os jogos de azar (lançamento de moeda, jogo de dados, extração de cartas) usualmente apresentam esta característica de resultados igualmente prováveis. Em outras palavras, a probabilidade de um evento A é

$$P(A) = \frac{N\acute umero\hspace{0.25em} de \hspace{0.25em} resultados\hspace{0.25em} A}{Resultados \hspace{0.25em} poss\acute iveis}$$

#### Exemplo

A probabilidade de caras num lançamento de moeda é $P(Caras) = \frac{1}{2}$. A probabilidade de obter uma face de um dado é $P(Qualquer \hspace{0.25em} face) = \frac{1}{6}$. A probabilidade de obter uma só bola numa urna com 321 bolas é $P(Qualquer \hspace{0.25em} bola) = \frac{1}{321}$.

Se adotarmos a definição acima, podemos calcular a probabilidade de obter uma dama num baralho: $P(dama) = \frac{4 damas}{52 cartas} = \frac{4}{52}$.

Analogamente, a probabilidade de obter 3 ou menos pontos no lance de dados é: $P(3 \hspace{0.25em} ou \hspace{0.25em} menos) = \frac{3 \hspace{0.25em} faces}{6 \hspace{0.25em} faces \hspace{0.25em} poss\acute iveis}$

### Chance

Chance é a razão entre a probabilidade de sucesso $P(A)$ e a probabilidade de fracasso $P(A')$:

$$Chance = \frac{P(A)}{P(A')} = \frac{P(A)}{1 - P(A)}$$

## Frequência Relativa

O método clássico para determinar probabilidades está limitado às situações em que os resultados são igualmente prováveis. Entretanto, há muitos casos em que isso não ocorre. Nesses casos, podemos utilizar experimentos para *estimar* as probabilidades. Com base no método de frequência relativa, temos a seguinte definição:

$$P(A) = \frac{N\acute umero \hspace{0.25em} de \hspace{0.25em} ocorr\hat encias \hspace{0.25em} de \hspace{0.25em} A }{N \acute umero \hspace{0.25em} total \hspace{0.25em} de \hspace{0.25em} provas}$$

Observe os dados abaixo:

| Número vendido | Número de dias |
|----------------|----------------|
| 0 | 3 |
| 1 | 2 |
| 2 | 5 |
| 3 | 6 |

#### Total = 16

Se admitirmos que o passado é representativo do futuro (o que *nem sempre* é o caso), poderemos determinar as seguintes probabilidades: $P(0) = \frac{3}{16}$, $P(1) = \frac{2}{16}$, $P(2) = \frac{5}{16}$ e $P(3) = \frac{6}{16}$

Pontos importantes:

1. A probabilidade assim determinada é apenas uma *estimativa* do verdadeiro valor;
2. Quanto maior a amostra, melhor a estimativa da probabilidade;
3. A probabilidade só é válida para um conjunto de condições idênticas àquelas sob as quais se originaram os dados.

## Chance e frequências relativas

No caso em que adotamos o método empírico, as chances podem ser expressas da seguinte forma:

$$Chance = \frac{N\acute umero \hspace{0.25em} de \hspace{0.25em} ocorr\hat encias \hspace{0.25em} de \hspace{0.25em} A}{N\acute umero \hspace{0.25em} de \hspace{0.25em} n\tilde ao \hspace{0.25em} ocorr\hat encias \hspace{0.25em} de \hspace{0.25em} A}$$

## O Método Subjetivo

A *probabilidade subjetiva* é uma avaliação pessoal do grau de viabilidade de um evento.

---
# Exercícios
Stevenson (1981, p. 67-69), TODOS!

# A matemática da probabilidade

Muitas aplicações de estatística exigem a determinação da probabiidade de *combinações* de eventos. Há duas categorias de combinações: *ambos* os eventos e *um ou outro* evento. É de máxima importância identificar qual dessas combinações se relaciona com o problema em questão. A chave é:

> "ambos" implica $P(A \hspace{0.25em} e \hspace{0.25em} B)$
>
> "um ou outro" implica $P(A \hspace{0.25em} ou \hspace{0.25em} B)$

Dois ou mais eventos dizem-se *independentes* se a ocorrência ou não-ocorrência de um não influencia a ocorrência do(s) outro(s).

## Cálculo da probabilidade de ocorrência de dois eventos $P(A \hspace{0.25em} e \hspace{0.25em} B)$
Se dois eventos são independentes, então a probabilidade da ocorrência de ambos é igual ao *produto* de suas probabilidades individuais, ou "marginais":

$$P(A \hspace{0.25em} e \hspace{0.25em} B) = P(A)P(B)$$

#### Exemplo 1:
Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas darem cara?

**Solução**: É razoável admitir que o resultado das duas moedas sejam independentes. Portanto, se $P(cara) = 1/2$, então:

$$P(cara \hspace{0.25em} e \hspace{0.25em} cara) = \frac{1}{2} \times \frac{1}{2} = \frac{1}{4}$$

Suponhamos que joguemos 3 moedas. Qual a probabilidade de 3 caras?

$$P(cara \hspace{0.25em} e \hspace{0.25em} cara \hspace{0.25em} e \hspace{0.25em}) = \frac{1}{2} \times \frac{1}{2} \times \frac{1}{2} = \frac{1}{8}$$

#### Exemplo 2
Um terço dos eleitores de certa comunidade é constituído de mulheres e 40% dos eleitores votaram na última eleição presidencial. Supondo que esses eventos sejam independentes, determine a probabilidade de escolher aleatoriamente um eleitor da lista geral, que seja mulher e que tenha votado na última eleição presidencial.

**Solução**: Probabilidade de 'mulher que votou na última eleição'

$$= \frac{1}{3} (0,40) = 0,133$$

#### Exemplo 3
Em 25% das vezes John chega em casa tarde para jantar. Por outro lado, o jantar atrasa 10% das vezes. Se não há qualquer relacionamento entre os atrasos de John e os atrasos do jantar, qual é a probabilidade de ocorrerem ambos os atrasos?

**Solução**:

$$P(ambos \hspace{0.25em} os \hspace{0.25em} atrasos) = P(John \hspace{0.25em} atrasado) P(jantar \hspace{0.25em} atrasado) = (0,25)(0,10) = 0,025 \hspace{0.25em} ou \hspace{0.25em} 2,5\%$$

Se dois eventos *não são independentes*, o cálculo de $P(A\hspace{0.25em}e\hspace{0.25em}B)$ deve levar em conta esse fato. Suponhamos duas urnas com fichas. A primeira contém 8 vermelhas e 2 brancas. A segunda contém 5 vermelhas e 5 brancas. Isto é:

|            | Vermelhas | Brancas | Total |
|------------|-----------|---------|-------|
| Urna Y     | 8         | 2       | 10    |
| Urna Z     | 5         | 5       | 10    |

Vamos extrair uma ficha de uma das urnas. Se escolhermos a primeira urna, a probabilidade da ficha ser vermelha é 8/10. Se escolhermos a segunda urna, a probabilidade de vermelha é 5/10. Logo, $P(vermelha)$ *depende* de qual seja a urna escolhida. Assim, a probabilidade *condicional* de escolha de ficha vermelha, admitindo-se escolhida a urna Y é 8/10. Formalmente

$$P(vermelha | urnaY) = \frac{8}{10}$$

A barra vertical "|" significa "supondo a urna Y" ou "dada a Urna Y". Disso, temos que 

$$P(vermelha | urnaZ) = \frac{5}{10}$$

$$P(branca | urnay) = \frac{2}{10}$$

$$P(branca | urnaZ) = \frac{5}{10}$$

Suponhamos agora que as duas urnas sejam indistiguíveis e que a probabilidade de escolher qualquer delas seja 1/2. $P(Y) = 1/2 = P(Z)$. Qual a probabilidade de extrair uma ficha vermelha da urna Z? Em nossos cálculos, devemos levar em consideração dois aspectos: a probabilidade de escolher a urna Z, para começar, e a probabilidade de extrair uma ficha vermelha *supondo-se* que a urna Z tenha sido escolhida:

$$P(Z) = 1/2 \quad P(vermelha|Z) = 5/10$$

\begin{align}
P(Z \hspace{0.25em} e \hspace{0.25em} ficha \hspace{0.25em} vermelha) &= P(Z)P(vermelha|Z) \\
  &= \left( \frac{1}{2} \right) \left( \frac{5}{10} \right) = \frac{5}{20} = \frac{1}{4}
\end{align}

Como regra geral, podemos dizer que a probabilidade conjunta de dois eventos dependentes é a probabilidade de um multiplicada pela probabilidade condicional do outro:

$$P(A \hspace{0.25em} e \hspace{0.25em} B) = P(A)P(B|A)$$

---

## Probabilidade de ocorrência de ao menos um de dois eventos $P(A \hspace{0.25em} ou \hspace{0.25em} B)$

Aplica-se a *regra da adição* para determinar a probabilidade de ocorrência de um evento outro ou de ambos os eventos no caso de haver os dois. O cálculo depende de os eventos serem ou não mutuamente excludentes.

Quando os eventos *são mutuamente excludentes*, a probabilidade de ocorrência de qualquer deles é a *soma* de suas probabilidades individuais. Para dois eventos A e  B, temos

$$P(A \hspace{0.25em} ou \hspace{0.25em} B) = P(A) + P(B)$$

Por exemplo, a probabilidade de aparecer cinco ou seis numa jogada de um dado equilibrado é 

$$P(cinco) + P(seis) = \frac{1}{6} + \frac{1}{6} = \frac{2}{6}$$

Analogamente, a probabilidade de extração de uma carta de copas ou uma carta de paus de um baralho de 52 cartas é:

$$P(copas) + P(paus) = \frac{13}{52} + \frac{13}{52} = \frac{26}{52} = \frac{1}{2}$$

Quando dois eventos *não são mutuamente excludentes*, é possível a ocorrência conjunta de ambos. Então, o cálculo da probabilidade de um ou outro deve levar em conta o fato de que *um*, ou *outro*, ou *ambos* podem ocorrer. Suponhamos a probabilidade de extração de uma carta de paus ou um 10 de um baralho de 52 cartas. Como é possível que uma carta seja simultaneamente de "copas" e um "10", os eventos não são mutuamente excludentes. A simples adição de suas probabilidades individuais aumentará a probabilidade verdadeira porque a carta dez de paus será contada duas vezes, uma vez como dez e uma vez como de paus. Assim é que devemos subtrair a probabilidade da interseção. Num baralho de 52 cartas, há 13 cartas de paus, 4 dez e 1 dez de paus. Então, $P(paus) = 13/52$, $P(dez) = 4/52$ e $P(dez \hspace{0.25em} de \hspace{0.25em} paus) = 1/52$. Logo:

\begin{align}
P(paus, \hspace{0.25em} ou \hspace{0.25em} dez, \hspace{0.25em}ou \hspace{0.25em} ambos) &= P(paus) + P(dez) - P(dez \hspace{0.25em} de \hspace{0.25em} paus) \\
    &= \frac{13}{52} + \frac{4}{52} - \frac{1}{52} \\
    &= \frac{16}{52}
\end{align}

Outra maneira de encarar o problema é verificar se incluímos a probabilidade de ocorrência de ambos os eventos de *duas* maneiras, a saber, como probabilidade de paus e também como a probabilidade de um dez. Devemos então subtrair a probabilidade *conjunta* da extração da carta dez de paus. A probabilidade conjunta é o produto das duas probabilidades *marginais* 13/52 e 4/52 ou $\frac{13}{52} \times \frac{4}{52}$. Tem-se, então, 

$$\frac{13}{52} + \frac{4}{52} - \left(\frac{13}{52}\right) \left(\frac{4}{52}\right) = \frac{16}{52}$$

---

# Resumo de regras de probabilidade

$P(A \hspace{0.25em} ou \hspace{0.25em} B)$ para eventos mutuamente excludentes:

$$P(A \hspace{0.25em} ou \hspace{0.25em} B) = P(A) + P(B)$$

para eventos não mutuamente excludentes:

$$P(A \hspace{0.25em} ou \hspace{0.25em} B \hspace{0.25em} ou \hspace{0.25em} ambos) = P(A) + P(B) - P(A \hspace{0.25em} e \hspace{0.25em} B)$$

$P(A \hspace{0.25em} e \hspace{0.25em} B)$ para eventos independentes:

$$P(A \hspace{0.25em} e \hspace{0.25em} B) = P(A)P(B)$$

para eventos dependentes:

$$P(A \hspace{0.25em} e \hspace{0.25em} B) = P(B)P(A|B) \quad ou \quad P(A)P(B|A)$$

---
# Exercícios
Stevenson (1981, p. 75-77), TODOS!

---
# Técnicas de Contagem

Para utilizar o método clássico, é preciso conhecer o número total de resultados possíveis de um experimento. Em geral, empregam-se técnicas de contagem para calcular esse número. Em resumo:

> Regra de multiplicação: o produto do número de escolhas para uma sequência de decisões.
>
> Arranjo: número de grupamentos em que interfere a ordem

$$A_{n, x} = \frac{n!}{(n-x)!}$$

> Permutações com repetição (ou distinguíveis): alguns itens são idênticos, e a ordem é importante.

$$P_{n}^{n1, n2, ..., nk} = \frac{n!}{(n_1!)(n_2!)...(n_k!)}$$

> Combinações: a ordem não importa.

$$C_{n, x} = {n \choose x} =  \frac{n!}{x!(n-x)!}$$

---
# Exercícios
Stevenson (1981, p. 84-85), TODOS!