# **Probabilidade**

## **1. Objetivo**

O objetivo deste *script* é fazer uma motivação para a importância do estudo da **Probabilidade**. Em cursos mais básicos de estatística a gente aprende que a probabilidade é definida como a divisão de um evento *A* pelo número de elementos do espaço amostral ($\Omega$).

Essa definição, também conhecida como definição de Laplace, é interessante, mas apresenta algumas limitações, como nas seguintes situações:

i. Quando o conjunto formado por $\Omega$ não é finito;

ii. Quando $\Omega$ apesar de finito possui elementos não equiprováveis.

Neste caso, parte-se para a definição formal (frequentista) de probabilidade desenvolvida por Kolmogorov (1956). Nesta situação, é realizada uma definição axiomática da probabilidade com base em fundamentos matemáticos como a teoria dos conjuntos e cálculo diferencial e integral. 

O objetivo deste *script* não é detalhar tal definição, mas apresentar o conceito formal de probabilidade e mostrar um exemplo de aplicação utilizando a linguagem R. 

Para apresentar o conceito frequentista de probabilidade vou utilizar o exemplo do problema do aniversário.

### **Problema do Aniversário**

vamos imaginar que num local há até 365 pessoas. Qual a probabilidade de que ao menos duas pessoas façam aniversário no mesmo dia?

$A: ao \ menos \ duas \ pessoas \ fazem \ aniversário \ no \ mesmo \ dia;$

$A^c: nenhuma \ faz \ aniversário \ no \ mesmo \ dia.$

Nosso espaço amostral é definido da seguinte forma:

$\Omega = \left\{ (i_1, i_2,..., i_N): 1 \le i_j \le 365, \forall \ 1 \le i_j \le N\right\} $


$|\Omega| = 365^N$

A probabilidade de ninguém fazer aniversário no mesmo dia é dada da seguinte forma:

$\mathbb{P}(A^c) = \frac{365*364*...*(365-N+1)}{365^N}$

Dessa forma, o evento de pelo menos duas pessoas entre 365 terem o mesmo aniversário é o complementar de todos 365 serem diferentes:

$\mathbb{P}(A) = 1 - \mathbb{P}(A^c) = 1- \frac{365*364*...*(365-N+1)}{365^N}$

Agora vamos implementar esse problema na linguagem R.

In [1]:
# Código em R

# n: número de pessoas

aniversario <- function(n){print(p <- 1 - choose(365, 365 - n) * factorial(n)/365^n)}

In [5]:
# Vamos aplicar para um grupo de 23 pessoas:

round(aniversario(23), 3) * 100

[1] 0.5072972


Para um grupo de 23 pessoas, a probabilidade de que pelo menos um par faça aniversário no mesmo dia foi de 50,72%.

In [6]:
# Vamos testar para 30 pessoas

round(aniversario(30), 3) * 100

[1] 0.7063162


Para um grupo de 30 pessoas, essa probabilidade foi de 70,6%. 

## **Conclusão**

O objetivo deste *script* foi apresentar o conceito frequentista de probabilidade e mostrar a importância dele, que é a base do estudo da ciência estatística e, consequentemente, da ciência de dados. 

Obrigado 😀.