<a href="https://colab.research.google.com/github/ctruciosm/BasicStats/blob/main/Introducao_Probabilidade.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Análise Combinatória e Distribuições de Probabilidade

A seguir, apresentamos os comandos utilizados no **R** para resolver problemas utilizando análise combinatoria e distribuições de probabilidade (discretas e contínuas).

# 1 Análise Combinatória

- **Permutação:**  $n!$

In [1]:
n = 10
factorial(10)

Lembre-se que $n! = n \times n-1 \times n-2 \times \cdots \times 2 \times 1$

In [2]:
10*9*8*7*6*5*4*3*2*1

- **Combinação:**  $\binom{n}{r} = C_{r}^n$

In [3]:
n = 10
r = 3
choose(10, 3)

- **Arranjo com repetição:**  $n^r$

In [4]:
n = 10
r = 3
n^3

- **Arranjo sem repetição:**  $n \times n-1 \times (n - r + 1) = \dfrac{n!}{(n-r)!}$

In [5]:
factorial(n)/factorial(n-r)

> Os casos do coeficiente multinomial e número de soluções inteiras pode ser obtido facilmente utilizando os comandos acima.

## 2. Distribuições discretas

- **Distribuição Binomial:**  Uma v.a. discreta $X$ tem distribuição de Binomial com parâmetros $n$, $p$ $(0 \leq p \leq 1)$, denotada por $binom(n,p)$, se $X$ pode assumir os valores $0, 1, \ldots, n$ e se sua função de probabilidade é dada por

$$p(x)=
\begin{cases}
\binom{n}{x} p^x q^{n-x}, & \text{se } x  = 0, 1,\ldots, n \\ 
0, & \text{caso contrario}
\end{cases}$$

In [6]:
n = 10
p = 0.3
x = 2

$P(X = x)$

In [7]:
dbinom(x, n, p)

$P(X \leq x)$

In [8]:
pbinom(x, n, p)

Lembre que se $n = 1$, a distribuição Binomial torna-se apenas uma Bernoulli.

>> No **R** tanto `dbinom()` quando `pbinom()` tem os argumentos na seguinte ordem:  `dbinom(x, size, prob)` / `pbinom(x, size, prob)` em que size é o tamanho da amostra ($n$) e prob é a probabilidade de sucesso ($p$).

- **Distribuição Poisson:**  A v.a. discreta $X$ (com valores inteiros não negativos) têm distribuição Poisson com parâmetro $\lambda > 0$, denotada $Pois(\lambda)$, se sua função de probabilidade é dada por

$$p(x)=
\begin{cases}
\dfrac{e^{-\lambda} \lambda^x}{x!}, & \text{se } x  = 0, 1,\ldots \\ 
0, & \text{caso contrario}
\end{cases}$$

In [9]:
lambda = 5
x = 6

$P(X = x)$

In [10]:
dpois(x, lambda)

$P(X \leq x)$

In [11]:
ppois(x, lambda)

>> No R tanto `dpois()` quando `ppois()` tem os argumentos na seguinte ordem: `dpois(x, lambda)` / `ppois(x, lambda)` em que lambda é o número médio de ___________.

- **Distribuição Hipergeometrica:** A v.a. discreta $X$ têm distribuição Hipergeométrica com parâmetros $N$, $n$ e $r$, se sua função de probabilidade é dada por

$$p(x)=
\begin{cases}
\dfrac{\binom{r}{x} \binom{N-r}{n-x}}{\binom{N}{n}}, & \text{se } x  = 0, 1,\ldots, r \\ 
0, & \text{caso contrario}
\end{cases},$$ em que $N$ é o numero total de elementos na população, $n$ é o tamanho da amostra e $r$ é número de _sucessos_ (ex: bolas vermelhas).

**Exemplo:**  Uma urna contém 5 bolas vermelhas e 10 bolas azuis. Se selecionarmos 7 bolas ao acaso e sem substituição. Qual é a probabilidade de obter no máximo 3 bolas vermelhas?

**Sol.**

**Primeiro passo: Informações**

- $r =5$  (caracteristica de interesse: bolas vermelhas).
- $N = 5+10 = 15$ (número total de bolas na urna).
- $n = 7$ (número de bolas selecionadas).
- $X:$ número de bolas vermelhas na amostra

**Segundo passo: Análise e Cálculo**

In [12]:
r = 5
N = 15
n = 7

$P(X \leq 3)$

In [13]:
phyper(3, m = r, n = N - r, k = n)

Se quisermos $P(X = 3)$

In [14]:
dhyper(3, m = r, n = N - r, k = n)

>> A parametrização da distribuição hipergeométrica no **R** segue a seguinte estrutura:  `dhyper(x, m, n, k)`/ `phyper(x, m, n, k)` em que $m$ é o número de "bolinhas" com a característica de interesse, $n$ é o número de "bolinhas" que não tem a caracteristica de interesse e $k$ é o tamanho da amostra.

## 3. Distribuições Contínuas

- **Distribuição Uniforme:**  Uma v.a. continua $X$ tem distribuição uniforme no intervalo $[a,b]$, denotada por $X \sim U_{[a,b]}$ se sua função densidade é dada por 
$$f(x) = 
\begin{cases}
\dfrac{1}{b-a}, & \text{se } a \leq x \leq b \\ 
0, & \text{caso contrário}, 
\end{cases}$$

In [15]:
a = 2
b = 5
x = 3.3

$P(X \leq x)$

In [16]:
punif(x, a, b)  # repare na ordem em que a e b foram inseridos na função.

Lembre-se que, no caso das distribuições contínuas $P(X = x) = 0 \quad \forall x$.

$f(x)$

In [17]:
dunif(x, a, b)  # O valor da função densidade (que não é a probabilidade P(X = x))

- **Distribuição Exponencial:**  Uma v.a. continua $X$ tem distribuição exponencial com parâmetro $\lambda$, denotada por $X \sim Exp(\lambda)$ se sua função densidade é dada por 
$$f(x)=
\begin{cases}
\lambda e^{-\lambda x}, & \text{se } x \geq 0 \\ 
0, & \text{caso contrário.} 
\end{cases}$$

Note que $\lambda = 1/\mu$.

In [18]:
lambda = 1/4
x = 2

$P(X = x)$

In [19]:
dexp(x, lambda)

$P(X \leq x)$

In [20]:
pexp(x, lambda)

- **Distribuição Normal:**  Uma v.a. continua $X$ tem distribuição Normal (Gaussiana), denotada por $N(\mu, \sigma)$, se sua função densidade é da forma $$ f(x) = \dfrac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(x-\mu)^2}{2 \sigma^2}}, \text{ com } x \in (-\infty, \infty)$$

Se $\mu = 0$ e $\sigma = 1$, a distribuição é dita de **Normal padrão**.

**Exemplo:** O tempo gasto em terminar a $P_1$ de MAD211 tem distribuição normal, com média 120 minutos e desvio padrão de 15 min. Qual é a probabilidade de um aluno terminar a prova em menos de 45 minutos?

**Sol.**

- $X:$ tempo gastos em terminar a $P_1$ de MAD211
- $X \sim N(120, 15)$

Padronizamos (ou seja, levamos para uma Normal padrão):

- Queremos $P(X < 45)$
- $P(X < 45) = P(\underbrace{\dfrac{X-120}{15}}_{Z} < \dfrac{45-120}{15}) = P(Z < -5)$

In [21]:
pnorm(-5)

No **R** é possível calcular  probabilidade sem padronizar:

In [22]:
pnorm(45, 120, 15)

**Nota:** na disciplina sempre faremos o processo de padronizar

## Resumo

Distribuições Discretas

| Distribuição | Parâmetros    | Função de Probabilidade     | R: $P(X=x)$ | R: $P(X <= x)$ |
|:-------:|:-------:|:-----------:|:-----------:|:-----------:|
| Binomial     | $n$, $p$      | $\binom{n}{x}p^x(1-p)^{n-x}$ | `dbinom(x, n, p)` | `pbinom(x, n, p)` |
| Poison  | $\lambda$ | $\dfrac{e^{-\lambda} \lambda^x}{x!}$ |  `dpois(x, ` $\lambda$ `)` |  `ppois(x, ` $\lambda$ `)` |
| Hipergeométrica | $N$, $n$, $r$ | $\dfrac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}}$ | `dhyper(x, r, N - r, n)` | `phyper(x, r, N - r, n)` | 

Distribuições Contínuas

| Distribuição | Parâmetros    | Função de densidade     | R: $f(x)$ | R: $P(X <= x)$ |
|:-------:|:-------:|:-----------:|:-----------:|:-----------:|
| Uniforme    | $a$, $b$      | $\dfrac{1}{b-a}$ | `dunif(x, a, b)` | `punif(x, a, b)` |
| Exponencial  | $\lambda$ | $\lambda e^{-\lambda x}$ |  `dexp(x, ` $\lambda$ `)` |  `pexp(x, ` $\lambda$ `)` |
| Normal Padrão | $\mu = 0$, $\sigma = 1$ | $\dfrac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}}$ | `dnorm(x)` | `pnorm(x)` | 