# Variáveis Aleatórias

Uma quantidade X, associada a cada possível resultado do espaço amostral é denominado de variável aleatória discreta se assume valores num conjunto enumerável, com certa probabilidade. Por outro lado será denominado variável aleatória contínua se seu conjunto de valores é qualquer intervalo dos números reais.

Exemplo:

**Lançamento de 2 moedas simultâneas**

Espaço amostral: $\Omega$={ (cara, cara), (cara, coroa), (coroa, coroa), (coroa, cara) }

A **variável aleatória** X é o número de caras

| Ponto Amostral | X |
|----------------|---|
| (cara, cara)   | 2 |
| (cara, coroa)  | 1 |
| (coroa, cara)  | 1 |
| (coroa, coroa) | 0 |

* Qual a probabilidade de não aparecer cara $(x_i = 0)$? 
    - A = [(coroa,coroa)]
    - $p_{A} = 1/4$

* Qual a probabilidade de aparecer uma cara $(x_i = 1)$?
    - B = [(cara, coroa),(coroa, cara)]?
    - $p_{B} = 1/2$

* Qual a probabilidade de aparecerem duas caras $(x_i = 2)$?
    - C = [(cara, cara)]? 
    - $p_{C} = 1/4$

Essa **tabela é a distribuição de probabilidade:**

| Número de caras  | $$P(X=x_i)$$  |
|------------------|--------------|
| 2                |  1/4         |
| 1                |  2/4=1/2     |
| 0                |  1/4         |
|                  | **soma = 1** |

Uma **distribuição de probabilidade** é uma função que descreve o comportamento aleatório de um fenômeno dependente do acaso.

A distribuição de probabilidade pode **modelar incertezas** e descrever fenômenos físicos, biológicos, econômicos, entre outros.

A Função Distribuição de Probabilidade Acumulada (Cumulative Distribution Function - CDF) é uma função que nos retorna a soma das probabilidades de todos os valores assumidos pela variável aleatória até um certo valor $x_i$. Ela é representada por $P(X \leq x_i)$.

### Esperança e Variância


Em Estatística, em teoria das probabilidades, o valor esperado, também chamado esperança matemática ou expectância, de uma variável aleatória é a soma do produto de cada probabilidade de saída da experiência pelo seu respectivo valor.


A média, valor esperado ou esperança de uma variável X é dada pela expressão:
\\[ E(X) = \sum_{i=1}^{k} x_{i} p_{i}\\]


Já a Variância é:
$$ Var(X) = \sum_{i=1}^{n}p_i(x_i-\mu)^{2}$$

Uma forma alternativa para calcular a variância, utilizando a Esperança, é:

\\[ Var(X) = E(X^2) - [E(X)]^2 \\]

# Principais Modelos Discretos


### Bernoulli

Uma **distribuição de Bernoulli** tem apenas dois resultados possíveis, a saber 1 *(sucesso)* e 0 *(falha)*, e uma única tentativa, por exemplo, um sorteio. Portanto, a variável aleatória X que tem uma distribuição de Bernoulli pode assumir o valor 1 com a probabilidade de sucesso, p, e o valor 0 com a probabilidade de falha, q ou 1-p. As probabilidades de sucesso e fracasso não precisam ser igualmente prováveis. 

\\[  P(X=k) = p^{k} * (1-p) ^{1-k}\\]

### Binomial

Uma distribuição em que apenas dois resultados são possíveis (Ex: sucesso ou fracasso, vitória ou derrota) e em que a probabilidade de sucesso e fracasso é a mesma para todas as tentativas é chamada de Distribuição Binomial. No entanto, os resultados não precisam ser igualmente prováveis e cada estudo é independente um do outro. Os parâmetros de uma distribuição binomial são **n** e **p** onde n é o número total de tentativas e p é a probabilidade de sucesso em cada tentativa. Além do k que é o número de **sucessos desejado**. Sua função de distribuição de probabilidade é dada por:



\\[f(k, n, p)  =  \binom{n}{k} \cdot p^k(1-p)^{n-k}\\]

onde,

\\[ \binom{n}{k} = \frac{n!}{k!(n-k)!} \\]

conhecido como **coeficiente binomial**.


- probabilidade de sucesso é p e a probabilidade de insucesso q = 1 - p

### Modelo de Poisson

Dizemos que um modelo tem distribuição de Poisson se 

\\[ P(X=k) = \frac{e^{-\lambda}\lambda^{k}}{k!} \\]
 
onde $\lambda$ é  número esperado de ocorrências que ocorrem num dado intervalo de tempo.

Esse modelo descreve experimentos onde a probabilidade de ocorrência de k eventos em um determinado **intervalo de tempo** é independente da ocorrência do último evento.

A distribuição de Poisson representa um modelo probabilístico adequado para o estudo de um grande número de fenômenos observáveis. Eis alguns exemplos:

* Chamadas telefônicas por unidade de tempo;
* Defeitos por unidade de área;
* Acidentes por unidade de tempo;
* Chegada de clientes a um supermercado por unidade de tempo;
* Número de glóbulos visíveis ao microscópio por unidade de área;
* Número de partículas emitidas por uma fonte de material radioativo por unidade de tempo.


### Uniforme

A distribuição uniforme discreta é uma distribuição de probabilidade simétrica em que um número finito de valores é igualmente provável de ser observado; cada um dos n valores tem a mesma probabilidade 1/n.

**Exemplo**

No lançamento de um dado, a variável aleatória X pode tomar os valores 1,2,3,4,5,6

Como cada um desdes valores está associada uma só probabilidade de realização e $\sum P(x_i)=1$, a função probabilidade resulta da distribuição de probabilidade:


| X | P(X) |
|---|------|
| 1 | 1/6  |
| 2 | 1/6  |
| 3 | 1/6  |
| 4 | 1/6  |
| 5 | 1/6  |
| 6 | 1/6  |

# Principais Modelos Contínuos

### Uniforme

Uma variável aleatória contínua X tem distribuição uniforme com parâmetros a e b (com a<b) se sua função de densidade de probabilidade é dada por:

\\[f(x) = \frac{1}{b-a} \\]

Se $a \leq x \leq b$, então $f(x) = \frac{1}{b-a}$. Caso $x$ não pertença ao intervalo entre a e b, então $f(x) = 0$.

Esperança (média): $$ E(X) = \frac{a+b}{2}$$

Variância: $$Var(X) = \frac{(b-a)^2}{12}$$

Função acumulada: $$ 
F(x) = P(X < x) = 
  \begin{cases}
      0, & x<a \\
      \frac{x-a}{b-a}, & a \le x \leq b \\
      1, & x > b
  \end{cases}
$$

### Distribuição Normal

É representada por uma **curva simétrica em torno do seu ponto médio**, apresentando assim seu famoso formato de **sino** (bell shape).

A curva de distribuição normal representa o comportamento de **diversos processos e fenômenos comuns**, como por exemplo: altura ou peso de uma população, a pressão sanguínea de um grupo de pessoas, o tempo que um grupo de estudantes gasta para realizar uma prova, etc.

A distribuição normal serve também como base para a inferência estatística clássica, sendo a premissa em diversos modelos e métodos.

Na distribuição normal, a média, mediana e moda dos dados possuem o mesmo valor. 

A equação da distribuição normal é:

<img src="https://www.onlinemathlearning.com/image-files/normal-distribution-formula.png" width=200>

Em resumo, a distribuição normal (distribuição teórica da variável aleatória contínua):
- formato em sino
- simétrica em torno da média, ou seja, a média, moda e mediana estão no mesmo ponto
- a curva normal ou curva de Gauss
- Área sob a curva é igual a 1
- assintótica nas abcissas, ou seja, aproxima do eixo mas não toca

## Z-Score

O **z-score** de uma observação nada mais é que **o número de desvios padrões que a obervação está com relação à média**:

$$ z = \frac{x - \mu}{\sigma} $$

$$ z \sigma = x - \mu $$

$$  x = \mu + z \sigma  $$

Como vimos acima, em uma distribuição normal, 99.73% das observações são esperadas de estar entre 3 desvios-padrão da média. Assim, obervações para além desta faixa são muito improváveis de ocorrer (0.27% de chance), de forma que podem ser consideradas outliers.

Assim, é comum considerar outliers os pontos tais que $|z| > 3$ (embora seja comum também variar este z-score limite, para 2.5 o, 3.5, etc.)

**OBS.: naturalmente, este método é altamente dependente da hipótese de que seus dados são normalmente distribuídos! Por isso, funciona apenas aproximadamente para outros casos. Mas é uma boa aproximação, em geral.**