<a href="https://colab.research.google.com/github/jvataidee/ManualdeAnalisedeDados_Python/blob/master/cap5_variavel_aleatori_dist_probabilidade.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**by: [João Ataíde](https://www.joaoataide.com)**
# **CAP 05: Variáveis Aleatórias e Distribuição de Probabilidade**

---



In [1]:
#importar bibliotecas
import pandas as pd
import numpy as np
import math
import matplotlib.pyplot as plt
import seaborn as sns
import statistics as st
import scipy.stats as stats
from scipy.stats import chi2_contingency, spearmanr

## **Variáveis Aleatórias**
As variáveis aleatórias caracteriza-se como a variável que apresenta um valor único para cada elemento, sendo esse determinado aleatoriamente e pom ser diferenciadas das seguintes formas:


* `Variáveis aleatórias discretas: ` são variáveis que aleatoriamente assumem valores enumeráveis, não podendo ser decimal ou inteiro. *EX: quantidade de filhos, funcionários de uma empresa, quantidade de computadores de uma sala de escritório...*

* `Variáveis aleatórias contínua: ` são variável que aleatoriamente assumem diversos valores num intervalo real. *Ex: renda familiar, faturamente de uma empresa, peso, altura ...*

### **Variáveis aleatórias discretas (VAD)**

Sendo $X$ uma VAD essa pode assumir valores $\{x_1,x_2,...,x_n\}$ e suas probabildiades $\{p(x_1),p(x_2),...,p(x_n)\}$, o que gera um função de probabildiade:

$P(x_i) = P(X = x_i) = p_i, \forall\ i=1,..,n $

então,
$p(x_i)\geq 0\ \ \forall\ x_i\ e \sum p(x_i) = 1 $




#### **Esperança VAD**
 valor esperado ou médio dentre os valores de X.

$E(X) = \sum x_i\cdot P(X = x_i)$

#### **Variáncia e Desvio-padrão VAD**

$Var(X) = \sum_{i=1}^n(x_i - E(X))^2\cdot p_i$

$\sigma(X) = \sqrt{Var(X)}$

In [2]:
vendas = [0., 1., 2., 3.]
px = [2/10, 4/10, 3/10, 1/10]

In [3]:
esp = []
for i,j in zip(vendas, px):
    esp.append(i * j)

esp = sum(esp)
esp

1.3

In [4]:
var = []
for i, j in zip(vendas, px):
    var_ = ((i - esp)**2)*j
    var.append(var_)

var = sum(var)
var

0.81

#### **Função de distribuição acumulada (FDA) de um VAD**
É a soma das probabilidades dos valor $x_i \leq x$

$F(x) = P(X \leq x) = \sum p(x_i)$

`Propiedades`<p>
$0 \leq F(x) \leq 1$<p>
$\lim_{x\rightarrow∞}F(x) = 1$<p>
$\lim_{x\rightarrow∞}F(x) = 0$<p>
$a<b → F(a) \leq F(b)$


In [7]:
acumulada = []
for i in range(len(px)):
    if  i <= 0:
        acumulada.append(px[i])
    else:
        acumulada.append(np.round(acumulada[i-1] + px[i],2))
acumulada

[0.2, 0.6, 0.9, 1.0]

In [6]:
def funcao(valor):
    for i in range(len(px)):
        if valor >= vendas[i]:
        #    print(i)
            p_valor = acumulada[i]
            pass
        elif valor < 0:
            p_valor = 0
            
    return p_valor

assert funcao(0.5)== 2/10
assert funcao(1)== 6/10
assert funcao(2.5)== 9/10
assert funcao(3)== 1
assert funcao(4)==1
assert funcao(-0.5)== 0

### **Variáveis aleatórias contínuas (VAC)**
Sendo $X$ uma variável contínua assosiada a uma função de densidade de probabilidade $f(x)$.<p>
$\int_{-∞}^{+∞}f(x)dx = 1, f(x)\geq 0$<p>
$\forall a e b tal que -∞ < a < b < +∞$<p>
$P(a\leq X\leq b) = \int_{-∞}^{+∞}f(x)dx $

#### **Esperança VAC**
Esperança matemática 

$E(X)= \int_{-∞}^{+∞}x\cdot f(x)dx$

#### **Variáncia e Desvio-padrão VAC**

$Var(X) = \int_{-∞}^{+∞}(x - E(x))^2\cdot f(x)dx$

#### **Função de distribuição acumulada (FDA) de um VAC**

$F(x) = P(X \leq x), -∞ < x < +∞$ <p>
`Propiedades`<p>

$0 \leq F(x) \leq 1$<p>
$\lim_{x\rightarrow∞}F(x) = 1$<p>
$\lim_{x\rightarrow∞}F(x) = 0$<p>
$a<b → F(a) \leq F(b)$


### **Distribuição de Probabiidade Para Variáveis Aleatórias Discretas**

$P(X =X_i) = p(x_i) = \frac{1}{n}, i = 1, 2, ... n$

In [10]:
X = [1., 2., 3., 4., 5., 6.]
fx = [1/6, 1/6, 1/6, 1/6, 1/6, 1/6]

#### **Esperança matemática**

$E(X) = \frac{1}{n}\sum_{i= 1}^nx_i$

In [12]:
ex = (sum(X))*(1/len(X))
ex

3.5

#### **Variância de X**

$Var(X)=\frac{1}{n}[\sum_{i=1}^nx_i^2-\frac{(\sum_{i= 1}^nx_i)^2}{n}]$

In [30]:
x2 = []
for i in X: x2.append(i**2)
x2

[1.0, 4.0, 9.0, 16.0, 25.0, 36.0]

In [25]:
var = (1/len(X))*(sum(x2)-((sum(X)**2)/len(X)))
var

2.9166666666666665

#### **Função de distribuição acumulada (FDA)**

$F(X)=P(X\leq x)=\sum_{x_i\leq x}\frac{1}{n}=\frac{n(x)}{n}$


### **Distribuição de Bernoulli**