# Estudo de estatística e probabilidade

## Probabilidade e variáveis aleatórias

* Escala numérica para representar a inceteza de certas afirmações
* Expermiento aletório
  * repedito de uma mesma maneira, porém irá resultar em diferentes resultado
* Espaço amostral (S)
  * conjunto de todos resultados possíveis de um experimento
* Evento (A)
  * um subconjunto do espaço amostral
  * **eventos disjuntos** não ocorrem simultaneamente, intersecção vazia

In [5]:
from random import choice

class ExperimentoDado:
  """Evento para simular o lançamento de um dado"""
  def __init__(self):
    self.S = [1, 2, 3, 4, 5, 6]
  def rodar(self):
    return choice(self.S)

# Eventos
#   quando face é par
#   quando face é impar
A = [2, 4, 6] 
B = [1, 3, 5]

experimento = ExperimentoDado()
experimento.rodar()

2

### Probabilidade clássica
  * P(A) = Número de casos favoráveis ao evento A / Número de casos possíveis
  * definição acima (clássica) se aplica quando os pontos do espaço amostral são equiprovaveis


In [8]:
def probabilidade_classica(evento, experimento):
  return len(evento)/len(experimento.S)

probabilidade_classica(A, experimento)
probabilidade_classica(B, experimento)

0.5


### Probabilidade e frequência relativa
  * P(A) = Número de vezes que A ocorreu / Número total de repetições do experimento

In [17]:
def frequencia_relativa(repeticoes_experimento, evento):
  nro_ocorrencias_evento = 0
  for repeticao in repeticoes_experimento:
    if repeticao in evento:
      nro_ocorrencias_evento += 1

  return nro_ocorrencias_evento/len(repeticoes_experimento)

repeticoes_experimento = [experimento.rodar() for x in range(100)]
frequencia_relativa(repeticoes_experimento, A)
repeticoes_experimento = [experimento.rodar() for x in range(1000000)]
frequencia_relativa(repeticoes_experimento, A)

0.500123


### Aximoas da probabilidade
  * Se A e B são eventos do espaço amostral S então
  * 0 =< P(A) =< 1
  * P(S) = 1
  * Se A e B são disjuntos então, P(A união B) = P(A) + P(B)


In [26]:
def interseccao(A, B):
  return [elemento for elemento in A if elemento in B]

def uniao(A, B):
  return list(set(A) | set(B))

pA = probabilidade_classica(A, experimento)
pB = probabilidade_classica(B, experimento)
pS = probabilidade_classica(experimento.S, experimento)
pAB = probabilidade_classica(A + B, experimento)

assert 0 <= pA <= 1
assert pS == 1
assert len(interseccao(A, B)) == 0
assert pAB == (pA + pB)


### Probabilidade condicional
  * P(A|B) = P(A intersecção B)/P(B)



In [28]:
def probabilidade_condicional(A, B, experimento):
  return probabilidade_classica(interseccao(A, B), experimento)/probabilidade_classica(B, experimento)

C = [5]

probabilidade_condicional(C, B, experimento)

0.3333333333333333

### ********Independência de eventos
  * P(A|B) = P(A)

In [33]:
a = [1, 2, 3]
b = [2, 3, 4, 5]

probabilidade_condicional(a, b, experimento)

0.5

### Teorema do produto
  * P(A intersecção B) = P(A) * P(B), com A e B sendo eventos independentes


In [37]:
paib = probabilidade_classica(interseccao(a, b), experimento)
pa = probabilidade_classica(a, experimento)
pb = probabilidade_classica(b, experimento)

assert paib == pa * pb

### Teorema da soma
  * Se A e B são disjutos, P(A união B) = P(A) + P(B)
  * Senão, P(A união B) = P(A) + P(B) - P(A intersecção B)


In [40]:
assert len(interseccao(A, B)) == 0
assert len(interseccao(a, b)) != 0

pAuB = probabilidade_classica(uniao(A, B), experimento)
paub = probabilidade_classica(uniao(a, b), experimento)

assert pAuB == (pA + pB)
paub == (pa + pb - paib)
# Não funciona por imprecisão do float
#   porem: 
#     5/6 = (1/2) + (2/3) - (1/3)
#     5/6 = (1/2) + (1/3)
#     5/6 = (3/6) + (2/6)
#     5/6 = (3 + 2)/6
#     5/6 = 5/6

False

### Outros teoremas
  * P(vazio) = 0
  * P(complemento A) = 1 - P(A)
  * Se A está contido em B, P(B) >= P(A)

In [47]:
def complemento(A, S):
  return [x for x in S if x not in A]

def contido(A, B):
  for elemento in A:
    if elemento not in B:
      return False
  return True

pcA = probabilidade_classica(complemento(A, experimento.S), experimento)
C = [2, 4]
pC = probabilidade_classica(C, experimento)

assert probabilidade_classica([], experimento) == 0
assert 1 - pA == pcA
assert contido(C, A)
assert pA >= pC


## *****Teorema de Bayes
  * Sejam A1, A2, ..., An eventos mutuamente exclusivos (não podem ocorrer ao mesmo tempo)
  * Sejam P(Ai) as probabilidades conhecidas de vários eventos e B um evento qualquer de S tal que P(B|Ai) é conhecido
  * P(Ai|B) = P(Ai)*P(B|Ai)/sum P(Aj)*P(B|Aj)
  * P(B) = sum(P(Ai|B))

In [61]:
def teorema_bayes(Ajs, B, i, experimento):
  sum = 0
  for Aj in Ajs:
    sum += probabilidade_classica(Aj, experimento)*probabilidade_condicional(B, Aj, experimento)
  return sum

ANs = [[1], [2,3], [5]]
teorema_bayes(ANs, B, 1, experimento)

0.5

### Variáveis aleatórias unidimensionais discretas e contínuas

* E um evento e S um espaço amostral associado
* Uma variável aleatória (v.a.) é uma função que associa cada elemento de S a um número real
* v.a's são geralmente reprentadas por letras maiusculas e podem ser classificadas entre discretas e contínuas

### Variável aleatória discreta

* Valores possíveis da v.a. são finitos ou infinito enumeraveis
* Recebe valores inteiros

In [None]:
dado = [1, 2, 3, 4, 5, 6]

### Distribuição de probabilidade

* Conjuntos de todos valores possíveis para uma v.a. discreta com suas respectivas probabilidades


In [None]:
dist_dado = [ (x, probabilidade([x], dado)) for x in dado]

### Função de probabilidade

* Para uma v.a. X com valores possíveis x1, x2, ..., xn a função de probabilidade é p(xi) = P(X = xi)


In [None]:
def funcao_probabilidade(va, valor):
  return probabilidade([x], dado)

### Função de distribuição acumulada

* F(X) = P(X <= x) = sum(p(j)), j <= x


In [None]:
def funcao_probabilidade_acumulada(va, valor_superior, valor_inferior):
  resultado = 0
  indice_inferior = va.index(valor_inferior)
  indice_superior = va.index(valor_superior)
  for i in range(indice_inferior, indice_superior + 1):
    resultado += funcao_probabilidade(va, va[i])
  return resultado


### Variável aleatória contínua

* Um v.a. que pode assumir qualquer valor númerico em um intervalo ou coleção de intervalos
* Pode assumir valores reais
* X é uma v.a. contínua se existir uma função densidade de probabilidae (fdp) que segue certas condições:
  * f(x) >= 0
  * integral(f(x)) = 1
  * P(a <= X <= b) = integral(f(x), b, a)

## Esperança matemática e variância de variáveis aleatórias unidimensionais

### Esperança matemática de uma v.a.

* Média ou valor esperado
* Soma de todos os produtos possíveis de uma v.a. pela respectiva probabilidade

In [None]:
def esperanca_va():

* E(X) = sum(x*p(x))

### Propriedades da média


### Referências

* [Guia Estatística](https://repositorio.ufu.br/bitstream/123456789/26903/1/GUIA_ESTAT%C3%8DSTICA_2017.pdf)