# Testes de hipóteses

## Teoria

O objetivo de um teste de hipóteses, é auxiliar na tomada de decisões sobre uma população com base em uma amostra. E com base nos resultados, nós podemos verificar se os dados amostrais apoiam ou não uma hipótese estatística. Para tomar as decisões, fazemos suposições sobre as populações, isso porque normalmente os valores da população são valores desconhecidos. Essas suposições são chamadas de **Hipóteses Estatísticas**.

Para fazer os testes populacionais, devemos ter um par de hipóteses: a primeira que represente uma afirmação e a outra que complemente a primeira hipótese. E quando uma dessas afirmações for falsa, a outra deve ser verdadeira. Definimos estas hipóteses como: 
1. **Hipótese Nula ($H_{0}$):** hipótese que contém uma afirmação de igualdade, tal como $\leq$ e $\geq$ 
2. **Hipótese Alternativa ($H_{a}$ ou $H_{1}$):** uma hipótese complementar a hipótese nula. Deve ser verdadeira caso a hipótese nula for falsa e contém uma afirmação de desigualdade, tal como $<$, $\neq$ ou $>$

#### Tipos de teste:
* **Teste Bilateral ou Bicaudal:** é um teste em que a hipótese alternativa, utiliza simbolos de diferença. Ex:
<p>$\left\{\begin{matrix}
H_{0}: \mu = k\\ H_{a}: \mu \neq k
\end{matrix}\right.$</p>

* **Teste Unilateral ou Unicaudal:** é um teste em que a hipótese alternativa, utiliza simbolos de maior e de menor. Ex:

$\left\{\begin{matrix}
H_{0}: \mu = k\\ H_{a}: \mu > k
\end{matrix}\right.$,
$\left\{\begin{matrix}
H_{0}: \mu = k\\ H_{a}: \mu < k
\end{matrix}\right.$,
$\left\{\begin{matrix}
H_{0}: \mu \leq  k\\ H_{a}: \mu > k
\end{matrix}\right.$,
$\left\{\begin{matrix}
H_{0}: \mu \geq  k\\ H_{a}: \mu < k
\end{matrix}\right.$

A imagem abaixo ilustra um gráfico com os tipos de teste:

<img src="https://proeducacional.com/packages/uploads/2020/08/img_5f2c551f6a79d.png" width=650px></img>

* **Erro:** Ao trabalhar com inferências estatíticas, tentamos supor um valor com base em uma amostra. Porém ao se fazer isso, é gerado erros amostrais. Esses erros não poderão ser nulos, pois não é possível tomar decisões definitivamente corretas. Existem dois tipos de erros:
1. **Erro do tipo 1:** é a probabilidade de se rejeitar a hipótese nula quando a mesma é verdadeira. Também é conhecida como **nível de significância ($\alpha$)**. Quando não mencionado esse valor recebe $\alpha$ = 5%.
2. **Erro do tipo 2:** é a probabilidade de se rejeitar a hipótese alternativa quando a mesma é verdadeira.

## Prática:

### Aplicação:
Neste exemplo, estamos fazendo um teste de hipótese unicaudal sobre os dados do IBOV no período de 2021. Como a tolerância é menor o igual a 0.05, podemos aceitar o teste de hipótese sobre os dados

In [4]:
import pandas_datareader.data as web
from scipy.stats import normaltest
import matplotlib.pyplot as plt
from datetime import datetime as dt

sig = 0.05

dt_inicio = '2021-01-01'
hoje = f'{dt.today().year}-{dt.today().month}-{dt.today().day}'
dt_final = hoje

ibov = web.DataReader('^BVSP', data_source='yahoo', start=dt_inicio, end=dt_final)

stat_test, p_valor = normaltest(ibov['High'])
media = ibov['High'].mean()
print(f'P Valor: {p_valor}')
print(f'Média: {media}')

if p_valor <= media:
    print("Podemos aceitar H0")

P Valor: 0.006591926265131612
Média: 122180.29220779221
Podemos aceitar H0


## Conclusão:
Podemos utilizar o teste de hipóteses sobre um ativo, para saber se ele suporta uma distribuição normal. Fazemos isso com base em um valor de tolerância, no exemplo acima conseguimos aceitar o teste de hipótese nula, pois o valor de p era menor que a média aplicada sobre o gráfico