# Testes de Hip√≥tese

Testes de hip√≥tese s√£o procedimentos estat√≠sticos fundamentais usados para inferir se uma condi√ß√£o particular √© v√°lida para toda a popula√ß√£o a partir de uma amostra de dados suficientemente grande (ou significativa) 

# Import√¢ncia do Teste de Hip√≥tese

Testes de hip√≥tese s√£o importantes para valida√ß√µes estat√≠stica para nossas an√°lises. Alguns exemplos de uso desses testes s√£o:

- **Decis√µes Baseadas em Dados:** Testes de hip√≥tese ajudam a tomar decis√µes informadas e baseadas em evid√™ncias estat√≠sticas, em vez de intui√ß√£o ou suposi√ß√µes.
<br> Por exemplo, Uma loja online usa o teste de hip√≥tese testa para ver entre duas estrat√©gias de checkout (teste A/B) qual converte mais.

- **Valida√ß√£o Cient√≠fica:** S√£o essenciais na pesquisa cient√≠fica para validar ou refutar hip√≥teses experimentais.
<br> Por exemplo, um cientista usa o teste de hip√≥tese para testar se um novo medicamento √© eficaz comparando os resultados entre um grupo de pacientes que o recebe e outro que recebe um placebo.

- **An√°lise de Diferen√ßas:** Permitem avaliar se diferen√ßas observadas em amostras de dados s√£o significativas ou devidas ao acaso.
<br>Por exemplo, um pesquisador usa o teste de hip√≥tese para verificar se h√° diferen√ßas significativas no tempo gasto em uma tarefa entre diferentes faixas et√°rias.

# Interpretando o Resultado de um Teste de Hip√≥tese

Em Python, podemos usar bibliotecas como `scipy` para realizar testes de hip√≥tese. Por exemplo, para um teste t (compara√ß√£o das m√©dias de duas amostras), o processo seria:

In [1]:
from scipy import stats

# Dados de exemplo
amostra1 = [20, 22, 19, 20, 22, 21]
amostra2 = [22, 21, 22, 23, 24, 23]

# Realizando um teste t
t_stat, p_valor = stats.ttest_ind(amostra1, amostra2)

print("Estat√≠stica t:", t_stat)
print("p-valor:", p_valor)

Estat√≠stica t: -2.803059552906939
Valor p: 0.018696160788436764


# Passos para Interpreta√ß√£o do Teste

Testes Estat√≠sticos servem para determinar se uma hip√≥tese √© significativa ou n√£o. S√≥ podemos fazer uma √∫nica pergunta para o teste e essa pergunta √© mais ou menos parecida com qual √© a probabilidade da hip√≥tese nula (H0) ser verdadeira? 

O teste nos responde com uma probabilidade e, baseado num limite de confian√ßa definido, identificamos se essa probabilidade √© significativa a ponto de considerar a hip√≥tese nula (H0) verdadeira ou n√£o.

Todo teste de hip√≥tese possui esses elementos-chave e estas etapas abaixo para sua interpreta√ß√£o:

1. **Definir Hip√≥teses:**
- **Hip√≥tese Nula (H0):** A hip√≥tese de que n√£o h√° diferen√ßa ou efeito.
- **Hip√≥tese Alternativa (H1):** A hip√≥tese de que h√° uma diferen√ßa ou efeito.
2. **Calcular o p-valor:**<br> 
**p-valor:** Determina a probabilidade de obter os resultados observados se a H0 for verdadeira.

3. **Comparar com o N√≠vel de Signific√¢ncia:**<br>
**N√≠vel de Signific√¢ncia (Œ±):** O limiar usado para determinar a signific√¢ncia estat√≠stica, geralmente definido como 0.05<br><br>- Se o valor p < Œ±, rejeitamos a hip√≥tese nula (indicando que h√° evid√™ncias para suportar a hip√≥tese alternativa).<br><br>- Se o valor p ‚â• Œ±, n√£o rejeitamos a hip√≥tese nula (indicando que n√£o h√° evid√™ncias suficientes para suportar a hip√≥tese alternativa).


## Exemplo de Interpreta√ß√£o

Vamos relembrar o caso acima: queremos comparar se a m√©dia de duas amostras s√£o id√™nticas. Ou seja, ao inv√©s de dizermos que as 2 m√©dias s√£o pr√≥ximas baseados em suposi√ß√£o, agora temos uma ferramenta estat√≠stica que pode atestar isto com mais assertividade.

Neste caso estamos falando do teste de hip√≥tese teste t. A sua hip√≥tese nula (H0) atesta que 2 amostras possuem m√©dias id√™nticas (como saber isto? olhar na documenta√ß√£o ou pesquisar fontes confi√°veis üòú).

1. **Definir Hip√≥teses:**
 - **Hip√≥tese Nula (H0):** As 2 amostras possuem m√©dias id√™nticas.
 - **Hip√≥tese Alternativa (H1):** As 2 amostras n√£o possuem m√©dias id√™nticas.

2. **Calcular o Valor p:**<br> p-valor = 0.018696160788436764

3. **Comparar com o N√≠vel de Signific√¢ncia:**<br><br>
$\alpha$ = 0.05 (padr√£o)<br>p-valor $< \alpha \rightarrow$ Rejeita $H0$<br><br>No exemplo acima, o p-valor √© menor que o n√≠vel de signific√¢ncia  $\alpha$ (0.05), ou seja, √© **estatisticamente significativa** que as m√©dias das duas amostras N√ÉO sejam id√™nticas, ou seja, negamos H0. 

Caso o p-valor fosse maior que 0.05, n√£o poder√≠amos concluir que h√° uma diferen√ßa significativa, e aceitar√≠amos H0.


# Refer√™ncias

[Documenta√ß√£o Pandas](https://pandas.pydata.org/docs/)

[Documenta√ß√£o Scipy](https://scipy.org/)

<!-- Revisor, alguma sugest√£o de refer√™ncia sobre testes de hip√≥tese? Podemos citar livros aqui? Qual seria a melhor abordagem? --!> 