# P Values

1.  **Valor P**: Dado um modelo de acaso que representa a hipótese nula, o valor p é a probabilidade de obter resultados tão incomuns ou extraemos quanto os resultados observados.
2.  **Alfa:** Um limiar de probabilidade de “ser incomum” que os resultados do acaso podem ultrapassar, para resultados reais serem definidos como estatisticamente significantes.
3.  **Erro tipo 1:** Concluir erroneamente que um efeito é real (quando acontece pelo acaso)
4.  **Erro tipo 2:** Concluir erroneamente que um efeito ocorreu pelo acaso (quando é real)

- P-value baixo (geralmente ≤ 0,05): Se o P-value for baixo, isso sugere que os resultados observados são improváveis sob a hipótese nula. Isso leva à rejeição da hipótese nula, indicando que há uma diferença ou efeito estatisticamente significativo.
- P-value alto (> 0,05): Um P-value alto indica que os resultados observados são compatíveis com a hipótese nula, sugerindo que não há evidência suficiente para rejeitar a hipótese nula.

## Exemplo

Imagine que você quer testar se uma moeda é justa, ou seja, se a probabilidade de sair cara ou coroa é a mesma. A hipótese nula seria que a moeda é justa. Você lança a moeda 100 vezes e obtém 70 caras e 30 coroas.

Você realiza um teste estatístico e obtém um P-value de 0,01.
Um P-value de 0,01 indica que há apenas 1% de chance de obter um resultado tão extremo quanto 70 caras em 100 lançamentos, assumindo que a moeda seja justa.

Como o P-value é muito baixo, você pode rejeitar a hipótese nula e concluir que a moeda provavelmente não é justa.

In [1]:
import scipy.stats as stats
import numpy as np

# Dados da amostra
amostra = [2.5, 2.9, 2.1, 3.6, 2.7, 3.0, 2.4, 2.8]

# Média populacional conhecida
mu_populacional = 3.0

# Tamanho da amostra
n = len(amostra)

# Média da amostra
media_amostra = np.mean(amostra)

# Desvio padrão da amostra
desvio_padrao_amostra = np.std(amostra, ddof=1)

# Estatística t
t_stat = (media_amostra - mu_populacional) / (desvio_padrao_amostra / np.sqrt(n))

# p-value para o teste bicaudal
p_value = 2 * (1 - stats.t.cdf(abs(t_stat), df=n-1))

print(f"Estatística t: {t_stat:.4f}")
print(f"p-value: {p_value:.4f}")

# Nível de significância
alpha = 0.05

if p_value < alpha:
    print("Rejeitamos a hipótese nula (H0).")
else:
    print("Não rejeitamos a hipótese nula (H0).")


Estatística t: -1.5700
p-value: 0.1604
Não rejeitamos a hipótese nula (H0).


> A probabilidade de que, dado um modelo de acaso, podem ocorrer
> resultados tão extremos quanto os resultados observados