# Semana 4 do Aceleradev DS Codenation

### Professor: Túlio Vieira de Souza | Tema: Intervalos de Confiança, Testes de Hipóteses, P-Valores

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import scipy.stats as sct

### Intervalo de Confiança

$$\overline{x}-e_0\leq\mu\leq\overline{x}+e_0$$

Como sempre, nunca fazemos um Censo para ter acesso a **toda** população. Gasta muito e, com uma amostra bem feita (Representativa), podemos inferir algum parâmetro populacional. Entretanto, devemos ter a percepção que todo parâmetro estimado de uma estatística, não pode ser **pontual**, deve estar contido num intervalo, justamente porque analisamos uma amostra e queremos extrapolar seu valor para a população, mas uma população contém inumeras amostras diferentes. Exemplo:


Escolho uma amostra de $n$ indivíduos e encontro $\overline{x}_1$. Escolho outros indivíduos e, novamente, encontro a média $\overline{x}_2$. Essas médias provavelmente serão diferentes. Portanto, $\mu$ inferido por elas vai variar também. Outra vez: só se sabe o $\mu$ exato quando faz um censo.


Esse intervalo é chamado **Intervalo de Confiança**. Ele exprime onde os valores das médias poderão variar. Maaaas, mesmo tendo essa faixa de valores, ainda é possível que apareçam valores fora desse limite. Ou seja, existe uma *chance* da estatística estar contida no intervalo. E que probabilidade é essa?

### Nível de Confiança ou Grau de Confiança

$$1-\alpha$$ sendo $\alpha$ o **grau de significância**

Essa medida diz a probabilidade de $\mu$ estar contida num determinado intervalo. Geralmente, esse valor é de $1-\alpha=95\%$. Ou seja: $95\%$ das amostras terão a média **dentro** do intervalo de confiança. Exemplo:

Dada de uma população, eu seleciono algumas amostras de 20 indivíduos e calculo $\overline{x}$ de cada uma. Com $1-\alpha=0.95$, significa que: de 100 amostras com 20 indivíduos, 95 delas terão média dentro do intervalo de confiança, e outras 5 amostras terão média fora desse intervalo.

Perceba: quanto maior o $1-\alpha$, maior deve ser o intervalo de confiança, uma vez que a chance de conter $\mu$ será maior. Por outro lado, quanto menor for o nível de confiança, mais estreito será esse intervalo, justamente pois a chance de conter $\mu$ é menor.

**Relação Intervalo de Confiança - Grau de Confiança - Grau de Significância**

Como já sabemos quem é quem, qual é a probabilidade de um $\overline{x}$ estar dentro do intervalo de confiança?

$$P(\overline{x}-e_0 \leq \mu \leq \overline{x}+e_0)=1-\alpha$$

E a probabilidade de estar fora?

$$P(\mu \leq -e_0 \cap \mu \geq e_0)=\alpha$$

### Testes de Hipóteses

Dados em si não dizem nada, mas a interpretação deles sim. Também chamados de *Testes de Significância*, os testes de hipóteses dão rigor estatístico às nossas crenças. Com eles, calculamos certas *quantidades* sobre uma dada crença, e essa quantidade nos diz se o que acreditamos não se rejeita, ou se é mentira. Essas hipóteses são as crenças iniciais que estão na mente da pessoa antes de se estudar o caso, e testar tais hipóteses significa ver qual delas é melhor sustentada estatísticamente.

Para gerar um teste, a primeira coisa é definir as hipoteses:

- H0: Hipótese Nula -> suposição que o teste se mantém. Não se rejeita à certo grau de significancia

- H1: Hioótese Alternativa -> suposição que o teste não se mantém. Com isso, rejeita-se a hipótese nula à certo grau de significancia

***Aceitar* ou *Deixar de Rejeitar***

Quando falamos *Aceitar* a hipótese nula, entende-se que ela é verdade. Mas, lembre-se: um teste de hipóteses lida com *eventos probabilísicos*. Ou seja, **não sabemos o que é verdadeiro ou falso**. Sabemos o que é provável ou não. Portanto, *deixar de rejeitar* é mais correto, pois significa que não existem evidências estatísticas suficientes para rejeitar a hipótese nula. Por conseguinte, quando rejeitamos, é porque existem evidências estatísticas sufcientes para rejeitar a hipótese nula.

**Como interpretar o Teste de Hipóteses**

Para que se tenha como *deixar de rejeitar* ou *rejeitar* a H0, devemos fazer uma **comparação**, e ela pode ser feita de duas maneiras diferentes:

- usando *p-valor*

- usando valor crítico

E se compara tais medidas **DEPOIS** de se escolher o grau de confiança, pois através dele que obtemos o grau de significancia. Isso é feito porque muitas vezes os valores a serem comparados são muito próximos, e escolher o grau de confiança depois de obter o *p-valor*, ou *valor crítico*, pode denotar a conveniência de se gerar um resultado favorável propositalmente. E a escolha desse limite é baseada no que se está estudando.

***P-valor***

Esse valor é comparado com o $\alpha$, e as conclusões são as seguintes

Rejeita-se H0:

$$p_{valor} \leq \alpha$$

    Deixa-se de rejeitar a hipótese nula, com grau de significância de x%
    
    ou
    
    Deixa-se de rejeitar a hipótese nula, com grau de confiança de 1 - x%
    
Deixa-se de rejeitar H0:

$$p_{valor}>\alpha$$

    Rejeita-se a hipótese nula, com grau de significância de x%
    
    ou
    
    Rejeita-se a hipótese nula, com grau de confiança de 1 - x%
    
Não parece óbvio, mas o *p-valor* **não é uma probabilidade**, mesmo comparando com $\alpha$, que é uma probabilidade. O *p-valor* indica o nível de compatibilidade entre os dados e uma determinada hipótese. Como essa comparação leva a dois caminhos, rejeitar H0 não significa que ele é falso. Da mesma maneira, deixar de rejeitar não implica que H0 é verdade. Para nível de explicação, um *p-valor* baixo pode significar: H0 verdadeiro, a ocorrencia de um evento altamente improvável, ou que H0 é falso

***Valor Crítico***

Esse valor crítico é comparado ao valor crítico associado ao grau de significancia $\alpha$

Rejeita-se H0:

$$|Z_{crit}|\geq |Z(\alpha)|$$

    Rejeita-se a hipótese nula, com grau de significância de x%
    
    ou
    
    Rejeita-se a hipótese nula, com grau de confiança de 1 - x%

Deixa-se de rejeitar H0:

$$|Z_{crit}| < |Z(\alpha)|$$

    Deixa-se de rejeitar a hipótese nula, com grau de significância de x%
    
    ou
    
    Deixa-se de rejeitar a hipótese nula, com grau de confiança de 1 - x%

*obs.:*só usei Z para remeter à dados padronizados da tabela *escores-z*, mas poderia ser t da tabela de *t de Student*

Para valores críticos, fica um pouco mais claro que a comparação não representa uma probabilidade, e sim quão compatível o conjunto de dados é com a hipótese nula H0. Para tanto, as mesmas condições de interpretação do *p-valor* servem para *valores críticos*

***Erros da Estatística de Teste***

- Erro Tipo I (Falso Positivo): Rejeição incorreta de uma hipótese nula verdadeira

- Erro Tipo II (Falso Negativo): Deixar de Rejeitar incorretamente uma hipótese nula falsa

Para entender melhor:

    Se o grau de significancia for de 5%, pode ser que, em 20 hipóteses nulas, 1 seja rejeitada, ou deixada de se rejeitada, incorretamente, devido ao ruído do conjunto de dados.
    
    Falso Positivo: imagine um p-valor baixo (rejeita-se H0). Nesse caso, pode ser que H0 seja falso mesmo, que existiam evidencias estatísticas suficientes para a rejeição, ooooou H0 é verdadeiro e algum evento raro e incomum foi observado. Nessa situação, rejeitar H0 é um erro, pois acreditou erroneamente na rejeição
    
    Falso Negativo: imagine um p-valor alto (deixa-se de rejeitar H0). Nesse caso, pode ser que H0 seja verdadeiro, que não existiam evidências estatísticas suficientes para rejeição, oooouu H0 é falso e algum evento raro e incomum foi observado. Nessa situação, deixar de rejeitar é um erro, pois acreditou-se erroneamente em deixar de rejeitar.

todo teste de hipóteses está sujeito a um desses erros. Eles são prováveis de ocorrentem.