# Aula 24 - Teste de hip√≥teses para m√©dia populacional 

# Vari√¢ncia populacional desconhecida

___
**Preparo Pr√©vio:**
1. Magalh√£es e Lima (7¬™. Edi√ß√£o): Se√ß√£o 8.3
2. Montgomery. Estat√≠stica Aplicada e Probabilidade para Engenheiros: Se√ß√£o 9.3



**T√≠tulo completo dos livros:**
* MAGALH√ÉES, M. N.; DE LIMA, A. C. P. No√ß√µes de Probabilidade e Estat√≠stica (7a edi√ß√£o). Edusp, 2013.
* MONTGOMERY, D. Estat√≠stica Aplicada e Probabilidade para Engenheiros (6a edi√ß√£o). LTC, 2016.


**Hoje:**
1. Expandir o Teste de Hip√≥teses para m√©dia em situa√ß√µes com $\sigma^2$ desconhecida

**Nota:**
O `Jupyter Lab` ainda n√£o suporta *ipywidgets* , que s√£o usados na parte interativa da Simula√ß√£o 2. Recomenda-se usar este notebook no `Jupyter Notebook`

___

In [1]:
from __future__ import print_function
from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from scipy import stats

# Simula√ß√£o 1: Vari√¢ncia populacional *vs* Vari√¢ncias da amostra


O objetivo desta simula√ß√£o √© comparar os desvios padr√£o da amostra calculados por  $\hat{\sigma}$ e $s$ como estimadores do desvio padr√£o da popula√ß√£o.


1. Repita 10000 vezes:
    1. Gerar 10 n√∫meros aleat√≥rios com distribui√ß√£o $X\sim N(0,1)$
    1. Calcular o desvio padr√£o usando `std()` e adicionar na lista L1. 
       Aqui, esse comando calcula o desvio padr√£o pela express√£o: 
        $$\hat{\sigma}=\sqrt{\sum_{i=1}^{n}\frac{(x_i-\bar{x})^2}{n}}$$.
    1. Calcular o desvio padr√£o usando `std(ddof=1)` e adicionar na lista L2.
       Aqui, este segundo comando calcula o desvio padr√£o amostral pela express√£o: 
        $$s=\sqrt{\sum_{i=1}^{n}\frac{(x_i-\bar{x})^2}{n-1}}$$.
        
1. Calcule as m√©dias de L1 e L2. Compare-as. Lembre-se que L1 e L2 pretendem acertar o desvio padr√£o de $X$. Um dos estimadores √© melhor que o outro?

In [None]:
from scipy.stats import norm
import numpy as np

#X ~ Normal sendo E(X)=0 e Var(X)=1
L1 = []
L2 = []
for i in range(10000):
    X = norm.rvs(loc=0, scale=1, size=10) #Executa item A descrito acima
    L1.append(X.std())       #Executa item B
    L2.append(X.std(ddof=1)) #Executa item C
    
print("Desvio padr√£o ùúéÃÇ = ", np.mean(L1))
print("Desvio padr√£o ùë† = ", np.mean(L2))

___
# Simula√ß√£o 2: t-Student *vs* Normal Padr√£o

Avalie o formato da distribui√ß√£o t-Student conforme aumenta o grau de liberdade `graus_lib`.

Entenda em qual situa√ß√£o a t-Student se aproxima da Normal Padr√£o.

**Dica:** Lembre-se que o grau de liberdade √© calculado fazendo tamanho da amostra menos 1, ou seja, $(n-1)$.

In [3]:
#Se n√£o visualizar o pywidgets:
#conda install -c conda-forge ipywidgets

#Fun√ß√£o que utiliza o pywidget
@interact(graus_lib = (1, 100, 1))
def f(graus_lib = 1):
    
    #Prints
    fig = plt.figure(figsize=(15,6))
    
    ax1 = fig.add_subplot(121)
    ax2 = fig.add_subplot(122)
    
    #Fit e print da pdf
    x = np.arange(-5, 5, 0.01)
    ax1.plot(x, stats.norm.pdf(x, loc=0, scale=1), color='r')
    ax1.plot(x, stats.t.pdf(x, df=graus_lib, loc=0, scale=1), color='b')
    ax1.legend(['Normal', 't-Student'])
    
    #QQ-Plot
    stats.probplot(stats.t.ppf(np.arange(0.01, 1, 0.01), df=graus_lib), dist=stats.norm, sparams=(0, 1), plot=ax2)
    
    

interactive(children=(IntSlider(value=1, description='graus_lib', min=1), Output()), _dom_classes=('widget-int‚Ä¶

___
# Important√≠ssimo:

1. A padroniza√ß√£o $t=\frac{\bar{X}-\mu}{S/\sqrt{n}}$ apenas tem distribui√ß√£o *t-student* com $n-1$ graus de liberdade se a vari√°vel de interesse X segue uma distribui√ß√£o Normal exata.
    
    
2. Para estimar a vari√¢ncia populacional $\sigma^2$, utilizamos a vari√¢ncia amostral dada por $s^2=\frac{1}{n-1}\sum^n_{i=1}(x_i-\bar{x})^2$. Note que essa vari√¢ncia divide por $n-1$ e n√£o por $n$. √â o que foi discutido na Simula√ß√£o 1 deste ipynb.

   Para melhor compreens√£o desse novo estimador, **leia Magalh√£oes e Lima, 7a. edi√ß√£o - Cap√≠tulo 7 - Exemplo 7.10 descrito na p√°g. 231**.