___
# Aula 18: Distribuição da Média Amostral quando X~Normal

## Contexto Teórico
___

**Preparo Prévio:**
1. Magalhães e Lima (7ª. Edição): Seção 7.3 (págs 238 a 244).
2. Montgomery. Estatística Aplicada e Probabilidade para Engenheiros: Seção 7.2

**Hoje:**
1. Descrever as propriedades de combinação linear de normais independentes.
2. Calcular probabilidades a partir da distribuição da média amostral.
3. Tomar decisão sobre comportamento da média populacional a partir de uma estimativa da média.
___

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import numpy.random as rnd
from scipy.stats import norm
%matplotlib inline

___
## Distribuição da Média Amostral a partir de X com distribuição Normal

In [None]:
#População
data = norm.rvs(20,4, size=1000000)
mu=np.mean(data)
sigma=np.var(data)**0.5

In [None]:
x = np.arange(0,40,0.2)
y = norm.pdf(x, loc=mu, scale=sigma)
plt.plot(x,y)
plt.axvline(mu, color='r')

plt.hist(data, bins=20, density=True, histtype='stepfilled', alpha=0.2, color='r')
plt.xlabel('Valores populacionais')
plt.ylabel('Densidade')
plt.xlim(5,35)

print('X segue uma distribuição Normal')
print('Média de X ==> Valor de mu = ', "%6.3f"%np.mean(data))
print('Variância de X ==> Valor de sigma2 = :', "%6.3f"%np.var(data))
print ('-' * 20)

### **Construção da distribuição da Média Amostral alterando tamanho amostral n**

In [None]:
f, axarr = plt.subplots(2,3,figsize=(16,8))
i=0
j=0
for n in [2, 4, 10, 30, 50, 100]:
    if (n==30):
        i=1
        j=0
        
    sampling = np.random.choice(data,size=(100000,n))
    mean_of_sample = np.mean(sampling,1)
    mean_of_mean = np.mean(mean_of_sample)
    dp_of_mean = np.std(mean_of_sample,ddof=1)

    axarr[i,j].hist(mean_of_sample, bins=20, density=True, histtype='stepfilled', alpha=0.2)
    x = np.linspace(0,40,100)
    y = norm.pdf(x,loc=mean_of_mean,scale=dp_of_mean)
    axarr[i,j].plot(x,y,'r')
    axarr[i,j].set_title('Tamanho da amostra: n='+str(n))
    axarr[i,j].set_xlabel('médias amostrais')
    axarr[i,j].set_ylabel('Densidade')
    axarr[i,j].set_xlim(5,35)
    #ax.set_ylim(0,.30)

    j+=1
        
    print('Tamanho da amostra: n=',n)
    print('Média das médias amostrais:', "%6.3f"%mean_of_mean)
    print('Variância das médias amostrais:', "%6.3f"%dp_of_mean**2)
    print ('-' * 20)
    
plt.tight_layout(1)

In [None]:
#Distribuição de Xi para n=2
n=2

f, axarr = plt.subplots(4,figsize=(8,8))
sampling = np.random.choice(data,size=(100000,n))
X1=sampling[:,0]
X2=sampling[:,1]

mean_of_sample = np.mean(sampling,1)
mean_of_mean = np.mean(mean_of_sample)
dp_of_mean = np.std(mean_of_sample,ddof=1)

axarr[0].hist(data, bins=20, density=True, histtype='stepfilled', alpha=0.2, color='r')
x = np.linspace(0,40,100)
y = norm.pdf(x,loc=mu,scale=sigma)
axarr[0].plot(x,y,'r')
axarr[0].axvline(mu, color='r')
axarr[0].set_title('População')
axarr[0].set_xlabel('Valores populacionais')
axarr[0].set_ylabel('Densidade')
axarr[0].set_xlim(5,35)

axarr[1].hist(X1, bins=20, density=True, histtype='stepfilled', alpha=0.2, color='g')
x = np.linspace(0,40,100)
y = norm.pdf(x,loc=mu,scale=sigma)
axarr[1].plot(x,y,'r')
axarr[1].axvline(np.mean(X1), color='r')
axarr[1].set_title('Primeiro valor de cada amostra')
axarr[1].set_xlabel('Valores de X1')
axarr[1].set_ylabel('Densidade')
axarr[1].set_xlim(5,35)
  
axarr[2].hist(X1, bins=20, density=True, histtype='stepfilled', alpha=0.2, color='g')
x = np.linspace(0,40,100)
y = norm.pdf(x,loc=mu,scale=sigma)
axarr[2].plot(x,y,'r')
axarr[2].axvline(np.mean(X2), color='r')
axarr[2].set_title('Segundo valor de cada amostra')
axarr[2].set_xlabel('Valores de X2')
axarr[2].set_ylabel('Densidade')
axarr[2].set_xlim(5,35)

axarr[3].hist(mean_of_sample, bins=20, density=True, histtype='stepfilled', alpha=0.2)
x = np.linspace(0,40,100)
y = norm.pdf(x,loc=mean_of_mean,scale=dp_of_mean)
axarr[3].plot(x,y,'r')
axarr[3].axvline(np.mean(mean_of_sample), color='r')
axarr[3].set_title('Tamanho da amostra: n='+str(n))
axarr[3].set_xlabel('médias amostrais')
axarr[3].set_ylabel('Densidade')
axarr[3].set_xlim(5,35)

plt.tight_layout(1)

In [None]:
np.corrcoef(X1,X2)