
___
#  Teorema do Limite Central - Interativo
___


**Atenção:** Precisa ser rodado no `Jupyter Notebook`. O `Jupyter Lab` ainda não suporta interação

___
### Distribuição amostral da média:

Assuma que $X$ seja uma variável aleatória com média $\mu$ e variância $\sigma^2$, ou seja, $E(X)=\mu$ e $Var(X)=\sigma^2$.

Dado $X_i$ uma variável aleatória *i.i.d.* (independente e identicamente distribuída) a $X$ com distribuição **normal**, tem-se que:

$$\bar{X}=\frac{X_1+X_2+...+X_n}{n}=\frac{\sum_{i=1}^n X_i}{n} \sim N\left(\mu,\frac{\sigma^2}{n}\right),$$

para qualquer $n$, essa distribuição é exata normal.



### Teorema do Limite Central:

Assuma que $X$ seja uma variável aleatória com média $\mu$ e variância $\sigma^2$, ou seja, $E(X)=\mu$ e $Var(X)=\sigma^2$.

Dado $X_i$ uma variável aleatória *i.i.d.* (independente e identicamente distribuída) a $X$ com distribuição **qualquer**, tem-se que:

$$\bar{X}=\frac{X_1+X_2+...+X_n}{n}=\frac{\sum_{i=1}^n X_i}{n} \sim N\left(\mu,\frac{\sigma^2}{n}\right),$$

quando $n$ for suficientemente grande.

*Obs:* Em alguns casos específicos, pode-se considerar $X_i$ com distribuições diferentes ou com certa dependência entre elas.

In [1]:
from scipy import stats

%matplotlib inline
%reset -f

from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from scipy import stats

In [2]:
func = {'norm': stats.norm, 'expon': stats.expon, 'uniform': stats.uniform, 't': stats.t, 
        'chi2': stats.chi2, 'f': stats.f, 'gamma': stats.gamma, 'beta': stats.beta}

#Se não visualizar o pywidgets:
#conda install -c conda-forge ipywidgets

print(f'\n\nINPUT DA SIMULAÇÃO:\n' 
      f'   Escolha a distribuição da variável de interesse X e um valor para o tamanho da amostra: \n')

#Função que utiliza o pywidget
@interact(n = (1, 50, 1), distribuição = sorted(list(func.keys())))
def f(distribuição = 'norm', n = 1):
    
    size = 10_000
    loc = 0
    scale = 1
    
    arg = {'loc': loc, 'scale': scale}
    

    #Cada distribuição tem seu conjunto de parâmetros específicos
    if distribuição == 'norm':
        xlimite = (40,100)
        arg['loc'] = 70.5
        arg['scale'] = 8
    elif distribuição == 'expon':
        xlimite = (0,6)
    elif distribuição == 't':
        arg['df'] = 5
        xlimite = (-4.5,4.5)
    elif distribuição == 'chi2':
        arg['df'] = 5
        xlimite = (0,25)
    elif distribuição == 'f':
        arg['dfn'] = 5
        arg['dfd'] = 7
        xlimite = (0,25)
    elif distribuição == 'gamma':
        arg['a'] = 1
        xlimite = (0,25)
    elif distribuição == 'beta':
        arg['a'] = 0.5
        arg['b'] = 0.5
        xlimite = (0,1)
    elif distribuição == 'uniform':
        xlimite = (10,20)
        arg['loc'] = 10
        arg['scale'] = 20-10
    
    # Valores populacionais
    mu_true = func[distribuição].mean(**arg)
    sigma2_true = func[distribuição].var(**arg)
    
    print(f'\n\nOUTPUT DA SIMULAÇÃO: \n'
          f'   Quando X ~ {distribuição} com tamanho da amostra igual a {n}, analise a distribuição da média amostral:')
    
    #Gerar n vetores de 1000 amostras cada
    arg['size'] = size
    Xb = func[distribuição].rvs(**arg)
    for i in range(n-1):
        Xb += func[distribuição].rvs(**arg)
        
    #Calcular a média
    Xb = Xb / n
    
    #Prints
    fig = plt.figure(figsize=(15,5))
    
    ax1 = fig.add_subplot(121)
    ax2 = fig.add_subplot(122)
    
    #Histograma
    pd.Series(Xb).hist(density=True, ax=ax1, bins=int(size / 50))
        
    #Fit e print da pdf
    (mu, sigma) = stats.norm.fit(Xb)
    x = np.arange(Xb.min(), Xb.max(), 0.01)
    ax1.plot(x, stats.norm.pdf(x, loc = mu, scale=sigma))
    ax1.set_title('Distribuição da Média Amostral')
    ax1.set_xlim(xlimite)
    
    #QQ-Plot
    stats.probplot(Xb, dist=stats.norm, sparams=(mu, sigma), plot=ax2)
    
    print0 = (f'CONCLUSÃO DA SIMULAÇÃO:')
    print1 = (f'   Quando a média populacional for E(X)={mu_true:0.3f}, '
              f'então a média das médias amostrais será E(Xbarra)={Xb.mean():0.3f} ')
    print2 = (f'   Quando a variância populacional for Var(X)={sigma2_true:0.3f}, '
              f'então a variância das médias amostrais será Var(Xbarra)={Xb.var():0.3f}')
    
    return print0, print1, print2
                 



INPUT DA SIMULAÇÃO:
   Escolha a distribuição da variável de interesse X e um valor para o tamanho da amostra: 



interactive(children=(Dropdown(description='distribuição', index=5, options=('beta', 'chi2', 'expon', 'f', 'ga…